Ich habe vor einiger Zeit damit die Erfahrung gemacht, dass mein Rechner beim KDE4-Start fast eingefroren ist, weil Nepomuk am Werkeln war (es gab einen oder mehrere "ultralangsame" Popup-Hinweise). Nepomuk hat mich in dieser Hinsicht stark an Beagle unter älteren OpenSuse-Distros (10.x-Serie) erinnert. Da man es problemlos abschalten kann, ist das nicht so schlimm. Wahrscheinlich erfüllt mein Rechner (2GHz, 1GB RAM) nicht die Systemmindestvoraussetzungen für Nepomuk.
Nach der ersten Inventarisierung Deiner Dateien wird Nepomuk deutlich schneller. Ich hab's aber trotzdem abgeschaltet: Erstens verbraucht es unnötige Ressourcen, zweitens muss ich meine Rechnernutzung nicht mehr als nötig protokollieren ... die nächste Hausdurchsuchung kommt bestimmt irgendwann ;-) drittens finde ich meine Dateien am einfachsten über ihre Dateinamen bzw. die Dateinamen der Ordner, in die ich sie gelegt habe. Nur bei E-Mails finde ich Indizierung praktisch (ich kann ja nicht den Betreff empfangener E-Mails festlegen), aber darum kümmert sich Thunderbird.
Von zettberlin am Fr, 10. Dezember 2010 um 19:34 #
> Ich habe vor einiger Zeit damit die Erfahrung gemacht, dass mein Rechner beim KDE4-Start fast eingefroren ist, weil Nepomuk am Werkeln war
War bei mir sehr ähnlich. Allerdings funktionierte das System weiter (3G RAM Dualcore Intel). Nur der Lüfter heulte durch und eine gewisse Zähigkeit war zu bemerken...
Also habe ich mir gesagt: OK, wenn es fertig ist, wird es besser.
Ich habe dem Ganzen 2 Tage (!!) Zeit gegeben. Ergebnis: das Heulen ging weiter, weil die Datenbank dauernd inkonsistent wurde und wieder von vorn aufgebaut wurde.
Beim Test der innovativen Suchfunktion fand das Ding bei der Suche nach "Watchtower":
Den Dylan-Text in einer Reintextdatei. Die Akkorde in einer Open-Office-Writer-Datei.
Nicht aber die MP3-Datei mit dem Dylan-Song und auch nicht die 2 Versionen von Hendrix in OGG-Dateien.
locate findet natürlich alle 4.
Kurz: vielleicht probiere ich das Ding nächstens mal wieder aus, bis dahin ist es nicht viel mehr als ein interessantes Konzept/Experiment.
"Nur der Lüfter heulte durch und eine gewisse Zähigkeit war zu bemerken..."
Erschreckend das zu hören, und das bei bei einem recht aktuellen System.
Ich kann den KDE4-Entwicklern nur die oben schon angedeuteten Erfahrungen von OpenSuse mit der Desktopsuchmaschine Beagle ans Herz legen: https://features.opensuse.org/305296
Auch Nepomuk sollte standardmäßig deaktiviert sein (falls das in den mir unbekannten originalen KDE4-Sourcen so sein sollte, dann beträfe meine Kritik natürlich die betreffenden Distros).
Das Problem ist IMHO etwas weitreichender. Siehe http://forum.kde.org/viewtopic.php?f=20&t=83054&start=10 How to NOT install Akonadi and Nepomuk?
Slackwares KDE4 läuft deshalb hier wie eine Eins. OpenSuse habe ich wegen seiner Zwangs-Akonadi- (und auch ein wenig für seine Nepomuk/Virtuoso-) Integration gelöscht. KDE4 braucht beides nicht und funkioniert auch so. Ich bin ohnehin mit Firefox und Thunderbird im Internet unterwegs.
Die Kritik richtet sich eher gegen Strigi (nicht effizient genug) und die Distribution (schlechte default-Konfiguration). Wenn ich Gigabytes an meinetwegen PDF Dokumenten zu indexieren habe, ist klar, dass das eine enorme Menge an Arbeit ist. Auf langsamen Maschinen, die parallel benutzt werden sollen, wenn sie an sind, wird das vermutlich Wochen dauern. Auch sollte das nur nach expliziter Aufforderung Akku-Energie verbraten.
Da fehlt einfach noch das Verständnis der sehr unterschiedlichen Anwendungsbereiche. Wenn das auf einer schnellen Entwicklermaschine ohne große Archive keine Probleme verursacht heißt das noch nichts.
Sehe ich auch so. Wenn ich allerdings eine große Privatbildersammlung hätte und diese wären anständig getagt, dann würde ich vielleicht auch auf die Dienste von Nepomuk zurück greifen.
Von Nepomuk Nutzer am Mo, 13. Dezember 2010 um 16:03 #
Also ich nutze Nepomuk regelmäßig für meine Filme (TV Aufnahmen). Die Filme tage ich dann als Sci-Fi, Action, Horror, Serie, FSK X, Länge ... und kann sie bewerten. Jetzt kann ich Nepomuk benutzen um mir alle Action Filme anzeigen zu lassen die mindestens 4 Sterne haben, kann noch die Länge berücksichtigen. Ob ein Film werbung hat ... Vorallem findet Nepomuk so auch Action Filme die ich auch noch als Sci-Fi, Horror... getagt habe. Jetzt versuch das mal mit Ordnern zu machen
Von man-draker am Fr, 10. Dezember 2010 um 19:28 #
Ich bin relativ sicher, dass ich sogar einen Artikel darüber gelesen habe. Aus der Tatsache, dass ich dessen Inhalt wieder vergessen habe schließe ich, dass es dem Teil an echtem Nutzen - zumindest für mich - mangelt.
Von Nomen Nescio am Fr, 10. Dezember 2010 um 21:09 #
Was soll ein »sozial-semantischen Desktop« sein? Datei-indizierung ist klar, (nach Dateinamen suchen kann ich mit locate, find, etc.. auch), aber was soll der Zusatznutzen sein, wenn man die Indizierung ausschaltet?
Am besten versteht man den Nutzen (bzw. die Möglichkeiten, die das alles noch mit sich bringen wird!) dann, wenn man sich mal mit Ontologien auseinandergesetzt hat. Leider ist das ein Thema, welches ziemlich komplex ist und nicht leicht zu durchschauen.
Stark vereinfacht ausgedrückt kann man die Bedeutung von "Dingen" einem Rechner verständlich machen. Verständlich insofern, als dass er eben weiß, was eine Emailadresse ist und wozu sie gut ist, was man damit machen kann, wem sie gehört usw. Auf einem ontologiebasierten Informationsraum kann man ziemlich geniale Suchen ausführen, die mit konventionellen Mitteln so nicht möglich sind.
Ein weiteres spannendes Gebiet ist das Schlussfolgern. Hierbei kann ein Rechner aus bestehenden Verknüpfungen basierend auf Eigenschaften der Klassen von Objekten neues, bisher nur implizites Wissen, verfügbar machen. Ein konkretes Beispiel auf dem Desktop fällt mir allerdings spontan nicht ein.
Praktisch benutzt jeder ständig semantische Hilfen, man ist nur gewohnt, dass diese von Internetservices geliefert werden. Das hat Vorteile und Nachteile. Wenn man so will ist Nepomuk der Gegenentwurf zu Chrome OS.
Von zettberlin am Fr, 10. Dezember 2010 um 23:50 #
> Was soll ein »sozial-semantischen Desktop« sein?
Theoretisch ein Desktop, mit dem man wie mit einem Menschen reden kann:
"Suche alle Dateien, die Musikstücke enthalten, deren Urheberrecht in Deutschland ausgelaufen ist."
(EDIT: Ontologien wären dann zum Beispiel:"Ein Musikstück ist eine Komposition.", "Komponisten schreiben Kompositionen.", "Komponisten sind Menschen.", "Menschen haben einen Geburtstag.", Menschen sind sterblich." etc etc)
Ein semantischen System könnte den Satz analysieren und verstehen. Es würde dann:
1.) auf der Festplatte nach typischen Musikdateien (MP3, OGG, Lilypond etc) suchen.
2.) im Internet nach den Stücken suchen, um die Namen der Komponisten zu bekommen.
3.) die Namen der Komponisten verwenden, um deren Todestag herauszufinden.
4.) eine kleine Berechnung mit Timestamp ausführen, um die auszusortieren, die länger als 70 Jahre kaputt sind.
5.) die Namen der erfolgreichen Kandidaten mit den Stücken auf der Festplatte korrellieren. 5. a) wo wir schon mal dabei sind auch nach anderen Dateien auf der Fressplatte suchen, die Referenzen auf die teuren Dahingegangenen enthalten.
Und zum Schluss eine Liste der Dateien, geordnet nach Komponist ausgeben. ....
Und gleich fragen, ob man auch die nach amerikanischem Recht Verfallenenen haben will.....
Ach so: und eine Liste Links auf die Komponisten bei Wikipedia und auf Noten und andere Aufnahmen der Stücke bei archive.org etc...
Das würde schon Spass machen oder?
In der Praxis heute allerdings siehe oben....
Dieser Beitrag wurde 1 mal editiert. Zuletzt am 10. Dez 2010 um 23:58.
ich finde das programm wirklch nicht übel. außerdem ist es kein (wie häufig behauptet) ressourcenfresser. es wird nur einmal alles komplett inventarisiert und danach nur noch änderungen. außerdem kann man bestimmte ordner abstellen.
Das kommt ganz auf den Rechner an. Nepomuk 4.5x auf meinem AMD Phenom 9650 frisst bei der Indizierung 40-80% CPU, aber die Systemlast liegt bei 2,00-2,20. Zudem ist bei der Erstindizierung Strigi abgekackt. Nepomuk alleine hat dann noch ~50% Prozessorlast und eine Systemlast von ~1,20 erzeugt.
Nach dem Beenden von Nepomuk/Strigi via SystemSettins sank zwar die Prozessorlast auf 9%, aber die Systemlast lag immer noch bei ~1,20. Nach ca. 2 Minuten war wieder alles im Normalbereich (~0,20-0,30).
Was ergibt das bei Leuten, die keinen 4-Kern-Prozessor und ein generell älteres System haben? 100% und 2,90 (mein Rekord ohne Forkbombe liegt übrigens bei 3,20)?
Ich habe mal zum Vergleich mlocates updatedb (ebenfalls Erstindizierung) herangezogen: Prozessor: 12-17%, System: ~1,00-1,10. Zudem ist mlocate natürlich schneller, weil es bloß Dateipfade speichert. Wer also keine Zusatzinfos durchsucht, ist mit mlocate + cron wesentlich besser aufgehoben.
Ich hatte an anderer Stelle schon mal etwas zum Nutzen geschrieben:
Bei mir funktioniert Nepomuk ganz ohne Probleme. Ausnahmslos alle Dateien mit einem oder mehreren Tags zu versehen, will ich nicht mehr missen. Im Suchfeld von Dolphin dann nur noch das Stichwort (oder mehrere in Kombination) eingeben und alle Dateien dazu werden aufgelistet. Das Suchergebnis kann dann als Verknüpfung unter Orte in Dolphin angelegt werden. Also letztlich ein virtueller Ordner. Da die Tags von z.B. digiKam, Amarok und natürlich Dolphin systemweit zur Verfügung stehen, werden auch alle entsprechenden Dateien angezeigt. Mal ein simples Beispiel:
Bei Bildern ist es schon üblich sie mit Tags zu versehen. Also z.B. "Urlaub", "Paris", "Familie", "Öffentlich", "Klaus", "Personen", "Natur", "Gebäude" usw. Werden alle Dateien entsprechend mit Tags versehen, können auch unterschiedliche Suchergebnisse erzielt werden. Natürlich kann man dies ja mit z.B. digiKam allein (mache ich ja auch), aber die Tags stehen halt unter Dolphin ebenfalls zur Verfügung. Ich muss also nicht extra digiKam starten, nur weil ich mal ganz schnell ein Bild suche.
Anderes Beispiel zur Dokumentenverwaltung. Angenommen, ich erhalten regelmäßig Dateien von unterschiedlichen Partnern per Mail, da man an einem gemeinsamen Projekt arbeitet. Nun speichere ich die Dateien natürlich in einem Ordner ab. Mich interessiert später aber eher, von wem die Datei stammt und dies geht nicht aus dem Dateinamen hervor. Mit entsprechenden Tags kann ich durch eine einfache Suche alle Dateien ermitteln, welche von "Firma X", "Mitarbeiter Y" im Zeitraum "von - bis" übermittelt worden sind, ohne z.B. umständlich mein Mailfach zu durchforsten.
Die Suchfunktionen gestatten natürlich auch weiterhin Angaben zur Größe der Datei oder die allseits bekannte Bewertung (im Bezug auf das 2. Beispiel werden halt die Dokumente mit den besten Vorschlägen im Projekt mit 5 Sternen versehen; zusätzlich zu den Stichworten).
Insgesamt ist dies eine andere Art der Arbeitsgestaltung. Sie kann jedoch äußerst effektiv sein.
Allerdings sind die jeweiligen Suchmöglichkeiten oft schon in die Programme integriert. So erledigt Thunderbird den "Indizierungsjob" von Nepomuk und das Beispiel Digikam hast Du ja schon selbst genannt. In Amarok vermisse ich Nepomuk ebenfalls nicht, hier ist fast alles schon übersichtlich eingeordnet.
Von daher beschreibst Du nichts wirklich Neues, außer dass eine zentrale Indizierung für Suchzwecke durch Nepomuk vorgenommen wird, die Du als Vorteil empfindest. Für mich ist allerdings der zusätzliche Ressourcenverbrauch der entscheidende Nachteil.
Im schlimmsten Fall suche ich eine Datei, deren Name ich noch kenne oder zumindest den Dateityp. Dafür reicht mir dann - außerhalb spezialisierter Anwendungen - z.B. eine einfache, systemweite Konquerorsuche.
Was mich in diesem Zusammenhang aber interessiert: Ist es möglich, die Nepomukdaten des einen Rechners auch mit Nepomuk auf dem anderen zu lesen und zu transferieren? Große Musik- und Bildersammlungen auf zwei Heimrechnern könnten ja durchaus fast identisch sein. Hier wäre es interessant, ob Nepomuk dann eine Dateisynchronisierung zwischen beiden Rechnern durchführen bzw. "veranlassen" kann, um die Musik- und Bildersammlungen der beiden Rechner durch Dateientransfers inklusive notwendiger Umbenennungen auf den gleichen aktuellen Stand zu bringen.
Natürlich macht Nepomuk im Detail nicht wirklich Neues. Aber es verbindet alles unter einem Dach. Und das hat durchaus Vorteile. Ich muss eben nicht 5 verschiedene Programme (für jeden Dokumententyp) bemühen, um alle Dokumente zu suchen. Nimm hier wirklich mein zweites Beispiel. Ich denke, es zeigt ganz anschaulich, wie sinnvoll es sein kann. Ich denke, Nepomuk verlangt auch eine neue Art des Umgangs mit Daten, den wir oft nicht gewohnt sind. Wer regelmäßig seine Dokumente mit sinnvollen Tags versieht, der profitiert erheblich von Nepomuk. Ich möchte es nicht mehr missen und finde, es ist eine geniale Idee gewesen.
Der Ressourcenverbrauch hält sich in Grenzen. Wenn der Index einmal erstellt ist, läuft Nepomuk im "Standby-Modus". Es beeinflusst weder die Leistung noch wesentlich den Energie-Verbrauch. Gerade bei der erstmaligen Erstellung des Index, empfiehlt es sich, den von Nepomuk zu nutzenden Speicher heraufzusetzen. Der Index wird dann wesentlich schneller erstellt (ursprünglich waren bei mir 50MB eingestellt, ich hatte den Wert auf 200MB heraufgesetzt). Wichtig ist ebenfalls, sich nicht das ganze System indizieren zu lassen. Mal abgesehen davon, dass es ewig dauert, ist die Index-Datei dann auch wirklich sehr groß. Der Sinn von Nepomuk besteht eher darin, User-Daten zu indizieren und besser nutzbar zu machen.
Die Datenbank einfach auf einen anderen Rechner kopieren, halte ich nicht für sinnvoll. Es sei denn, die Datenbank hat nur ein externes Laufwerk indiziert, welches von beiden Rechnern angesprochen werden kann. Nepomuk ist ein Indexer und keine zentrale Daten-Sammel-Stelle. Insofern führt Nepomuk keine Synchronisation durch.
Von .......... am Sa, 11. Dezember 2010 um 17:39 #
Der Hauptkritikpunkt bleibt bei vielen Nutzern auch der hohe Ressourcenverbrauch.
Nepomuk erinnert hinsichtlich der System- bzw. der CPU-Belastung eher an Beagle oder einen Virenscanner.
Dieses Posting samt Konsequenzen für Nepomuk steht stellvertretend für dieses Nepomuk-Hauptproblem (laut Signatur auf einem Quadcore-Rechner!): http://debianforum.de/forum/viewtopic.php?f=27&t=123620&hilit=nepomuk&sid=cd4c678f9f08d7c050cf05218872ae02
Betroffene Nutzer werden Nepomuk niemals wieder einschalten, da Nepomuk nun seinen Ruf als Ressourcenfresser weg hat.
Kein Vorteil (den man so gar nicht kennenlernen konnte) kann den Fast-Stillstand des gesamten Systems aufwiegen.
Unter normalen Umständen verbraucht Nepomuk kaum Ressourcen. Und es ist wohl ziemlich sicher, dass eine CPU-Auslastung von 100% nicht zu den normalen Umständen zählt und eher auf einen Bug hinweist. Da es sich bei Nepomuk um eine komplexe Software handelt, kann man wohl nicht erwarten, dass sie fehlerfrei ist (das mag wünschenswert sein, aber realistisch ist das nicht). Insofern wird es immer User geben, die leider negative Erfahrungen machen. Das trifft aber so ziemlich auf jede Software zu.
Wenn User nach Auftreten eines Fehlers in einer Software diese "niemals wieder" benutzen, dann werden sie ja bald komplett ohne PC auskommen müssen, oder?
Nicht unbedingt. Eine Such- und Indizierungssoftware ist letztlich verzichtbar.
Nepomuk kennt doch bestimmt auch so etwas wie Systemmindestvoraussetzungen. So sollte diese Software z.B. auf einem 1GHz-PC mit 512MB RAM und vielen Daten besser nur dann starten, wenn das System gerade nicht benutzt wird oder eben gar nicht starten. KDE4 läuft auf so einem Rechner schließlich "gerade noch so".
>Eine Such- und Indizierungssoftware ist letztlich verzichtbar. Sehe ich nicht so. Die klassischen Suchfunktionen sind meist nicht sehr effektiv und auch langsam. Eine Suche über indizierte Dateien ist wesentlich flexibler. Sie kann Inhalte berücksichtigen. Sind die Dateien noch mit Tags versehen, können auch komplexe Suchenvorgänge durchgeführt werden. Das ganze schnell und effektiv. Zwei Beispiele hatte ich oben beschrieben.
>besser nur dann starten, wenn das System gerade nicht benutzt wird Genau das macht Nepomuk.
Nur du selbst verlangst von dir, alle Dateien taggen zu müssen. Keiner sonst. Es reicht, wenn du die Dateien, die du gerade brauchst und mit Tags schneller gefunden hättest, mit Tags versiehst und dann mit Nepomuk arbeitest.
Ich bin Wissenschaftler und forsche im Semantic-Web-Bereich. Von daher glaube ich an die Idee hinter dem Semantic Desktop. Allerdings: beim Finden von Dateien brauche ich meistens keine Hilfe, weil ich meine Verzeichnisse gut organisiert habe. Von daher habe ich auch nie andere, nicht-semantische Desktop-Suchmaschinen wirklich genutzt. E-Mails finde ich, indem ich alles nach Google Mail umleite und dort die Suchfunktion nutze. Aber in Zukunft wird es mit der Nepomuk-Technologie auch möglich sein, komplexere Fragen zu beantworten, wie z.B. "Falls ich die Datei XY ursprünglich von jemandem per E-Mail-Anhang bekommen habe, wer hat diese Mail noch bekommen und mit einer Mail mit aktualisiertem Datei-Anhang darauf geantwortet?"
Von zettberlin am Sa, 11. Dezember 2010 um 16:10 #
Das System sollte dann auch in der Lage sein, tatsächlich als menschenlesbarer Satz formulierte Fragen zu verstehen. Das geht deutlich weiter als ein simples Suchen nach abstrakten Zeichenketten.
Bis dahin wird es wohl noch ein Weilchen dauern...
UND: es werden wohl auch nur Leute ewtas von diesem System haben, die in der Lage sind, präzise Fragen zu formulieren. Gerade das Mitdenken des Nutzers ist heutzutage aber eher verpönt. Allgemein herrscht eine andere Tendenz vor. Alles soll von selbst funktionieren und auch die irrealsten, gedankenlosesten Konsumentenwünsche gelten als sinnvolle Ziele für Desktopsysteme.
In einem kulturellen Umfeld, in dem das Anzeigen von Systemmeldungen während des Rechnerstarts als "schlechte Usability" gilt, werden sich intelligente Suchmaschinen nicht entwickeln.
>> Das System sollte dann auch in der Lage sein, tatsächlich als menschenlesbarer Satz formulierte Fragen zu verstehen.
Wenn die dann das gleiche als deutsch getarnte irgendwas (bspw. 'nen Auto / Geschwindigkeitsincreasement) eintippen, wie in den Foren oder sonstwo, dann verlangst du ganz schön viel. Oder Fremdwörter (bspw. integrieren ./. intrigieren).
>> Das geht deutlich weiter als ein simples Suchen nach abstrakten Zeichenketten. >> UND: es werden wohl auch nur Leute ewtas von diesem System haben, die in der Lage sind, präzise Fragen zu formulieren.
Nunja. Irgendwie wird die Anzahl der Leute, die sich zwar artikulieren, aber nicht ausdrücken können immer größer. Die sagen irgendwas, du weißt ungefähr, was sie wollen, aber ein PC kommt da nicht mehr mit.
>> Gerade das Mitdenken des Nutzers ist heutzutage aber eher verpönt. Allgemein herrscht eine andere Tendenz vor.
Mir hat schon mal jemand gesagt, dass ich keine Freunde hätte, nur weil ich Ahnung von PCs habe. "Es gibt halt Leute die interessiert nur das Resultat, nicht das Gschmarri, wie die Technik funktioniert!". Jammern dann aber rum, wenn ihre Rechner "nach Hause telefonieren", Daten ausspioniert werden, Virenbefall den letzten Urlaub vernichtet... "Ja, woher soll ich das wissen, dass ich das so einrichten muss?"
Aber man muss das positiv sehen, viele von uns wären arbeitslos, wenn alle ihr Hirn einschalten würden: 80% der Feuerwehrleute ("Dieses Jahr keine echten Kerzen auf dem Christbaum, die ich anlasse, wenn ich einkaufen gehe"), 70% der Polizisten ("Dem hau ich jetzt mal KEINS aufs Maul"), 80% aller IT-Supportler ("Ne danke, ich kann mein System selber absichern")... Am Schluss würde dann sogar das Richtige gewählt werden... :O
>> Alles soll von selbst funktionieren und auch die irrealsten, gedankenlosesten Konsumentenwünsche gelten als sinnvolle Ziele für Desktopsysteme.
Nunja. Wir wechseln ja auch von Ubuntu zu Mint, weil das Thema grün ist... Oder man errinere sich an die "Christian" und "Muslime" Editionen von Ubuntu
>> In einem kulturellen Umfeld, in dem das Anzeigen von Systemmeldungen während des Rechnerstarts als "schlechte Usability" gilt, werden sich intelligente Suchmaschinen nicht entwickeln.
Zurecht! Was interessiert es mich, warum mein System nicht mehr läuft, wenn ich es neu installieren kann? DAS ist wahre Usability, da können wir doofen OpenSourceler noch was von MS lernen! (Wer Ironie findet, darf Sie behalten)
Dieser Beitrag wurde 1 mal editiert. Zuletzt am 11. Dez 2010 um 16:43.
> Aber man muss das positiv sehen, viele von uns wären arbeitslos, wenn alle ihr Hirn einschalten würden
Wohl wahr. Andere Industrien sind erfolgreich auf dem gleichen Weg. Vor zwei Tagen habe ich versucht, an meinem Citroen C3 das Lämpchen vom linken Abblendlicht auszuwechseln. Nachdem ich etwa eine Stunde lang versucht hatte, auch nur die kaputte Lampe aus ihrer Halterung zu bekommen, bin ich in eine Werkstatt gefahren. Dort hat mir ein Techniker das Teil (ca. 5.99 E Stückpreis) für freundliche 30E ausgewechselt. Er hat übrigens auch 15 min gebraucht - es gibt nämlich keinen geheimen Trick, die Lichtanlage ist einfach so krank konstruiert, dass die Aktion auch für einen Profi ausgesprochen stressig ist....
Natürlich ist das sinnlose Arbeit. Eine besser konstruierte Lichtanlage und *niemand* lässt das in einer Werkstatt machen. Selbst mit einer brauchbaren Anleitung in der Gebrauchsanweisung würden die meisten Leute wohl eher selbst Hand anlegen. Aber Vernunft schafft keinen Umsatz/Arbeit und was Arbeit schafft ist ja bekanntlich "sozial". Nicht-Beklopptsein wäre demnach öfter asozial....
Mittel- bis langfristig finde ich es natürlich auch erstrebenswert, dass ein System natürliche Sprache versteht. Aber selbst dann möchte ich als Power-User vielleicht lieber eine kompakte Abfragesprache lernen und verwenden. Unter Unix/Linux ist der mitdenkende Anwender doch durchaus üblich. Obendrauf kann man (sollte man aber auch!) später immer noch eine freundlichere Benutzerschnittstelle setzen.
SPARQL kommt dem ja aber auch schon ziemlich nahe. Ich denke es wäre durchaus interessant, das ganze in zwei Richtungen zu entwickeln; einmal eher die GUI-Schiene, wie man Filterregeln in Mail-Programmen zusammenstellt bspw., zum anderen ein Parser für "natürliche" Sprache.
Was insgesamt da extrem sinnvoll ist: Annotation und Austausch von Abfragen, quasi Meta-Informationen für Benutzer generierte Abfragen. Letztlich funzt das ja bei Plugins / Artwork auch schon gut. Für extrem individuelle Abfragen geht das natürlich nicht, aber für viele Dinge gibt es da bestimmt einen Konsens.
Auf jeden Fall gibt es hier noch spannende Möglichkeiten - man kann gespannt sein
arbeite auf zu vielen verschiedenen rechner die ich immer syncen muss, da is ein zig GB großer index suboptimal. auf rechnern mit ssd oder netbook will ichs dann gar nicht bzw geht wegen leistung eh nicht. aber wenn ich alle daten die so indexiert werden solln auf einen server verschieben kann der mir den dienst anbietet, event sogar rechnerübergreifend, daten + imap mailserver, dann solls mir recht sein. (das man dazu die infrstatrucktur bracht is klar )
aber einen lokalen dienst, der tage lang gebaut werden muss, und dann mehr ärger verursacht als er wert ist ist eine typische kde entwickler sache. mach ma was geniales, wie genial das ist verstehen zwar nur wir, aber zwangsbeglücken wir mal alle damit, wurscht obs brauchbar funktinoiert. ähnlich diesem mail über alles hinwegsyncronisieren was per default genau fast niemand braucht, aber ein ordentliches funktionieren und einen brauchbaren eindruck langfristig verhindert. dafür tonnen an abhänigkeiten für ein feature welches wenn dann nur optional einschaltbar vorhanden sein dürfte.
Von Sturmkraehe am Sa, 11. Dezember 2010 um 16:02 #
Die Idee hinter Nepomuk gefällt mir sehr, doch ich glaube es wird noch einige Zeit dauern, bis es ausgereift genug für mein System ist.
Lange Zeit habe ich nach dem Speicherfresser bei mir gesucht und stieß dann auf Nepomuk, trotz 8GB RAM wird er aufgrund der enormen Datenmenge extrem langsam beim Indexieren und auch beim Aktualisieren.
Aber ich glaube an Nepomuk und hoffe ich kann es bald sinnvoll einsetzen (und das andere Programme auch Nepomuk zur Unterstützung verwenden).
Was mir noch stark bei Nepomuk fehlt: eine Art Ablage der Info's in den zugehörigen Verzeichnissen.
Für mich ist Nepomuk derzeit semantischer Schmand. Ich kann mir nicht vorstellen das ich auf meinem kleinen Desktoprechner die Übersicht bei den Dateien verliere. Ich könnte mir vorstellen das man auf großen (Internet-) Servern so eine Suchmaschine braucht. Mir reicht eine aktuelle locatedb derzeit völlig aus.
Wer seine Dateien ordentlich strukturiert braucht einen Indexer tatsächlich kaum. Bei mir ist das so, ich habe Strigi daher abgeschaltet. Mit Nepomuk hat das ziemlich wenig zu tun, außer dass Strigi eben seine Ergebnisse - wie alle anderen - in Nepomuk ablegt und diese dann über die gleiche Schnittstelle zugänglich sind. Viel interessanter und wichtiger ist das programmübergreifende Tagging, das Nepomuk ermöglicht. Ich möchte es wirklich nicht mehr missen. Das Ziel von Tagging ist nicht Dateien zu finden, sondern zu gruppieren und zu filtern. Wenn ich z.B. ein bestimmtes Foto von jemandem suche, brauche ich keine Hilfe, das zu finden. Möchte ich aber alle Fotos des letzten halben Jahres von ihr, unabhängig wann und wo aufgenommen und auf denen sie etwas bestimmtes anhat, finden, wird es schon schwieriger. Mit Tags ist das sehr leicht (wenn man sich jedesmal kurz die Zeit nimmt, neue Bilder zu taggen). Es spielt keine Rolle, ob ich die Tags in Digikam oder Gwenview gesetzt habe oder einfach mit Dolphin. Und ich kann auch sehen, welche Bilder ich schon verschickt habe und welche nicht, ohne das irgendwo extra festzuhalten (oder gar die ganzen Mails aufzubewahren). Die Integration von Nepomuk in eigene Programme ist auch gut gelöst, so dass früher oder später die meisten Anwendungen es nicht nur unterstützen, sondern auch aktiv nutzen werden.
"Möchte ich aber alle Fotos des letzten halben Jahres von"
Da gibt es nur ein Problem: Linux (wie Unix) merkt sich das originale Erstellungsdatum der einzelnen Dateien gar nicht. Nur ein einziges nachträgliches Bearbeiten z.B. einer Bilddatei (mit natürlich notwendigem erneuten Abspeichern) und die datumsmäßige Einordnung stimmt nicht mehr, da Linux für die erneut abgespeicherte Datei das aktuelle Datum als Erstellungsdatum übernimmt. Das originale Erstellungsdatum ist dann verloren. Wie geht denn Nepomuk mit diesem Problem um? Speichert Nepomuk das erstmalige "Auftreten" einer solchen Datei auf dem Rechnersystem ab, unabhängig vom laufenden Linux-Betriebssystem?
Das große Problem an Nepomuk ist weniger die Technik, es ist eher die Disziplin des Benutzers. Mit Disziplin meine ich folgendes (Beispiel sind hier Bilddateien) :
Der Benutzer muss immer das Datum und die Uhrzeit in der Kamera korrekt einstellen. Viele Benutzer vergessen z.B. nach einem Batteriewechsel diese wieder korrekt einzustellen. Stimmen diese schon in der Kamera nicht, dann kann man das Tagging gleich bleiben lassen.
Der Benutzer muss nach einem Kopieren der Bilddateien auf den Computer, diese mit dem passenden Programm korrekt taggen. Das kostet Zeit und nicht jeder macht sich die Mühe z.B. alle 1000 Fotos aus dem Urlaub richtig zu taggen. Meisten endet es wie bei der analogen Fotografie :
Man schaut sich die Fotos einmal an und dann landen sie unsortiert in einem Schuhkarton.
Bevor mir jetzt jemand sagen will, dass das Taggen von Fotos doch gar nicht so aufwendig ist und gar kein Problem darstellt :
Bei 90% (ach was, 99%) der Computerbenutzer sieht der Computer aus wie eine Messie-Wohnung. Ich kenne Leute, bei denen man vom Fußboden essen kann, aber wehe man schaut sich mal den Computer an :
Das kleinste Übel sind da noch die zig Toolbars, die den Browser verschandeln. Dateien werden kreuz und quer abgespeichert (Unter "C:\", auf dem Desktop, im Programmverzeichnis (!) usw.). Da hilft auch der beste Indexer und Semantic-Desktop nichts. Ein Bekannter von mir, hat einmal zwei Tage (!) benötigt um eine bestimmte Datei wiederzufinden. Und er hatte den Index-Dienst von Windows XP laufen. Nur wenn der Indexer mit dem Inhalt nichts anfangen kann (War eine CorelDraw-Datei) und diese dann unter "C:\WINDOWS" mit einer falschen Dateiendung abgespeichert wurde, dann kann einem auch keine SuFu mehr helfen.
> Der Benutzer muss immer das Datum und die Uhrzeit in der Kamera korrekt einstellen. Viele Benutzer vergessen z.B. nach einem Batteriewechsel diese wieder korrekt einzustellen.
Das sollte eigentlich nicht sein. Kameras haben eine eingebaute Minibatterie, die auch nach einem Akkuwechsel die Zeit hält. Keine Ahnung, wie lange genau, aber ich hatte schon mehr als eine Woche lang keinen Akku in der Kamera und die Zeit stimmt immer noch sekundengenau. Ich habe die Kamera mit korrekter Zeit gekauft und nie stellen müssen.
> Der Benutzer muss nach einem Kopieren der Bilddateien auf den Computer, diese mit dem passenden Programm korrekt taggen. > Das kostet Zeit und nicht jeder macht sich die Mühe z.B. alle 1000 Fotos aus dem Urlaub richtig zu taggen. > Man schaut sich die Fotos einmal an und dann landen sie unsortiert in einem Schuhkarton. > Bevor mir jetzt jemand sagen will, dass das Taggen von Fotos doch gar nicht so aufwendig ist und gar kein Problem darstellt :
Ich schaue mir viele Bilder auch nur einmal an und dann vielleicht Monate später nochmal. Ich tagge gleich beim ersten Durchsehen, da habe ich's weg und da ist auch die Erinnerung noch frisch. Mit passenden Programmen wie Digikam aber auch einfach Dolphin oder Gwenview ist es überhaupt kein Problem, ein paar hundert Bilder in wenigen Minuten durchzusehen und nebenbei zu taggen, das meiste sind ja ohnehin Doubletten. Das ist gar keine Arbeit, denn man will sich die Bilder ja sowieso wenigstens einmal ansehen.
Von zettberlin am So, 12. Dezember 2010 um 17:38 #
> Ich habe die Kamera mit korrekter Zeit gekauft und nie stellen müssen.
Gratuliere! Meine Fuji vergisst alles, wenn der Akku mal leer wird und/oder gewechselt werden muss.
Aber mal zurück zum Thema:
Ein semantisches System rechtfertigt seinen Ressourcenverbrauch nur dann, wenn es Dateien auch findet, wenn sie der Nutzer nicht getaggt hat.
Beispiel: man bearbeitet und taggt 1 Bild aus einer Serie, sucht später nach dem tag, das man vergeben hat und der semantische Suchbot fragt freundlichst, ob man die anderen Bilder aus dieser Serie auch sehen möchte. Ach so: und weist bei der Gelegenheit darauf hin, dass 5 Bilder aus der Serie vor zwei Wochen auf eine USB-Fressplatte verschoben wurden.
Alles andere wäre bloß eine Art locate mit tags...
Dieser Beitrag wurde 1 mal editiert. Zuletzt am 12. Dez 2010 um 17:39.
> Ein semantisches System rechtfertigt seinen Ressourcenverbrauch nur dann, wenn es Dateien auch findet, wenn sie der Nutzer nicht getaggt hat.
Das ist gar nicht Sinn der Sache. Nepomuk verwaltet die Tags, die vom Benutzer gesetzt werden. Nicht mehr und nicht weniger. Das hat auch nichts mit Dateien zu tun, Tags können z.B. auch an Kontakte im Adressbuch, URLs oder Einträge in einem IRC-Log vergeben werden. Dass es für Dateien geht, ist mehr oder weniger ein "Nebeneffekt" (ok, es ist der meistgenutze Fall). Für die Dateisuche sind andere Programme zuständig, z.B. Strigi für Inhalte und locate nach Dateinahmen. Der Ressourcenverbrauch ist auch nicht übermäßig, Nepomuk und Akonadi zusammen benötigen bei mir ca. 128MB RAM (KDE 4.6 Beta 2) mit mehreren zehntausend Mails in meinem IMAP und etwa 200 abbonierten Newsgroups. Virtuoso hat nach 24h Login etwa 9min CPU verbraucht, MySQL ungefähr eine Minute und der Rest jeweils unter 30s. Als einziger fällt der Digikam-Nepomukservice aus dem Rahmen mit knapp 40min.
Von zettberlin am So, 12. Dezember 2010 um 22:42 #
> Das ist gar nicht Sinn der Sache. Nepomuk verwaltet die Tags, die vom Benutzer gesetzt werden. Nicht mehr und nicht weniger.
Prinzipiell ist aber in der Technik (zusammen mit virtuoso, strigi etc) deutlich mehr angelegt. Wozu sollte man sich mit so komplexen Konstrukten wie Ontologie-Verknüpfungen und Schlussfolgerungen einlassen, wenn am Horizont nicht wenigstens erste Schritte in Richtung künstliche Intelligenz winken würden?
Tags könnte man in einer simplen, old-school Relationalen Datenbank viel effizienter verwalten.
> Dass es für Dateien geht, ist mehr oder weniger ein "Nebeneffekt"
Na gut, aus Sicht des Nutzers ist ein Datensatz aus einer Datenbanktabelle auch eine Art "Datei" (genauso, wie technisch gesehen eine Datei ein Datensatz aus einer Dateisystem-Datenbank ist). Natürlich ist eine E-Mail meistens keine Datei aber für den Nutzer ist sie eine und man kann sie ja auch als Datei speichern.
Letztlich ist es auch konzeptionell gleichgültig. Es geht darum, dem Nutzer und der Nutzerin Datensätze, die sie gerade brauchen, auf Anfrage zur Verfügung zu stellen. Das könnte man auch sehr konventionell haben:
1.) locate sucht nach Dateien 2.) geeignete Module durchsuchen existierende Datenbanken von Digikam, Thunderbird, Amarok, Adressbüchern, online(Freesound, Wikipedia, dict, etc etc) 3.) eventuell läuft locate nochmal mit den Treffern, die Dateinamen referenzieren 4.) Alles hübsch darstellen, fertig.
Alles *ohne* eigenen Indizierungs-Mechanismus. Läuft nur, wenn angefordert. Kann mit Plugins beliebig erweitert werden
Das würde bestimmt vielen besser gefallen als die Nepomuk-Krake. Soviel ich davon gelesen habe, kann aber Nepomuk prinzipiell mehr als das.
Dieser Beitrag wurde 1 mal editiert. Zuletzt am 12. Dez 2010 um 22:44.
Ich habe vor einiger Zeit damit die Erfahrung gemacht, dass mein Rechner beim KDE4-Start fast eingefroren ist, weil Nepomuk am Werkeln war (es gab einen oder mehrere "ultralangsame" Popup-Hinweise). Nepomuk hat mich in dieser Hinsicht stark an Beagle unter älteren OpenSuse-Distros (10.x-Serie) erinnert.
Da man es problemlos abschalten kann, ist das nicht so schlimm.
Wahrscheinlich erfüllt mein Rechner (2GHz, 1GB RAM) nicht die Systemmindestvoraussetzungen für Nepomuk.
Nach der ersten Inventarisierung Deiner Dateien wird Nepomuk deutlich schneller. Ich hab's aber trotzdem abgeschaltet:
Erstens verbraucht es unnötige Ressourcen,
zweitens muss ich meine Rechnernutzung nicht mehr als nötig protokollieren ... die nächste Hausdurchsuchung kommt bestimmt irgendwann ;-)
drittens finde ich meine Dateien am einfachsten über ihre Dateinamen bzw. die Dateinamen der Ordner, in die ich sie gelegt habe.
Nur bei E-Mails finde ich Indizierung praktisch (ich kann ja nicht den Betreff empfangener E-Mails festlegen), aber darum kümmert sich Thunderbird.
> Ich habe vor einiger Zeit damit die Erfahrung gemacht, dass mein Rechner beim KDE4-Start fast eingefroren ist, weil Nepomuk am Werkeln war
War bei mir sehr ähnlich. Allerdings funktionierte das System weiter (3G RAM Dualcore Intel). Nur der Lüfter heulte durch und eine gewisse Zähigkeit war zu bemerken...
Also habe ich mir gesagt: OK, wenn es fertig ist, wird es besser.
Ich habe dem Ganzen 2 Tage (!!) Zeit gegeben.
Ergebnis: das Heulen ging weiter, weil die Datenbank dauernd inkonsistent wurde und wieder von vorn aufgebaut wurde.
Beim Test der innovativen Suchfunktion fand das Ding bei der Suche nach "Watchtower":
Den Dylan-Text in einer Reintextdatei.
Die Akkorde in einer Open-Office-Writer-Datei.
Nicht aber die MP3-Datei mit dem Dylan-Song und auch nicht die 2 Versionen von Hendrix in OGG-Dateien.
locate findet natürlich alle 4.
Kurz: vielleicht probiere ich das Ding nächstens mal wieder aus, bis dahin ist es nicht viel mehr als ein interessantes Konzept/Experiment.
"Nur der Lüfter heulte durch und eine gewisse Zähigkeit war zu bemerken..."
Erschreckend das zu hören, und das bei bei einem recht aktuellen System.
Ich kann den KDE4-Entwicklern nur die oben schon angedeuteten Erfahrungen von OpenSuse mit der Desktopsuchmaschine Beagle ans Herz legen:
https://features.opensuse.org/305296
Auch Nepomuk sollte standardmäßig deaktiviert sein (falls das in den mir unbekannten originalen KDE4-Sourcen so sein sollte, dann beträfe meine Kritik natürlich die betreffenden Distros).
Das Problem ist IMHO etwas weitreichender.
Siehe http://forum.kde.org/viewtopic.php?f=20&t=83054&start=10
How to NOT install Akonadi and Nepomuk?
Slackwares KDE4 läuft deshalb hier wie eine Eins. OpenSuse habe ich wegen seiner Zwangs-Akonadi- (und auch ein wenig für seine Nepomuk/Virtuoso-) Integration gelöscht.
KDE4 braucht beides nicht und funkioniert auch so. Ich bin ohnehin mit Firefox und Thunderbird im Internet unterwegs.
Die Kritik richtet sich eher gegen Strigi (nicht effizient genug) und die Distribution (schlechte default-Konfiguration). Wenn ich Gigabytes an meinetwegen PDF Dokumenten zu indexieren habe, ist klar, dass das eine enorme Menge an Arbeit ist. Auf langsamen Maschinen, die parallel benutzt werden sollen, wenn sie an sind, wird das vermutlich Wochen dauern. Auch sollte das nur nach expliziter Aufforderung Akku-Energie verbraten.
Da fehlt einfach noch das Verständnis der sehr unterschiedlichen Anwendungsbereiche. Wenn das auf einer schnellen Entwicklermaschine ohne große Archive keine Probleme verursacht heißt das noch nichts.
Der Vergleich mit Virenscannern drängt sich auf.
So ein leistungsfressenden Muell brauche ich nicht. Am besten seine Daten gleich vernuenftig Sortieren!
Genau! Wer seine Dateien gescheit ordnet, findet sie auch so wieder!
Sehe ich auch so. Wenn ich allerdings eine große Privatbildersammlung hätte und diese wären anständig getagt, dann würde ich vielleicht auch auf die Dienste von Nepomuk zurück greifen.
Also ich nutze Nepomuk regelmäßig für meine Filme (TV Aufnahmen).
Die Filme tage ich dann als Sci-Fi, Action, Horror, Serie, FSK X, Länge ... und kann sie bewerten.
Jetzt kann ich Nepomuk benutzen um mir alle Action Filme anzeigen zu lassen die mindestens 4 Sterne haben, kann noch die Länge berücksichtigen. Ob ein Film werbung hat ...
Vorallem findet Nepomuk so auch Action Filme die ich auch noch als Sci-Fi, Horror... getagt habe.
Jetzt versuch das mal mit Ordnern zu machen
Ich bin relativ sicher, dass ich sogar einen Artikel darüber gelesen habe. Aus der Tatsache, dass ich dessen Inhalt wieder vergessen habe schließe ich, dass es dem Teil an echtem Nutzen - zumindest für mich - mangelt.
Was soll ein »sozial-semantischen Desktop« sein? Datei-indizierung ist klar, (nach Dateinamen suchen kann ich mit locate, find, etc.. auch), aber was soll der Zusatznutzen sein, wenn man die Indizierung ausschaltet?
Am besten versteht man den Nutzen (bzw. die Möglichkeiten, die das alles noch mit sich bringen wird!) dann, wenn man sich mal mit Ontologien auseinandergesetzt hat. Leider ist das ein Thema, welches ziemlich komplex ist und nicht leicht zu durchschauen.
Stark vereinfacht ausgedrückt kann man die Bedeutung von "Dingen" einem Rechner verständlich machen. Verständlich insofern, als dass er eben weiß, was eine Emailadresse ist und wozu sie gut ist, was man damit machen kann, wem sie gehört usw. Auf einem ontologiebasierten Informationsraum kann man ziemlich geniale Suchen ausführen, die mit konventionellen Mitteln so nicht möglich sind.
Ein weiteres spannendes Gebiet ist das Schlussfolgern. Hierbei kann ein Rechner aus bestehenden Verknüpfungen basierend auf Eigenschaften der Klassen von Objekten neues, bisher nur implizites Wissen, verfügbar machen. Ein konkretes Beispiel auf dem Desktop fällt mir allerdings spontan nicht ein.
> Ein konkretes Beispiel auf dem Desktop fällt mir allerdings spontan nicht ein.
Und genau hier liegt das Problem. Es gibt einfach keinen einzigen echten Verwendungszweck für so ein Programm auf einem normalen Desktop.
Quark! Mir fällt zu diesem Aspekt hier nichts spontan ein, Dir wohl auch nicht. Daraus über den Nutzne zu urteilen ist schlicht dümmlich!
Praktisch benutzt jeder ständig semantische Hilfen, man ist nur gewohnt, dass diese von Internetservices geliefert werden. Das hat Vorteile und Nachteile. Wenn man so will ist Nepomuk der Gegenentwurf zu Chrome OS.
> Was soll ein »sozial-semantischen Desktop« sein?
Theoretisch ein Desktop, mit dem man wie mit einem Menschen reden kann:
"Suche alle Dateien, die Musikstücke enthalten, deren Urheberrecht in Deutschland ausgelaufen ist."
(EDIT: Ontologien wären dann zum Beispiel:"Ein Musikstück ist eine Komposition.", "Komponisten schreiben Kompositionen.", "Komponisten sind Menschen.", "Menschen haben einen Geburtstag.", Menschen sind sterblich." etc etc)
Ein semantischen System könnte den Satz analysieren und verstehen. Es würde dann:
1.) auf der Festplatte nach typischen Musikdateien (MP3, OGG, Lilypond etc) suchen.
2.) im Internet nach den Stücken suchen, um die Namen der Komponisten zu bekommen.
3.) die Namen der Komponisten verwenden, um deren Todestag herauszufinden.
4.) eine kleine Berechnung mit Timestamp ausführen, um die auszusortieren, die länger als 70 Jahre kaputt sind.
5.) die Namen der erfolgreichen Kandidaten mit den Stücken auf der Festplatte korrellieren.
5. a) wo wir schon mal dabei sind auch nach anderen Dateien auf der Fressplatte suchen, die Referenzen auf die teuren Dahingegangenen enthalten.
Und zum Schluss eine Liste der Dateien, geordnet nach Komponist ausgeben. ....
Und gleich fragen, ob man auch die nach amerikanischem Recht Verfallenenen haben will.....
Ach so: und eine Liste Links auf die Komponisten bei Wikipedia und auf Noten und andere Aufnahmen der Stücke bei archive.org etc...
Das würde schon Spass machen oder?
In der Praxis heute allerdings siehe oben....
Dieser Beitrag wurde 1 mal editiert. Zuletzt am 10. Dez 2010 um 23:58.Ich habe Nepomuk abgeschaltet. Es frisst wahnsinnig viel Ressourcen und bremst die Arbeit aus.
Nepomuk ist wie Flash: Einmal am laufen schmilzt der Akku im Notebook dahin wie Eis in der Sonne Saudi-Arabiens.
ich finde das programm wirklch nicht übel. außerdem ist es kein (wie häufig behauptet) ressourcenfresser. es wird nur einmal alles komplett inventarisiert und danach nur noch änderungen. außerdem kann man bestimmte ordner abstellen.
Das kommt ganz auf den Rechner an. Nepomuk 4.5x auf meinem AMD Phenom 9650 frisst bei der Indizierung 40-80% CPU, aber die Systemlast liegt bei 2,00-2,20. Zudem ist bei der Erstindizierung Strigi abgekackt. Nepomuk alleine hat dann noch ~50% Prozessorlast und eine Systemlast von ~1,20 erzeugt.
Nach dem Beenden von Nepomuk/Strigi via SystemSettins sank zwar die Prozessorlast auf 9%, aber die Systemlast lag immer noch bei ~1,20. Nach ca. 2 Minuten war wieder alles im Normalbereich (~0,20-0,30).
Was ergibt das bei Leuten, die keinen 4-Kern-Prozessor und ein generell älteres System haben? 100% und 2,90 (mein Rekord ohne Forkbombe liegt übrigens bei 3,20)?
Ich habe mal zum Vergleich mlocates updatedb (ebenfalls Erstindizierung) herangezogen: Prozessor: 12-17%, System: ~1,00-1,10. Zudem ist mlocate natürlich schneller, weil es bloß Dateipfade speichert. Wer also keine Zusatzinfos durchsucht, ist mit mlocate + cron wesentlich besser aufgehoben.
Ich hatte an anderer Stelle schon mal etwas zum Nutzen geschrieben:
Bei mir funktioniert Nepomuk ganz ohne Probleme. Ausnahmslos alle Dateien mit einem oder mehreren Tags zu versehen, will ich nicht mehr missen. Im Suchfeld von Dolphin dann nur noch das Stichwort (oder mehrere in Kombination) eingeben und alle Dateien dazu werden aufgelistet. Das Suchergebnis kann dann als Verknüpfung unter Orte in Dolphin angelegt werden. Also letztlich ein virtueller Ordner. Da die Tags von z.B. digiKam, Amarok und natürlich Dolphin systemweit zur Verfügung stehen, werden auch alle entsprechenden Dateien angezeigt. Mal ein simples Beispiel:
Bei Bildern ist es schon üblich sie mit Tags zu versehen. Also z.B. "Urlaub", "Paris", "Familie", "Öffentlich", "Klaus", "Personen", "Natur", "Gebäude" usw. Werden alle Dateien entsprechend mit Tags versehen, können auch unterschiedliche Suchergebnisse erzielt werden. Natürlich kann man dies ja mit z.B. digiKam allein (mache ich ja auch), aber die Tags stehen halt unter Dolphin ebenfalls zur Verfügung. Ich muss also nicht extra digiKam starten, nur weil ich mal ganz schnell ein Bild suche.
Anderes Beispiel zur Dokumentenverwaltung. Angenommen, ich erhalten regelmäßig Dateien von unterschiedlichen Partnern per Mail, da man an einem gemeinsamen Projekt arbeitet. Nun speichere ich die Dateien natürlich in einem Ordner ab. Mich interessiert später aber eher, von wem die Datei stammt und dies geht nicht aus dem Dateinamen hervor. Mit entsprechenden Tags kann ich durch eine einfache Suche alle Dateien ermitteln, welche von "Firma X", "Mitarbeiter Y" im Zeitraum "von - bis" übermittelt worden sind, ohne z.B. umständlich mein Mailfach zu durchforsten.
Die Suchfunktionen gestatten natürlich auch weiterhin Angaben zur Größe der Datei oder die allseits bekannte Bewertung (im Bezug auf das 2. Beispiel werden halt die Dokumente mit den besten Vorschlägen im Projekt mit 5 Sternen versehen; zusätzlich zu den Stichworten).
Insgesamt ist dies eine andere Art der Arbeitsgestaltung. Sie kann jedoch äußerst effektiv sein.
Ich kann natürlich nachvollziehen, was Du meinst.
Allerdings sind die jeweiligen Suchmöglichkeiten oft schon in die Programme integriert. So erledigt Thunderbird den "Indizierungsjob" von Nepomuk und das Beispiel Digikam hast Du ja schon selbst genannt. In Amarok vermisse ich Nepomuk ebenfalls nicht, hier ist fast alles schon übersichtlich eingeordnet.
Von daher beschreibst Du nichts wirklich Neues, außer dass eine zentrale Indizierung für Suchzwecke durch Nepomuk vorgenommen wird, die Du als Vorteil empfindest. Für mich ist allerdings der zusätzliche Ressourcenverbrauch der entscheidende Nachteil.
Im schlimmsten Fall suche ich eine Datei, deren Name ich noch kenne oder zumindest den Dateityp. Dafür reicht mir dann - außerhalb spezialisierter Anwendungen - z.B. eine einfache, systemweite Konquerorsuche.
Was mich in diesem Zusammenhang aber interessiert: Ist es möglich, die Nepomukdaten des einen Rechners auch mit Nepomuk auf dem anderen zu lesen und zu transferieren? Große Musik- und Bildersammlungen auf zwei Heimrechnern könnten ja durchaus fast identisch sein.
Hier wäre es interessant, ob Nepomuk dann eine Dateisynchronisierung zwischen beiden Rechnern durchführen bzw. "veranlassen" kann, um die Musik- und Bildersammlungen der beiden Rechner durch Dateientransfers inklusive notwendiger Umbenennungen auf den gleichen aktuellen Stand zu bringen.
Natürlich macht Nepomuk im Detail nicht wirklich Neues. Aber es verbindet alles unter einem Dach. Und das hat durchaus Vorteile. Ich muss eben nicht 5 verschiedene Programme (für jeden Dokumententyp) bemühen, um alle Dokumente zu suchen. Nimm hier wirklich mein zweites Beispiel. Ich denke, es zeigt ganz anschaulich, wie sinnvoll es sein kann. Ich denke, Nepomuk verlangt auch eine neue Art des Umgangs mit Daten, den wir oft nicht gewohnt sind. Wer regelmäßig seine Dokumente mit sinnvollen Tags versieht, der profitiert erheblich von Nepomuk. Ich möchte es nicht mehr missen und finde, es ist eine geniale Idee gewesen.
Der Ressourcenverbrauch hält sich in Grenzen. Wenn der Index einmal erstellt ist, läuft Nepomuk im "Standby-Modus". Es beeinflusst weder die Leistung noch wesentlich den Energie-Verbrauch. Gerade bei der erstmaligen Erstellung des Index, empfiehlt es sich, den von Nepomuk zu nutzenden Speicher heraufzusetzen. Der Index wird dann wesentlich schneller erstellt (ursprünglich waren bei mir 50MB eingestellt, ich hatte den Wert auf 200MB heraufgesetzt). Wichtig ist ebenfalls, sich nicht das ganze System indizieren zu lassen. Mal abgesehen davon, dass es ewig dauert, ist die Index-Datei dann auch wirklich sehr groß. Der Sinn von Nepomuk besteht eher darin, User-Daten zu indizieren und besser nutzbar zu machen.
Die Datenbank einfach auf einen anderen Rechner kopieren, halte ich nicht für sinnvoll. Es sei denn, die Datenbank hat nur ein externes Laufwerk indiziert, welches von beiden Rechnern angesprochen werden kann. Nepomuk ist ein Indexer und keine zentrale Daten-Sammel-Stelle. Insofern führt Nepomuk keine Synchronisation durch.
Der Hauptkritikpunkt bleibt bei vielen Nutzern auch der hohe Ressourcenverbrauch.
Nepomuk erinnert hinsichtlich der System- bzw. der CPU-Belastung eher an Beagle oder einen Virenscanner.
Dieses Posting samt Konsequenzen für Nepomuk steht stellvertretend für dieses Nepomuk-Hauptproblem (laut Signatur auf einem Quadcore-Rechner!):
http://debianforum.de/forum/viewtopic.php?f=27&t=123620&hilit=nepomuk&sid=cd4c678f9f08d7c050cf05218872ae02
Betroffene Nutzer werden Nepomuk niemals wieder einschalten, da Nepomuk nun seinen Ruf als Ressourcenfresser weg hat.
Kein Vorteil (den man so gar nicht kennenlernen konnte) kann den Fast-Stillstand des gesamten Systems aufwiegen.
Unter normalen Umständen verbraucht Nepomuk kaum Ressourcen. Und es ist wohl ziemlich sicher, dass eine CPU-Auslastung von 100% nicht zu den normalen Umständen zählt und eher auf einen Bug hinweist. Da es sich bei Nepomuk um eine komplexe Software handelt, kann man wohl nicht erwarten, dass sie fehlerfrei ist (das mag wünschenswert sein, aber realistisch ist das nicht). Insofern wird es immer User geben, die leider negative Erfahrungen machen. Das trifft aber so ziemlich auf jede Software zu.
Wenn User nach Auftreten eines Fehlers in einer Software diese "niemals wieder" benutzen, dann werden sie ja bald komplett ohne PC auskommen müssen, oder?
Nicht unbedingt. Eine Such- und Indizierungssoftware ist letztlich verzichtbar.
Nepomuk kennt doch bestimmt auch so etwas wie Systemmindestvoraussetzungen. So sollte diese Software z.B. auf einem 1GHz-PC mit 512MB RAM und vielen Daten besser nur dann starten, wenn das System gerade nicht benutzt wird oder eben gar nicht starten.
KDE4 läuft auf so einem Rechner schließlich "gerade noch so".
>Eine Such- und Indizierungssoftware ist letztlich verzichtbar.
Sehe ich nicht so. Die klassischen Suchfunktionen sind meist nicht sehr effektiv und auch langsam. Eine Suche über indizierte Dateien ist wesentlich flexibler. Sie kann Inhalte berücksichtigen. Sind die Dateien noch mit Tags versehen, können auch komplexe Suchenvorgänge durchgeführt werden. Das ganze schnell und effektiv. Zwei Beispiele hatte ich oben beschrieben.
>besser nur dann starten, wenn das System gerade nicht benutzt wird
Genau das macht Nepomuk.
Aber wer macht sich schon die Arbeit, alle Dateien zu taggen?
Nur du selbst verlangst von dir, alle Dateien taggen zu müssen. Keiner sonst. Es reicht, wenn du die Dateien, die du gerade brauchst und mit Tags schneller gefunden hättest, mit Tags versiehst und dann mit Nepomuk arbeitest.
Ich bin Wissenschaftler und forsche im Semantic-Web-Bereich. Von daher glaube ich an die Idee hinter dem Semantic Desktop. Allerdings: beim Finden von Dateien brauche ich meistens keine Hilfe, weil ich meine Verzeichnisse gut organisiert habe. Von daher habe ich auch nie andere, nicht-semantische Desktop-Suchmaschinen wirklich genutzt. E-Mails finde ich, indem ich alles nach Google Mail umleite und dort die Suchfunktion nutze. Aber in Zukunft wird es mit der Nepomuk-Technologie auch möglich sein, komplexere Fragen zu beantworten, wie z.B. "Falls ich die Datei XY ursprünglich von jemandem per E-Mail-Anhang bekommen habe, wer hat diese Mail noch bekommen und mit einer Mail mit aktualisiertem Datei-Anhang darauf geantwortet?"
Das System sollte dann auch in der Lage sein, tatsächlich als menschenlesbarer Satz formulierte Fragen zu verstehen. Das geht deutlich weiter als ein simples Suchen nach abstrakten Zeichenketten.
Bis dahin wird es wohl noch ein Weilchen dauern...
UND: es werden wohl auch nur Leute ewtas von diesem System haben, die in der Lage sind, präzise Fragen zu formulieren.
Gerade das Mitdenken des Nutzers ist heutzutage aber eher verpönt. Allgemein herrscht eine andere Tendenz vor. Alles soll von selbst funktionieren und auch die irrealsten, gedankenlosesten Konsumentenwünsche gelten als sinnvolle Ziele für Desktopsysteme.
In einem kulturellen Umfeld, in dem das Anzeigen von Systemmeldungen während des Rechnerstarts als "schlechte Usability" gilt, werden sich intelligente Suchmaschinen nicht entwickeln.
>> Das System sollte dann auch in der Lage sein, tatsächlich als menschenlesbarer Satz formulierte Fragen zu verstehen.
Wenn die dann das gleiche als deutsch getarnte irgendwas (bspw. 'nen Auto / Geschwindigkeitsincreasement) eintippen, wie in den Foren oder sonstwo, dann verlangst du ganz schön viel. Oder Fremdwörter (bspw. integrieren ./. intrigieren).
>> Das geht deutlich weiter als ein simples Suchen nach abstrakten Zeichenketten.
>> UND: es werden wohl auch nur Leute ewtas von diesem System haben, die in der Lage sind, präzise Fragen zu formulieren.
Nunja. Irgendwie wird die Anzahl der Leute, die sich zwar artikulieren, aber nicht ausdrücken können immer größer. Die sagen irgendwas, du weißt ungefähr, was sie wollen, aber ein PC kommt da nicht mehr mit.
>> Gerade das Mitdenken des Nutzers ist heutzutage aber eher verpönt. Allgemein herrscht eine andere Tendenz vor.
Mir hat schon mal jemand gesagt, dass ich keine Freunde hätte, nur weil ich Ahnung von PCs habe. "Es gibt halt Leute die interessiert nur das Resultat, nicht das Gschmarri, wie die Technik funktioniert!". Jammern dann aber rum, wenn ihre Rechner "nach Hause telefonieren", Daten ausspioniert werden, Virenbefall den letzten Urlaub vernichtet... "Ja, woher soll ich das wissen, dass ich das so einrichten muss?"
Aber man muss das positiv sehen, viele von uns wären arbeitslos, wenn alle ihr Hirn einschalten würden: 80% der Feuerwehrleute ("Dieses Jahr keine echten Kerzen auf dem Christbaum, die ich anlasse, wenn ich einkaufen gehe"), 70% der Polizisten ("Dem hau ich jetzt mal KEINS aufs Maul"), 80% aller IT-Supportler ("Ne danke, ich kann mein System selber absichern")... Am Schluss würde dann sogar das Richtige gewählt werden... :O
>> Alles soll von selbst funktionieren und auch die irrealsten, gedankenlosesten Konsumentenwünsche gelten als sinnvolle Ziele für Desktopsysteme.
Nunja. Wir wechseln ja auch von Ubuntu zu Mint, weil das Thema grün ist... Oder man errinere sich an die "Christian" und "Muslime" Editionen von Ubuntu
>> In einem kulturellen Umfeld, in dem das Anzeigen von Systemmeldungen während des Rechnerstarts als "schlechte Usability" gilt, werden sich intelligente Suchmaschinen nicht entwickeln.
Zurecht! Was interessiert es mich, warum mein System nicht mehr läuft, wenn ich es neu installieren kann? DAS ist wahre Usability, da können wir doofen OpenSourceler noch was von MS lernen! (Wer Ironie findet, darf Sie behalten)
Dieser Beitrag wurde 1 mal editiert. Zuletzt am 11. Dez 2010 um 16:43.> dann verlangst du ganz schön viel. Oder Fremdwörter (bspw. integrieren ./. intrigieren).
Anfrage an semantischen Paketmanager:
"Welche Standart-Packete müssen repiriert werden?"
> Aber man muss das positiv sehen, viele von uns wären arbeitslos, wenn alle ihr Hirn einschalten würden
Wohl wahr.
Andere Industrien sind erfolgreich auf dem gleichen Weg.
Vor zwei Tagen habe ich versucht, an meinem Citroen C3 das Lämpchen vom linken Abblendlicht auszuwechseln. Nachdem ich etwa eine Stunde lang versucht hatte, auch nur die kaputte Lampe aus ihrer Halterung zu bekommen, bin ich in eine Werkstatt gefahren. Dort hat mir ein Techniker das Teil (ca. 5.99 E Stückpreis) für freundliche 30E ausgewechselt. Er hat übrigens auch 15 min gebraucht - es gibt nämlich keinen geheimen Trick, die Lichtanlage ist einfach so krank konstruiert, dass die Aktion auch für einen Profi ausgesprochen stressig ist....
Natürlich ist das sinnlose Arbeit. Eine besser konstruierte Lichtanlage und *niemand* lässt das in einer Werkstatt machen. Selbst mit einer brauchbaren Anleitung in der Gebrauchsanweisung würden die meisten Leute wohl eher selbst Hand anlegen.
Aber Vernunft schafft keinen Umsatz/Arbeit und was Arbeit schafft ist ja bekanntlich "sozial". Nicht-Beklopptsein wäre demnach öfter asozial....
Mittel- bis langfristig finde ich es natürlich auch erstrebenswert, dass ein System natürliche Sprache versteht. Aber selbst dann möchte ich als Power-User vielleicht lieber eine kompakte Abfragesprache lernen und verwenden. Unter Unix/Linux ist der mitdenkende Anwender doch durchaus üblich. Obendrauf kann man (sollte man aber auch!) später immer noch eine freundlichere Benutzerschnittstelle setzen.
SPARQL kommt dem ja aber auch schon ziemlich nahe. Ich denke es wäre durchaus interessant, das ganze in zwei Richtungen zu entwickeln; einmal eher die GUI-Schiene, wie man Filterregeln in Mail-Programmen zusammenstellt bspw., zum anderen ein Parser für "natürliche" Sprache.
Was insgesamt da extrem sinnvoll ist: Annotation und Austausch von Abfragen, quasi Meta-Informationen für Benutzer generierte Abfragen. Letztlich funzt das ja bei Plugins / Artwork auch schon gut. Für extrem individuelle Abfragen geht das natürlich nicht, aber für viele Dinge gibt es da bestimmt einen Konsens.
Auf jeden Fall gibt es hier noch spannende Möglichkeiten - man kann gespannt sein
arbeite auf zu vielen verschiedenen rechner die ich immer syncen muss, da is ein zig GB großer index suboptimal.
auf rechnern mit ssd oder netbook will ichs dann gar nicht bzw geht wegen leistung eh nicht.
aber wenn ich alle daten die so indexiert werden solln auf einen server verschieben kann der mir den dienst anbietet, event sogar rechnerübergreifend, daten + imap mailserver, dann solls mir recht sein. (das man dazu die infrstatrucktur bracht is klar )
aber einen lokalen dienst, der tage lang gebaut werden muss, und dann mehr ärger verursacht als er wert ist ist eine typische kde entwickler sache.
mach ma was geniales, wie genial das ist verstehen zwar nur wir, aber zwangsbeglücken wir mal alle damit, wurscht obs brauchbar funktinoiert.
ähnlich diesem mail über alles hinwegsyncronisieren was per default genau fast niemand braucht, aber ein ordentliches funktionieren und einen brauchbaren eindruck langfristig verhindert.
dafür tonnen an abhänigkeiten für ein feature welches wenn dann nur optional einschaltbar vorhanden sein dürfte.
Die Idee hinter Nepomuk gefällt mir sehr, doch ich glaube es wird noch einige Zeit dauern, bis es ausgereift genug für mein System ist.
Lange Zeit habe ich nach dem Speicherfresser bei mir gesucht und stieß dann auf Nepomuk, trotz 8GB RAM wird er aufgrund der enormen Datenmenge extrem langsam beim Indexieren und auch beim Aktualisieren.
Aber ich glaube an Nepomuk und hoffe ich kann es bald sinnvoll einsetzen (und das andere Programme auch Nepomuk zur Unterstützung verwenden).
Was mir noch stark bei Nepomuk fehlt: eine Art Ablage der Info's in den zugehörigen Verzeichnissen.
Ich gebe da mal meine unqualifizierte Meinung ab:
Für mich ist Nepomuk derzeit semantischer Schmand.
Ich kann mir nicht vorstellen das ich auf meinem kleinen Desktoprechner die Übersicht bei den Dateien verliere. Ich könnte mir vorstellen das man auf großen (Internet-) Servern so eine Suchmaschine braucht.
Mir reicht eine aktuelle locatedb derzeit völlig aus.
Wer seine Dateien ordentlich strukturiert braucht einen Indexer tatsächlich kaum. Bei mir ist das so, ich habe Strigi daher abgeschaltet.
Mit Nepomuk hat das ziemlich wenig zu tun, außer dass Strigi eben seine Ergebnisse - wie alle anderen - in Nepomuk ablegt und diese dann über die gleiche Schnittstelle zugänglich sind.
Viel interessanter und wichtiger ist das programmübergreifende Tagging, das Nepomuk ermöglicht. Ich möchte es wirklich nicht mehr missen. Das Ziel von Tagging ist nicht Dateien zu finden, sondern zu gruppieren und zu filtern. Wenn ich z.B. ein bestimmtes Foto von jemandem suche, brauche ich keine Hilfe, das zu finden. Möchte ich aber alle Fotos des letzten halben Jahres von ihr, unabhängig wann und wo aufgenommen und auf denen sie etwas bestimmtes anhat, finden, wird es schon schwieriger. Mit Tags ist das sehr leicht (wenn man sich jedesmal kurz die Zeit nimmt, neue Bilder zu taggen). Es spielt keine Rolle, ob ich die Tags in Digikam oder Gwenview gesetzt habe oder einfach mit Dolphin. Und ich kann auch sehen, welche Bilder ich schon verschickt habe und welche nicht, ohne das irgendwo extra festzuhalten (oder gar die ganzen Mails aufzubewahren).
Die Integration von Nepomuk in eigene Programme ist auch gut gelöst, so dass früher oder später die meisten Anwendungen es nicht nur unterstützen, sondern auch aktiv nutzen werden.
"Möchte ich aber alle Fotos des letzten halben Jahres von"
Da gibt es nur ein Problem:
Linux (wie Unix) merkt sich das originale Erstellungsdatum der einzelnen Dateien gar nicht.
Nur ein einziges nachträgliches Bearbeiten z.B. einer Bilddatei (mit natürlich notwendigem erneuten Abspeichern) und die datumsmäßige Einordnung stimmt nicht mehr, da Linux für die erneut abgespeicherte Datei das aktuelle Datum als Erstellungsdatum übernimmt. Das originale Erstellungsdatum ist dann verloren.
Wie geht denn Nepomuk mit diesem Problem um?
Speichert Nepomuk das erstmalige "Auftreten" einer solchen Datei auf dem Rechnersystem ab, unabhängig vom laufenden Linux-Betriebssystem?
> Wie geht denn Nepomuk mit diesem Problem um?
Indem es die EXIF-Daten einer Bilddatei benutzt.
Das große Problem an Nepomuk ist weniger die Technik, es ist eher die Disziplin des Benutzers. Mit Disziplin meine ich folgendes (Beispiel sind hier Bilddateien) :
Der Benutzer muss immer das Datum und die Uhrzeit in der Kamera korrekt einstellen. Viele Benutzer vergessen z.B. nach einem Batteriewechsel diese wieder korrekt einzustellen. Stimmen diese schon in der Kamera nicht, dann kann man das Tagging gleich bleiben lassen.
Der Benutzer muss nach einem Kopieren der Bilddateien auf den Computer, diese mit dem passenden Programm korrekt taggen. Das kostet Zeit und nicht jeder macht sich die Mühe z.B. alle 1000 Fotos aus dem Urlaub richtig zu taggen. Meisten endet es wie bei der analogen Fotografie :
Man schaut sich die Fotos einmal an und dann landen sie unsortiert in einem Schuhkarton.
Bevor mir jetzt jemand sagen will, dass das Taggen von Fotos doch gar nicht so aufwendig ist und gar kein Problem darstellt :
Bei 90% (ach was, 99%) der Computerbenutzer sieht der Computer aus wie eine Messie-Wohnung. Ich kenne Leute, bei denen man vom Fußboden essen kann, aber wehe man schaut sich mal den Computer an :
Das kleinste Übel sind da noch die zig Toolbars, die den Browser verschandeln. Dateien werden kreuz und quer abgespeichert (Unter "C:\", auf dem Desktop, im Programmverzeichnis (!) usw.). Da hilft auch der beste Indexer und Semantic-Desktop nichts. Ein Bekannter von mir, hat einmal zwei Tage (!) benötigt um eine bestimmte Datei wiederzufinden. Und er hatte den Index-Dienst von Windows XP laufen. Nur wenn der Indexer mit dem Inhalt nichts anfangen kann (War eine CorelDraw-Datei) und diese dann unter "C:\WINDOWS" mit einer falschen Dateiendung abgespeichert wurde, dann kann einem auch keine SuFu mehr helfen.
> Der Benutzer muss immer das Datum und die Uhrzeit in der Kamera korrekt einstellen. Viele Benutzer vergessen z.B. nach einem Batteriewechsel diese wieder korrekt einzustellen.
Das sollte eigentlich nicht sein. Kameras haben eine eingebaute Minibatterie, die auch nach einem Akkuwechsel die Zeit hält. Keine Ahnung, wie lange genau, aber ich hatte schon mehr als eine Woche lang keinen Akku in der Kamera und die Zeit stimmt immer noch sekundengenau. Ich habe die Kamera mit korrekter Zeit gekauft und nie stellen müssen.
> Der Benutzer muss nach einem Kopieren der Bilddateien auf den Computer, diese mit dem passenden Programm korrekt taggen.
> Das kostet Zeit und nicht jeder macht sich die Mühe z.B. alle 1000 Fotos aus dem Urlaub richtig zu taggen.
> Man schaut sich die Fotos einmal an und dann landen sie unsortiert in einem Schuhkarton.
> Bevor mir jetzt jemand sagen will, dass das Taggen von Fotos doch gar nicht so aufwendig ist und gar kein Problem darstellt :
Ich schaue mir viele Bilder auch nur einmal an und dann vielleicht Monate später nochmal. Ich tagge gleich beim ersten Durchsehen, da habe ich's weg und da ist auch die Erinnerung noch frisch. Mit passenden Programmen wie Digikam aber auch einfach Dolphin oder Gwenview ist es überhaupt kein Problem, ein paar hundert Bilder in wenigen Minuten durchzusehen und nebenbei zu taggen, das meiste sind ja ohnehin Doubletten. Das ist gar keine Arbeit, denn man will sich die Bilder ja sowieso wenigstens einmal ansehen.
> Ich habe die Kamera mit korrekter Zeit gekauft und nie stellen müssen.
Gratuliere! Meine Fuji vergisst alles, wenn der Akku mal leer wird und/oder gewechselt werden muss.
Aber mal zurück zum Thema:
Ein semantisches System rechtfertigt seinen Ressourcenverbrauch nur dann, wenn es Dateien auch findet, wenn sie der Nutzer nicht getaggt hat.
Beispiel: man bearbeitet und taggt 1 Bild aus einer Serie, sucht später nach dem tag, das man vergeben hat und der semantische Suchbot fragt freundlichst, ob man die anderen Bilder aus dieser Serie auch sehen möchte.
Ach so: und weist bei der Gelegenheit darauf hin, dass 5 Bilder aus der Serie vor zwei Wochen auf eine USB-Fressplatte verschoben wurden.
Alles andere wäre bloß eine Art locate mit tags...
Dieser Beitrag wurde 1 mal editiert. Zuletzt am 12. Dez 2010 um 17:39.> Ein semantisches System rechtfertigt seinen Ressourcenverbrauch nur dann, wenn es Dateien auch findet, wenn sie der Nutzer nicht getaggt hat.
Das ist gar nicht Sinn der Sache. Nepomuk verwaltet die Tags, die vom Benutzer gesetzt werden. Nicht mehr und nicht weniger. Das hat auch nichts mit Dateien zu tun, Tags können z.B. auch an Kontakte im Adressbuch, URLs oder Einträge in einem IRC-Log vergeben werden. Dass es für Dateien geht, ist mehr oder weniger ein "Nebeneffekt" (ok, es ist der meistgenutze Fall). Für die Dateisuche sind andere Programme zuständig, z.B. Strigi für Inhalte und locate nach Dateinahmen.
Der Ressourcenverbrauch ist auch nicht übermäßig, Nepomuk und Akonadi zusammen benötigen bei mir ca. 128MB RAM (KDE 4.6 Beta 2) mit mehreren zehntausend Mails in meinem IMAP und etwa 200 abbonierten Newsgroups. Virtuoso hat nach 24h Login etwa 9min CPU verbraucht, MySQL ungefähr eine Minute und der Rest jeweils unter 30s. Als einziger fällt der Digikam-Nepomukservice aus dem Rahmen mit knapp 40min.
> Das ist gar nicht Sinn der Sache. Nepomuk verwaltet die Tags, die vom Benutzer gesetzt werden. Nicht mehr und nicht weniger.
Prinzipiell ist aber in der Technik (zusammen mit virtuoso, strigi etc) deutlich mehr angelegt. Wozu sollte man sich mit so komplexen Konstrukten wie Ontologie-Verknüpfungen und Schlussfolgerungen einlassen, wenn am Horizont nicht wenigstens erste Schritte in Richtung künstliche Intelligenz winken würden?
Tags könnte man in einer simplen, old-school Relationalen Datenbank viel effizienter verwalten.
> Dass es für Dateien geht, ist mehr oder weniger ein "Nebeneffekt"
Na gut, aus Sicht des Nutzers ist ein Datensatz aus einer Datenbanktabelle auch eine Art "Datei" (genauso, wie technisch gesehen eine Datei ein Datensatz aus einer Dateisystem-Datenbank ist). Natürlich ist eine E-Mail meistens keine Datei aber für den Nutzer ist sie eine und man kann sie ja auch als Datei speichern.
Letztlich ist es auch konzeptionell gleichgültig. Es geht darum, dem Nutzer und der Nutzerin Datensätze, die sie gerade brauchen, auf Anfrage zur Verfügung zu stellen.
Das könnte man auch sehr konventionell haben:
1.) locate sucht nach Dateien
2.) geeignete Module durchsuchen existierende Datenbanken von Digikam, Thunderbird, Amarok, Adressbüchern, online(Freesound, Wikipedia, dict, etc etc)
3.) eventuell läuft locate nochmal mit den Treffern, die Dateinamen referenzieren
4.) Alles hübsch darstellen, fertig.
Alles *ohne* eigenen Indizierungs-Mechanismus.
Läuft nur, wenn angefordert.
Kann mit Plugins beliebig erweitert werden
Das würde bestimmt vielen besser gefallen als die Nepomuk-Krake. Soviel ich davon gelesen habe, kann aber Nepomuk prinzipiell mehr als das.
Dieser Beitrag wurde 1 mal editiert. Zuletzt am 12. Dez 2010 um 22:44.