"Möchte ich aber alle Fotos des letzten halben Jahres von"
Da gibt es nur ein Problem: Linux (wie Unix) merkt sich das originale Erstellungsdatum der einzelnen Dateien gar nicht. Nur ein einziges nachträgliches Bearbeiten z.B. einer Bilddatei (mit natürlich notwendigem erneuten Abspeichern) und die datumsmäßige Einordnung stimmt nicht mehr, da Linux für die erneut abgespeicherte Datei das aktuelle Datum als Erstellungsdatum übernimmt. Das originale Erstellungsdatum ist dann verloren. Wie geht denn Nepomuk mit diesem Problem um? Speichert Nepomuk das erstmalige "Auftreten" einer solchen Datei auf dem Rechnersystem ab, unabhängig vom laufenden Linux-Betriebssystem?
Das große Problem an Nepomuk ist weniger die Technik, es ist eher die Disziplin des Benutzers. Mit Disziplin meine ich folgendes (Beispiel sind hier Bilddateien) :
Der Benutzer muss immer das Datum und die Uhrzeit in der Kamera korrekt einstellen. Viele Benutzer vergessen z.B. nach einem Batteriewechsel diese wieder korrekt einzustellen. Stimmen diese schon in der Kamera nicht, dann kann man das Tagging gleich bleiben lassen.
Der Benutzer muss nach einem Kopieren der Bilddateien auf den Computer, diese mit dem passenden Programm korrekt taggen. Das kostet Zeit und nicht jeder macht sich die Mühe z.B. alle 1000 Fotos aus dem Urlaub richtig zu taggen. Meisten endet es wie bei der analogen Fotografie :
Man schaut sich die Fotos einmal an und dann landen sie unsortiert in einem Schuhkarton.
Bevor mir jetzt jemand sagen will, dass das Taggen von Fotos doch gar nicht so aufwendig ist und gar kein Problem darstellt :
Bei 90% (ach was, 99%) der Computerbenutzer sieht der Computer aus wie eine Messie-Wohnung. Ich kenne Leute, bei denen man vom Fußboden essen kann, aber wehe man schaut sich mal den Computer an :
Das kleinste Übel sind da noch die zig Toolbars, die den Browser verschandeln. Dateien werden kreuz und quer abgespeichert (Unter "C:\", auf dem Desktop, im Programmverzeichnis (!) usw.). Da hilft auch der beste Indexer und Semantic-Desktop nichts. Ein Bekannter von mir, hat einmal zwei Tage (!) benötigt um eine bestimmte Datei wiederzufinden. Und er hatte den Index-Dienst von Windows XP laufen. Nur wenn der Indexer mit dem Inhalt nichts anfangen kann (War eine CorelDraw-Datei) und diese dann unter "C:\WINDOWS" mit einer falschen Dateiendung abgespeichert wurde, dann kann einem auch keine SuFu mehr helfen.
> Der Benutzer muss immer das Datum und die Uhrzeit in der Kamera korrekt einstellen. Viele Benutzer vergessen z.B. nach einem Batteriewechsel diese wieder korrekt einzustellen.
Das sollte eigentlich nicht sein. Kameras haben eine eingebaute Minibatterie, die auch nach einem Akkuwechsel die Zeit hält. Keine Ahnung, wie lange genau, aber ich hatte schon mehr als eine Woche lang keinen Akku in der Kamera und die Zeit stimmt immer noch sekundengenau. Ich habe die Kamera mit korrekter Zeit gekauft und nie stellen müssen.
> Der Benutzer muss nach einem Kopieren der Bilddateien auf den Computer, diese mit dem passenden Programm korrekt taggen. > Das kostet Zeit und nicht jeder macht sich die Mühe z.B. alle 1000 Fotos aus dem Urlaub richtig zu taggen. > Man schaut sich die Fotos einmal an und dann landen sie unsortiert in einem Schuhkarton. > Bevor mir jetzt jemand sagen will, dass das Taggen von Fotos doch gar nicht so aufwendig ist und gar kein Problem darstellt :
Ich schaue mir viele Bilder auch nur einmal an und dann vielleicht Monate später nochmal. Ich tagge gleich beim ersten Durchsehen, da habe ich's weg und da ist auch die Erinnerung noch frisch. Mit passenden Programmen wie Digikam aber auch einfach Dolphin oder Gwenview ist es überhaupt kein Problem, ein paar hundert Bilder in wenigen Minuten durchzusehen und nebenbei zu taggen, das meiste sind ja ohnehin Doubletten. Das ist gar keine Arbeit, denn man will sich die Bilder ja sowieso wenigstens einmal ansehen.
Von zettberlin am So, 12. Dezember 2010 um 17:38 #
> Ich habe die Kamera mit korrekter Zeit gekauft und nie stellen müssen.
Gratuliere! Meine Fuji vergisst alles, wenn der Akku mal leer wird und/oder gewechselt werden muss.
Aber mal zurück zum Thema:
Ein semantisches System rechtfertigt seinen Ressourcenverbrauch nur dann, wenn es Dateien auch findet, wenn sie der Nutzer nicht getaggt hat.
Beispiel: man bearbeitet und taggt 1 Bild aus einer Serie, sucht später nach dem tag, das man vergeben hat und der semantische Suchbot fragt freundlichst, ob man die anderen Bilder aus dieser Serie auch sehen möchte. Ach so: und weist bei der Gelegenheit darauf hin, dass 5 Bilder aus der Serie vor zwei Wochen auf eine USB-Fressplatte verschoben wurden.
Alles andere wäre bloß eine Art locate mit tags...
Dieser Beitrag wurde 1 mal editiert. Zuletzt am 12. Dez 2010 um 17:39.
> Ein semantisches System rechtfertigt seinen Ressourcenverbrauch nur dann, wenn es Dateien auch findet, wenn sie der Nutzer nicht getaggt hat.
Das ist gar nicht Sinn der Sache. Nepomuk verwaltet die Tags, die vom Benutzer gesetzt werden. Nicht mehr und nicht weniger. Das hat auch nichts mit Dateien zu tun, Tags können z.B. auch an Kontakte im Adressbuch, URLs oder Einträge in einem IRC-Log vergeben werden. Dass es für Dateien geht, ist mehr oder weniger ein "Nebeneffekt" (ok, es ist der meistgenutze Fall). Für die Dateisuche sind andere Programme zuständig, z.B. Strigi für Inhalte und locate nach Dateinahmen. Der Ressourcenverbrauch ist auch nicht übermäßig, Nepomuk und Akonadi zusammen benötigen bei mir ca. 128MB RAM (KDE 4.6 Beta 2) mit mehreren zehntausend Mails in meinem IMAP und etwa 200 abbonierten Newsgroups. Virtuoso hat nach 24h Login etwa 9min CPU verbraucht, MySQL ungefähr eine Minute und der Rest jeweils unter 30s. Als einziger fällt der Digikam-Nepomukservice aus dem Rahmen mit knapp 40min.
Von zettberlin am So, 12. Dezember 2010 um 22:42 #
> Das ist gar nicht Sinn der Sache. Nepomuk verwaltet die Tags, die vom Benutzer gesetzt werden. Nicht mehr und nicht weniger.
Prinzipiell ist aber in der Technik (zusammen mit virtuoso, strigi etc) deutlich mehr angelegt. Wozu sollte man sich mit so komplexen Konstrukten wie Ontologie-Verknüpfungen und Schlussfolgerungen einlassen, wenn am Horizont nicht wenigstens erste Schritte in Richtung künstliche Intelligenz winken würden?
Tags könnte man in einer simplen, old-school Relationalen Datenbank viel effizienter verwalten.
> Dass es für Dateien geht, ist mehr oder weniger ein "Nebeneffekt"
Na gut, aus Sicht des Nutzers ist ein Datensatz aus einer Datenbanktabelle auch eine Art "Datei" (genauso, wie technisch gesehen eine Datei ein Datensatz aus einer Dateisystem-Datenbank ist). Natürlich ist eine E-Mail meistens keine Datei aber für den Nutzer ist sie eine und man kann sie ja auch als Datei speichern.
Letztlich ist es auch konzeptionell gleichgültig. Es geht darum, dem Nutzer und der Nutzerin Datensätze, die sie gerade brauchen, auf Anfrage zur Verfügung zu stellen. Das könnte man auch sehr konventionell haben:
1.) locate sucht nach Dateien 2.) geeignete Module durchsuchen existierende Datenbanken von Digikam, Thunderbird, Amarok, Adressbüchern, online(Freesound, Wikipedia, dict, etc etc) 3.) eventuell läuft locate nochmal mit den Treffern, die Dateinamen referenzieren 4.) Alles hübsch darstellen, fertig.
Alles *ohne* eigenen Indizierungs-Mechanismus. Läuft nur, wenn angefordert. Kann mit Plugins beliebig erweitert werden
Das würde bestimmt vielen besser gefallen als die Nepomuk-Krake. Soviel ich davon gelesen habe, kann aber Nepomuk prinzipiell mehr als das.
Dieser Beitrag wurde 1 mal editiert. Zuletzt am 12. Dez 2010 um 22:44.
"Möchte ich aber alle Fotos des letzten halben Jahres von"
Da gibt es nur ein Problem:
Linux (wie Unix) merkt sich das originale Erstellungsdatum der einzelnen Dateien gar nicht.
Nur ein einziges nachträgliches Bearbeiten z.B. einer Bilddatei (mit natürlich notwendigem erneuten Abspeichern) und die datumsmäßige Einordnung stimmt nicht mehr, da Linux für die erneut abgespeicherte Datei das aktuelle Datum als Erstellungsdatum übernimmt. Das originale Erstellungsdatum ist dann verloren.
Wie geht denn Nepomuk mit diesem Problem um?
Speichert Nepomuk das erstmalige "Auftreten" einer solchen Datei auf dem Rechnersystem ab, unabhängig vom laufenden Linux-Betriebssystem?
> Wie geht denn Nepomuk mit diesem Problem um?
Indem es die EXIF-Daten einer Bilddatei benutzt.
Das große Problem an Nepomuk ist weniger die Technik, es ist eher die Disziplin des Benutzers. Mit Disziplin meine ich folgendes (Beispiel sind hier Bilddateien) :
Der Benutzer muss immer das Datum und die Uhrzeit in der Kamera korrekt einstellen. Viele Benutzer vergessen z.B. nach einem Batteriewechsel diese wieder korrekt einzustellen. Stimmen diese schon in der Kamera nicht, dann kann man das Tagging gleich bleiben lassen.
Der Benutzer muss nach einem Kopieren der Bilddateien auf den Computer, diese mit dem passenden Programm korrekt taggen. Das kostet Zeit und nicht jeder macht sich die Mühe z.B. alle 1000 Fotos aus dem Urlaub richtig zu taggen. Meisten endet es wie bei der analogen Fotografie :
Man schaut sich die Fotos einmal an und dann landen sie unsortiert in einem Schuhkarton.
Bevor mir jetzt jemand sagen will, dass das Taggen von Fotos doch gar nicht so aufwendig ist und gar kein Problem darstellt :
Bei 90% (ach was, 99%) der Computerbenutzer sieht der Computer aus wie eine Messie-Wohnung. Ich kenne Leute, bei denen man vom Fußboden essen kann, aber wehe man schaut sich mal den Computer an :
Das kleinste Übel sind da noch die zig Toolbars, die den Browser verschandeln. Dateien werden kreuz und quer abgespeichert (Unter "C:\", auf dem Desktop, im Programmverzeichnis (!) usw.). Da hilft auch der beste Indexer und Semantic-Desktop nichts. Ein Bekannter von mir, hat einmal zwei Tage (!) benötigt um eine bestimmte Datei wiederzufinden. Und er hatte den Index-Dienst von Windows XP laufen. Nur wenn der Indexer mit dem Inhalt nichts anfangen kann (War eine CorelDraw-Datei) und diese dann unter "C:\WINDOWS" mit einer falschen Dateiendung abgespeichert wurde, dann kann einem auch keine SuFu mehr helfen.
> Der Benutzer muss immer das Datum und die Uhrzeit in der Kamera korrekt einstellen. Viele Benutzer vergessen z.B. nach einem Batteriewechsel diese wieder korrekt einzustellen.
Das sollte eigentlich nicht sein. Kameras haben eine eingebaute Minibatterie, die auch nach einem Akkuwechsel die Zeit hält. Keine Ahnung, wie lange genau, aber ich hatte schon mehr als eine Woche lang keinen Akku in der Kamera und die Zeit stimmt immer noch sekundengenau. Ich habe die Kamera mit korrekter Zeit gekauft und nie stellen müssen.
> Der Benutzer muss nach einem Kopieren der Bilddateien auf den Computer, diese mit dem passenden Programm korrekt taggen.
> Das kostet Zeit und nicht jeder macht sich die Mühe z.B. alle 1000 Fotos aus dem Urlaub richtig zu taggen.
> Man schaut sich die Fotos einmal an und dann landen sie unsortiert in einem Schuhkarton.
> Bevor mir jetzt jemand sagen will, dass das Taggen von Fotos doch gar nicht so aufwendig ist und gar kein Problem darstellt :
Ich schaue mir viele Bilder auch nur einmal an und dann vielleicht Monate später nochmal. Ich tagge gleich beim ersten Durchsehen, da habe ich's weg und da ist auch die Erinnerung noch frisch. Mit passenden Programmen wie Digikam aber auch einfach Dolphin oder Gwenview ist es überhaupt kein Problem, ein paar hundert Bilder in wenigen Minuten durchzusehen und nebenbei zu taggen, das meiste sind ja ohnehin Doubletten. Das ist gar keine Arbeit, denn man will sich die Bilder ja sowieso wenigstens einmal ansehen.
> Ich habe die Kamera mit korrekter Zeit gekauft und nie stellen müssen.
Gratuliere! Meine Fuji vergisst alles, wenn der Akku mal leer wird und/oder gewechselt werden muss.
Aber mal zurück zum Thema:
Ein semantisches System rechtfertigt seinen Ressourcenverbrauch nur dann, wenn es Dateien auch findet, wenn sie der Nutzer nicht getaggt hat.
Beispiel: man bearbeitet und taggt 1 Bild aus einer Serie, sucht später nach dem tag, das man vergeben hat und der semantische Suchbot fragt freundlichst, ob man die anderen Bilder aus dieser Serie auch sehen möchte.
Ach so: und weist bei der Gelegenheit darauf hin, dass 5 Bilder aus der Serie vor zwei Wochen auf eine USB-Fressplatte verschoben wurden.
Alles andere wäre bloß eine Art locate mit tags...
Dieser Beitrag wurde 1 mal editiert. Zuletzt am 12. Dez 2010 um 17:39.> Ein semantisches System rechtfertigt seinen Ressourcenverbrauch nur dann, wenn es Dateien auch findet, wenn sie der Nutzer nicht getaggt hat.
Das ist gar nicht Sinn der Sache. Nepomuk verwaltet die Tags, die vom Benutzer gesetzt werden. Nicht mehr und nicht weniger. Das hat auch nichts mit Dateien zu tun, Tags können z.B. auch an Kontakte im Adressbuch, URLs oder Einträge in einem IRC-Log vergeben werden. Dass es für Dateien geht, ist mehr oder weniger ein "Nebeneffekt" (ok, es ist der meistgenutze Fall). Für die Dateisuche sind andere Programme zuständig, z.B. Strigi für Inhalte und locate nach Dateinahmen.
Der Ressourcenverbrauch ist auch nicht übermäßig, Nepomuk und Akonadi zusammen benötigen bei mir ca. 128MB RAM (KDE 4.6 Beta 2) mit mehreren zehntausend Mails in meinem IMAP und etwa 200 abbonierten Newsgroups. Virtuoso hat nach 24h Login etwa 9min CPU verbraucht, MySQL ungefähr eine Minute und der Rest jeweils unter 30s. Als einziger fällt der Digikam-Nepomukservice aus dem Rahmen mit knapp 40min.
> Das ist gar nicht Sinn der Sache. Nepomuk verwaltet die Tags, die vom Benutzer gesetzt werden. Nicht mehr und nicht weniger.
Prinzipiell ist aber in der Technik (zusammen mit virtuoso, strigi etc) deutlich mehr angelegt. Wozu sollte man sich mit so komplexen Konstrukten wie Ontologie-Verknüpfungen und Schlussfolgerungen einlassen, wenn am Horizont nicht wenigstens erste Schritte in Richtung künstliche Intelligenz winken würden?
Tags könnte man in einer simplen, old-school Relationalen Datenbank viel effizienter verwalten.
> Dass es für Dateien geht, ist mehr oder weniger ein "Nebeneffekt"
Na gut, aus Sicht des Nutzers ist ein Datensatz aus einer Datenbanktabelle auch eine Art "Datei" (genauso, wie technisch gesehen eine Datei ein Datensatz aus einer Dateisystem-Datenbank ist). Natürlich ist eine E-Mail meistens keine Datei aber für den Nutzer ist sie eine und man kann sie ja auch als Datei speichern.
Letztlich ist es auch konzeptionell gleichgültig. Es geht darum, dem Nutzer und der Nutzerin Datensätze, die sie gerade brauchen, auf Anfrage zur Verfügung zu stellen.
Das könnte man auch sehr konventionell haben:
1.) locate sucht nach Dateien
2.) geeignete Module durchsuchen existierende Datenbanken von Digikam, Thunderbird, Amarok, Adressbüchern, online(Freesound, Wikipedia, dict, etc etc)
3.) eventuell läuft locate nochmal mit den Treffern, die Dateinamen referenzieren
4.) Alles hübsch darstellen, fertig.
Alles *ohne* eigenen Indizierungs-Mechanismus.
Läuft nur, wenn angefordert.
Kann mit Plugins beliebig erweitert werden
Das würde bestimmt vielen besser gefallen als die Nepomuk-Krake. Soviel ich davon gelesen habe, kann aber Nepomuk prinzipiell mehr als das.
Dieser Beitrag wurde 1 mal editiert. Zuletzt am 12. Dez 2010 um 22:44.