Im Vergleich zu Abbyy Finereader oder jedem anderen kommerziellen OCR-Programm taugen die freien Programme fast gar nichts. Hier mal ein Link zu einem Vergleich der einzelnen Programme:
Danke für den Link. Das Ergebnis sieht ja wirklich nicht sonderlich gut aus für die OpenSource Varianten. Hätte aber auch nicht gedacht, dass die kommerzielle Varianten bei Handschriften so dermassen versagt.
Traue nie eine Statistik, welch du nicht selbst fälschest
Die Ergebnisse kann ich jedenfalls nicht nachvollziehen:
cuneiform uind tesseract bringen bei mir, A4-Seite schwarz/weiss, ohne Tabelle, Bilder,etc, 300dpi-Scann, 10er Schrift, eine ähnliche Erkennung von 95%.
Dagegen ist es mir nie gelungen, ocrad zu einem Ergebnis von mehr als 20% zu bewegen.
Drastisch unterschieden sich auch die tesserakt-Egebisse einer gleichen Version zwischen openSuse und Mandriva. Die von mir getestet Suse-Version war ebenfalls unbrachbar...
funktionieren Ocropus, Tesseract, Gocr, Ocrad schlecht?
bin auf der suche nach einem für pdfs.
Im Vergleich zu Abbyy Finereader oder jedem anderen kommerziellen OCR-Programm taugen die freien Programme fast gar nichts. Hier mal ein Link zu einem Vergleich der einzelnen Programme:
http://www.splitbrain.org/blog/2010-06/15-linux_ocr_software_comparison
Danke für den Link. Das Ergebnis sieht ja wirklich nicht sonderlich gut aus für die OpenSource Varianten. Hätte aber auch nicht gedacht, dass die kommerzielle Varianten bei Handschriften so dermassen versagt.
Traue nie eine Statistik, welch du nicht selbst fälschest
Die Ergebnisse kann ich jedenfalls nicht nachvollziehen:
cuneiform uind tesseract bringen bei mir, A4-Seite schwarz/weiss, ohne Tabelle, Bilder,etc, 300dpi-Scann, 10er Schrift, eine ähnliche Erkennung von 95%.
Dagegen ist es mir nie gelungen, ocrad zu einem Ergebnis von mehr als 20% zu bewegen.
Drastisch unterschieden sich auch die tesserakt-Egebisse einer gleichen Version zwischen openSuse und Mandriva. Die von mir getestet Suse-Version war ebenfalls unbrachbar...
have a lot of fun
joex
Vielleicht fehlte bei der openSUSE-Version das deutsche Sprachpaket?
Oder aber die falsche Sprachversion war als Standard eingestellt?
In Debian Squeeze z.B. ist das übersichtlicher, da hier das Hauptprogramm und die jeweiligen Sprachpakete gesplittet wurden.
Ich verwende YAGF mit Cuneiform:
http://symmetrica.net/cuneiform-linux/yagf-en.html
Funktioniert bestens und kostet nichts.
Hi Peter345, danke für den Tipp. Ich habe YAGF (mitsamt einigen Aspell-Wörterbüchern) installiert. Die Ergebnisse lassen sich in der Tag sehen!
Gibt es auch einen Trick daraus durchsuchbare PDFs zu erstellen?