>Das Produkt "OCR Shop" basiert derzeit noch auf OmniPage. Ich hoffe mal das die zukünftigen Versionen besser werden. OmniPage hat nur noch ein Namen und das Ergebnis ist ja miserabel. Mich würde eine FineReader version fuer Linux interessieren. Würde ich glatt kaufen. Und bei dem kann man sich sicher sein, das bei den Sprachen die unterstüzt werden auch gute Ergebnisse geliefert bekomm kann.
Yup OmniPage war mal. Der FineReader benutzt ein neues verfahren, die keiner der anderen OCR Programme verwendet. ScanSoft stellt Textbridge Pro 98 her, und der ist -auch wenn es nicht an FineReader rankommt- um einiges besser als OmniPage.
Mal sehen, was aus den 5-6 GPL OCR Programmen wird(die man im Netz finden kann), wenn sie mal in Version 1.0 erscheinen.
Bis jetzt konnte mich kein OCR-Programm überzeugen. Das schlechteste was ich mal unter den Fingern hatte, war diese Beigabe zur CorelDraw. Finereader scheint wohl ein anderes Kaliber zu sein? Wie auch immer hier geht es ja wohl um die Omnipage-Engine - also was für die Tonne
Diese Beigabe zu Corel-Draw ist IMHO etwas vom besten auf dem Markt. Allerdings ist es nicht dafür gedacht, Texte zu erkennen, sondern Bitmap-Bilder in Vektorbilder umzuwandeln. Damit kannst du z.B. ein Comic einscannen und jeden Strich später wirklich als Strich bearbeiten. Und für diesen Zweck ist es besser geeignet als alle anderen. Ausser vielleicht Adobe Streamline. Klar, in Text sind beide sehr schwach. Das Verfahren ist aber auch grundlegend anders. Dass man beide Programmarten mit OCR bezeichnet hat sich halt leider so ergeben.
Was genau ist eigentlich der praktische Nutzen? Warum soll ich etwas von Hand schreiben, wenn es doch Tastaturen gibt? Oder kann ich damit auch den hangekritzelten Einkaufszettel meiner Mutter einlesen? Oder verstehe ich das ueberhaupt ganz falsch?
Die meisten werden wohl OCR nicht brauchen. Ein gutes Einsatzgebiet wären z.B. Zeitungsartikel. Man muss diese dann nicht umständlich abtippen und die Bilder einzeln scannen. OCR versucht aus den Pixeln ASCI-Zeichen zu erkennen und natürlich auch den dazugehörigen Font mit Attributen, die dann natürlich mit jeder Textverarbeitung weiterverarbeitet werden können. Einige OCR-Tools können sogar aus Bitmap-Graphiken Vectorgraphiken erzeugen. Allerdings sollte ein "A" auch möglichst wie ein symetrisch geschriebenes "A" aussehen. Der Bereich der Handschriftenerkennung ist sozusagen die Königsdisziplin der OCR. Damit könnte man auch selbstgeschriebene Einkaufszettel einlesen. Diese Tools müssen allerdings "angelernt" werden, damit sie wissen was derjenige unter einem "A" versteht.
Das sehe ich überhaupt nicht so. Gerade im Journalistischen Bereich oder in der Schule im Deutschunterricht etc., also in den Berufen, in denen man mit Texten zu tun hat ist man auf OCR doch ständig angewiesen. Ich habe es immer als Nachteil empfunden, dass ich nur wegen OCR auf M$ Windows angewiesen bin. Das ist eine der wenigen Anwendungen, für die es unter Linux (bis jetzt) keine Lösung gibt, oder irre ich?
Solche Programme können Schreibmaschinen Texte erkennen und einlesen, inklusive Bildern, Tabellen und Formatierungen. Das ist extrem praktisch, im idealfall hast du die exakt gleiche Seite aber diesmal als Bearbeitbares Dokument alsd ergebniss. Handgeschrieben ist ein Problem, du musst schon eine besondere Handschrift haben damit das gut geht ;)
Wenn du oft Dokumente als Ausdruck bekommst die du Archivieren möchtest merkst du: Abtippen ist aufwendig :)
? Ich habe eben als ich auf senden ging eine Meldung bekommen :"Der Kommentar auf den Sie antworten wollen existiert nicht mehr". Board spinnt wieder?
Ah, das klingt ja doch sinnvoll. Hm... Das Boardproblem hab ich auch im Progenythread, da kann ich auf einen Beitrag nicht antworten, weil der angeblich geloescht sei...
Na wollen wir mal hoffen, dass dann auch mehr (USB-)Scanner unterstützt werden, wenn es erstmal die Software dafür gibt... Mein Canon FB630U steht nämlich zurzeit nur rum und kann nicht verwendet werden, weil es keine Treiber dafür gibt (Canon entwickelt keine Treiber und rückt auch keine Spezifikationen raus)...
Fine Reader soll auch Handschriften erkennen, aber ich denke nur wenn man gleichmäßig schreibt. Die Software kostet allerdings richtig Geld ich denke so um die 700 DM. In irgendeiner Comp Zeitschrift stand das USB langsam, CD Rom 6 fach das ist beim Scannen zu lange.
SANE dient unter Linux als Ersatz für die Twain-Treiber unter Windows und unterstützen eine vielzahl von Scannern.
Doch Vividata verwendet seine eigenen, unabhängigen Scanner-Module, die nur für deren Produkte geeignet sind. Es werden deutlich weniger Scanner unterstützt; fast ausschließlich SCSI-Modelle und mit Parallelportscannern hat man totales Pech.
Wieso können die nicht wie jede Open-Source Anwendung das SANE-API zum Scannen verwenden?
Ich hoffe mal das die zukünftigen Versionen besser werden.
OmniPage hat nur noch ein Namen und das Ergebnis ist ja miserabel.
Mich würde eine FineReader version fuer Linux interessieren. Würde ich glatt kaufen.
Und bei dem kann man sich sicher sein, das bei den Sprachen die unterstüzt werden auch gute Ergebnisse geliefert bekomm kann.
Der FineReader benutzt ein neues verfahren, die keiner der anderen OCR Programme verwendet.
ScanSoft stellt Textbridge Pro 98 her, und der ist -auch wenn es nicht an FineReader rankommt- um einiges besser als OmniPage.
Mal sehen, was aus den 5-6 GPL OCR Programmen wird(die man im Netz finden kann), wenn sie mal in Version 1.0 erscheinen.
Fine Reader ist wirklich Spitze.
Würde ich für Linux auch sofort kaufen.
Echt Spitze und ich würde es sofort kaufen.
Finereader scheint wohl ein anderes Kaliber zu sein? Wie auch immer hier geht es ja wohl um die Omnipage-Engine - also was für die Tonne
Damit kannst du z.B. ein Comic einscannen und jeden Strich später wirklich als Strich bearbeiten. Und für diesen Zweck ist es besser geeignet als alle anderen. Ausser vielleicht Adobe Streamline.
Klar, in Text sind beide sehr schwach. Das Verfahren ist aber auch grundlegend anders.
Dass man beide Programmarten mit OCR bezeichnet hat sich halt leider so ergeben.
SeeYa Grovel
Allerdings sollte ein "A" auch möglichst wie ein symetrisch geschriebenes "A" aussehen. Der Bereich der Handschriftenerkennung ist sozusagen die Königsdisziplin der OCR. Damit könnte man auch selbstgeschriebene Einkaufszettel einlesen. Diese Tools müssen allerdings "angelernt" werden, damit sie wissen was derjenige unter einem "A" versteht.
Legastheniker werden wohl generell etwas Probleme mit OCR haben. Aber die Spracherkennung macht ja auch gewaltige Fortschritte!
Habe ich erwähnt das ich Nuschele ? (Scherz)
Ich habe es immer als Nachteil empfunden, dass ich nur wegen OCR auf M$ Windows angewiesen bin. Das ist eine der wenigen Anwendungen, für die es unter Linux (bis jetzt) keine Lösung gibt, oder irre ich?
Solche Programme können Schreibmaschinen Texte erkennen und einlesen, inklusive Bildern, Tabellen und Formatierungen. Das ist extrem praktisch, im idealfall hast du die exakt gleiche Seite aber diesmal als Bearbeitbares Dokument alsd ergebniss.
Handgeschrieben ist ein Problem, du musst schon eine besondere Handschrift haben damit das gut geht ;)
Wenn du oft Dokumente als Ausdruck bekommst die du Archivieren möchtest merkst du: Abtippen ist aufwendig :)
? Ich habe eben als ich auf senden ging eine Meldung bekommen :"Der Kommentar auf den Sie antworten wollen existiert nicht mehr". Board spinnt wieder?
Hm... Das Boardproblem hab ich auch im Progenythread, da kann ich auf einen Beitrag nicht antworten, weil der angeblich geloescht sei...
@LH: Und hier schon wieder...
Martin
hier ist eine Liste:
http://www.buzzard.org.uk/jonathan/scanners-usb.html
Die Software kostet allerdings richtig Geld
ich denke so um die 700 DM.
In irgendeiner Comp Zeitschrift stand das USB
langsam, CD Rom 6 fach das ist beim Scannen zu lange.
Doch Vividata verwendet seine eigenen, unabhängigen Scanner-Module, die nur für deren Produkte geeignet sind. Es werden deutlich weniger Scanner unterstützt; fast ausschließlich SCSI-Modelle und mit Parallelportscannern hat man totales Pech.
Wieso können die nicht wie jede Open-Source Anwendung das SANE-API zum Scannen verwenden?