Login
Newsletter
Werbung

Di, 5. September 2006, 13:02

Unternehmen

Google stellt freie OCR-Engine vor

Der Suchmaschinenbetreiber Google hat die Verfügbarkeit einer freien OCR-Software angekündigt.

Bereits vor Monaten hat Google auf Seiten von Sourceforge.net die Quellen der Engine frei verfügbar gemacht. Erst jetzt kündigt der Hersteller allerdings auch offiziell die Veröffentlichung des Paketes an.

Die unter der Apache-Lizenz 2.0 veröffentlichte Optical Character Recognition (OCR)-Engine »Tesseract« wurde ursprünglich zwischen 1985 und 1995 von den Hewlett Packard Laboratories entwickelt. Nachdem sich das Unternehmen aus dem Geschäft zurückzog, veröffentlichte HP kurze Zeit später die Quellen der Engine und stellte sie unter eine Open-Source-Lizenz. Fortan wurde sie von der University of Nevada in Las Vegas weiterentwickelt. Erst später kam Google dazu und griff den Studenten unter die Arme, indem es laut eigenen Aussagen »diverse Bugs« behob. Nun ist das Produkt laut Google für eine stabile Freigabe reif genug.

Tesseract OCR besteht nur aus der Engine und enhält keine Benutzeroberfläche. Die Applikation unterstützt darüber hinaus nur Englisch als Sprache. Die Handhabung von mehrspaltigen Texten scheint Tesseract darüber hinaus Probleme zu bereiten. Laut Google wird an einer Unterstützung allerdings gearbeitet. Auch bei Graustufen und Farben kann die Engine ins Stolpern kommen.

Offenbar plant Google, die Engine weiterzuentwickeln. Das Unternehmen schaltete eine Anzeige und sucht nach einem OCR-Entwickler. Laut eigenen Aussagen ist die OCR-Technologie für Google essentiell. Seit geraumer Zeit scannt das Unternehmen Bücher ein, um sie dann später zu indexieren.

Werbung
Kommentare (Insgesamt: 40 || Alle anzeigen )
Re: Abbyy FineReader 5.0 (Probsti, Sa, 17. Februar 2007)
Re[2]: Google ocr (Sputnik, Fr, 8. September 2006)
Re[2]: Hört man gern (Sputnik, Fr, 8. September 2006)
Re: Abbyy FineReader 5.0 (Sputnik, Fr, 8. September 2006)
Re: Google ocr (Anonymous Coward, Mi, 6. September 2006)
Pro-Linux
Pro-Linux @Facebook
Neue Nachrichten
Werbung