Die OCR-Engine Tesseract, eine HP-Entwicklung, war einer der drei am besten bewerteten Schrifterkennungs-Algorithmen im UNLV Accuracy Test 1995. Das Programm wird nun auf GitHub weiterentwickelt. Es liest binäre, graustufige oder farbige Bilder und wandelt diese in Text um. Ein TIFF-Leser für unkomprimierte TIFF Bilder ist integriert, mit libtiff können auch komprimierte TIFF-Bilder gelesen werden. (non)