Hilfe Diskussion:Tesseract-Texterkennung
Tesseract-Version Bearbeiten
Wie kriege ich unter Linux raus welche Version von Tesseract vorliegt? --Itu (Diskussion) 00:28, 3. Sep. 2012 (CEST)
- Falls es eine Datei „ReleaseNotes“ im Tesseract-Ordner gibt, steht es darin. --Jowinix 00:48, 3. Sep. 2012 (CEST)
- Einfach aufrufen: "tesseract --version". Aktuell ist 3.05 (stable) bzw. 4.00 (alpha). --Stefan Weil (Diskussion) 23:05, 25. Apr. 2017 (CEST)
Versuch Bearbeiten
Tesseract 3.02 Bearbeiten
Ich habe mal wieder einen Versuch mit Tesseract, Version V3.02, gemacht. Hier das Ergebnis:
Der Scan ist nicht von bester Qualität aber auch nicht besonders schlecht. Das Ergebnis ist gruselig, besonders angetan hat es mir 'Mrniniiiigeix' = 'Memminger,'. Das OCR-Ergebnis von Finereader 10 ist übrigens auch nicht viel besser, aber da gibt es die Möglichkeit des Suchen&Ersetzen über alle Seiten eines Projekts sowie der ständige Bezug zwischen Text und Bild. --9xl (Diskussion) 18:21, 5. Jul. 2014 (CEST)
Tesseract 3.05 Bearbeiten
Zum Vergleich hier das Ergebnis mit Tesseract 3.05. Signifikante Verbesserungen sollte es in Kürze mit Tesseract 4 geben. --Stefan Weil (Diskussion) 23:01, 25. Apr. 2017 (CEST)
Tesseract 4 Bearbeiten
Mit dem aktuellen Tesseract 4 sieht es so aus. --Stefan Weil (Diskussion) 11:15, 12. Aug. 2017 (CEST)
Tesseract 5 Bearbeiten
Hier das Ergebnis mit Tesseract 5 und einem verbesserten Frakturmodell (Fraktur_50000000.547_145243).