Inhaltsverzeichnis
CLI OCR – Funktionsüberblick
ABBYY FineReader Engine CLI for Linux ermöglicht auf der Linux-Plattform mühelosen und sofortigen Zugriff auf ABBYYs leistungsfähige OCR-Technologie. Die Verarbeitung kann über Terminal-/Befehlszeilenaufrufe einfach gesteuert und automatisiert werden und bietet folgende Funktionen an:
-
Hochpräzise OCR-Qualität (die auch unter Windows erreicht wird)
-
Zahlreiche Ausgabeformate, z. B.:
-
Text, RTF, HTML, XML mit Layout- & Zeicheninformation
-
PDF und PDF/A Support
-
-
Erkennung von 1D und 2D Barcodes
-
Neu in V11:
-
64-bit nativ
-
Export zu PDF/A
-
Processing Profile
-
Multi-Core Support
-
PDF Export Profiles
-
Testversion gewünscht?
Die neueste Version der ABBYY Finereader Engine 11 CLI for Linux basiert auf der neuesten ABBYY OCR-Technologie und kann kostenlos getestet werden.
Übersicht der Funktionen
Eingabeformate für Bilder
Die folgenden Bild- und Dokumentenformate können geöffnet und verarbeitet werden:
-
PDF
-
BMP
-
PCX
-
DCX
-
JPEG
-
JPEG2000
-
TIFF
-
PNG
-
Dokumentation (EN)
Verarbeitungs- und Erkennungsfunktionen
Die Bildverarbeitung und Erkennung werden über verschiedene Parameter gesteuert:
-
Bild (Vor)verarbeitung
Korrektur von Bildverzerrungen, Bildformat, Komprimierungseinstellungen, Bildauflösung, Bereinigung von Bildern, Farbumwandlung, Trennung von Doppelseiten
-
Layout & Dokumentanalyse
Erkennung der Seitenausrichtung, Suche nach Strichcodes, Erkennung von Bildern und Tabellen
-
Erkennungsparameter
Fast/Balanced Modus, Formaterkennung (z. B. kursiv), zu benutzende Erkennungssprachen, Erkennung von Dokumenten mit gemischten Schriften, z. B. normaler Text, Schreibmaschine, Punktmatrix, OCR-A, OCR-B und MICR (E13b)
-
-
Die 17 gängigsten 1D-Strichcodes
-
2D: PDF 417
-
-
General: Miscellaneous Keys
Verarbeitungsprofile für unterschiedliche Szenarien, z.B. Archivierung, Textextraktion oder die Konvertierung in editierbare Office Formate
Exportoptionen
ABBYY CLI OCR for Linux verfügt über vielseitige Ausgabeoptionen und -formate:
-
Syntheseparameter
Einstellungen zum Export des Erkennungsergebnisses, z. B. Schriftarten, Absätze, Textfarbe, Hyperlinks…
Das Resultat des Erkennungsvorgangs kann in die folgenden Formate exportiert werden:
-
-
nur Text
-
Text auf Bild
-
Bild auf Text
-
nur Bild
-
geschützte PDFs
-
-
ePub & FB2 - E-book Formate
-
ALTO XML
Weitere technische Informationen zum Thema: XML & ABBYY auf dem Technology Portal
Weitere Informationen finden Sie in der Dokumentation (Englisch).
OCR-Sprachen
ABBYY FineReader Engine for Linux kann bis zu über 190 OCR-Sprachen erkennen, weitere Infos
Strichcodetypen
-
1D: Check Code 39, Check Interleaved 25, Code 128, Code 39, EAN 13, EAN 8, Interleaved 25, CODABAR (ohne Prüfsumme), UCC Code 128, Code 2 of 5 (Industrial, IATA, Matrix), Code 93, UPC-A, UPC-E und Postnet.
-
2D: PDF 417, Aztec, DataMatrix, QRCode
Lizenz Erweiterungen
-
Sehen Sie auch Add-ons für CLI