Übersetzungen dieser Seite:

Was ist neu in CLI 11 Linux?

ABBYY FineReader Engine 11 CLI for Linux ist eine Kommandozeilenanwendung auf Basis von ABBYYs aktuellen Technologien für optische Zeichenerkennung (OCR). Die neue Version basiert auf der aktuellen ABBYY FineReader Engine 11 SDK und bietet zahlreiche Verbesserungen und neue Technologien.

  • Verbesserte OCR-Kerntechnologien
    • Neue Bildvorverarbeitung und Binarisierung
    • Neue Erkennungssprache: Arabisch
    • Verbesserte OCR für Chinesisch, Japanisch und Koreanisch
    • Mehr unterstützte Barcode-Typen
  • Verbesserte Verarbeitung
    • Processing Profiles
    • Native 64-Bit-Unterstützung
    • Integrierte Multi-Core-Unterstützung
    • Schneller 'Fast Mode'
  • Erweiterter Export
    • Neue Exportformate: ODT, ePub, FB2, ALTO XML
    • Verbesserter PDF-Export:
      • Unterstützung von PDF/A-2 (neu)
      • Unterstützung von PDF/A-3 (neu)
      • PDF-Exportprofile
      • Verbesserte MRC-PDFs

Verbesserte OCR-Kerntechnologien

  • Version 11 des OCR CLI Linux-Tools enthält wesentliche Technologieverbesserungen, vor allem im Bereich der Bildvorverarbeitung und Binarisierung. Die neuen Algorithmen liefern eine bessere Bildqualität, sodass die Applikation mehr und bessere Erkennungsergebnisse liefern kann – auch bei Fotos von Digitalkameras.
  • Die neue CLI-Version ist die erste Linux-Applikation von ABBYY, die OCR für Arabisch unterstützt. Sie kann mit allen anderen Erkennungssprachen von ABBYY kombiniert werden und ist daher ideal für internationale Unternehmen.
  • Neue „Classifier“ für asiatische Sprachen ermöglichen eine Steigerung der Erkennungsgenauigkeit von bis zu 40% für Chinesisch, Japanisch und Koreanisch. Das garantiert eine hohe Erkennungsqualität auch bei Projekten mit Dokumenten, die sowohl asiatische als auch europäische Sprachen enthalten.
  • Das Produkt erkennt jetzt als folgende 2D-Barcode-Typen: Aztec, DataMatrix, QRCode und MaxiCode (neu).

Verbesserte Verarbeitung

  • 64-Bit-Unterstützung
    Die neue Version ist jetzt eine native 64-Bit-Anwendung und kann in 64-Bit-Betriebssystemen direkt verwendet werden, ohne das System mit 32-Bit-Bibliotheken zu erweitern.
  • Erweiterter Schnelllesemodus
    Der neue Schnelllesemodus gewährleistet eine ausgewogene Verarbeitungsgeschwindigkeit/ -genauigkeit für Bilder in guter Qualität. Er bietet einen bis zu 92% schnelleren Seitendurchsatz bei gleichbleibend hoher Erkennungsgenauigkeit*.
  • Integrierte Multi-Core-Unterstützung
    OCR-Konvertierung ist ein sehr CPU-intensiver Prozess. Der neue CLI V11 kann die Seiten eines mehrseitigen Dokuments jetzt automatisch auf mehrere CPU-Kerne verteilen. Mit der neuen “multiProcessingMode option” (-mpm) ist Skalierbarkeit sehr einfach. Die Anzahl an verwendeten CPU-Kernen kann automatisch angepasst oder vordefiniert werden.
  • Processing Profiles
    FineReader Engine CLI 11 for Linux unterstützt Verarbeitungsprofile für die häufigsten OCR-Verarbeitungsszenarien. Ein Profil ist ein Set getesteter und (intern) gepackter Einstellungen für die OCR-Engine und kann über die Verarbeitungsoption -lpp kontrolliert werden. In der Regel gibt es 2 Versionen der Profile: Genauigkeit oder Geschwindigkeit. Es stehen folgende Profile zur Verfügung:
    • Dokumentenkonvertierung
    • Dokumentenarchivierung
    • Textextraktion
    • Barcode-Erkennung
    • …und andere.

Der Screenshot wurde auf einem Laptop (2012) Quad i7-3720QM, 2,6 GHz, Windows 7, 16 GB RAM, 64 bit und FineReader Engine 11 R1 erstellt. Es wurden die Beispieldateien des Code-Samples der verwendet. more details...
Hinweis: Das CLI Tool erlaubt die Auswahl der Profile über entsprechende Parameter, verfügt aber nicht über eine GUI. Verarbeitungsgeschwindigkeit und Erkennungsgenauigkeit variiert und ist abhängig von z.B. Dokumentenart, Erkennungssprache, Bildqualität als auch der verwendeten Hardware.

Erweiterter Export

  • Neue Exportformate
    Version 11 der CLI-Applikation fügt neue Exportformate hinzu
    • ALTO XML – ein offener XML-Standard zum Beschreiben von OCR-Text und Layoutinformationen gedruckter Dokumente, die oft in Projekten zur Digital Library verwendet werden (Parameter)
    • EPUB & FB2 – zwei neue E-Book-Exportformate (Parameter)
    • ODT: Open Office / LibreOffice XML basiertes Textformat (Parameter)
  • PDF-Exporterweiterungen
    • PDF/A-2u Unterstützung - Erstellung kleinerer PDF-Dateien mit JPEG2000-Komprimierung
    • PDF/A-3 Unterstützung - PDF/A3- kompatible Formate können erstellt werden, Attachments bleiben erhalten
    • Verbesserte MRC-Komprimierung – interne Technologie-Verbesserungen zur Steigerung der visuellen Qualität bei immer kleineren Dateigrößen.
    • PDF Exportprofile
      Die neuen Exportprofile für PDFs machen es leicht, die Erstellung der exportierten PDFs zu beeinflussen. Es gibt 4 verschiedene Profile:
      • MaxSpeed
      • MaxQuality
      • MinSize und
      • Balanced
    • Dokumentation: Parameter

Der Screenshot wurde auf einem Laptop (2012) Quad i7-3720QM, 2,6 GHz, Windows 7, 16 GB RAM, 64 bit und FineReader Engine 11 R1 erstellt. Es wurden die Beispieldateien des Code-Samples verwendet.
Hinweis: Das CLI Tool erlaubt die Auswahl der Profile über entsprechende Parameter, verfügt aber nicht über ein GUI. Verarbeitungsgeschwindigkeit und Erkennungsgenauigkeit variieren und sind abhängig von z.B. Dokumentenart, Erkennungssprache, Bildqualität sowie der verwendeten Hardware.

Kompatibilität

  • FineReader Engine 11 CLI for Linux muss mit einer Seriennummer installiert und aktiviert werden.
  • Lizenzen von früheren Versionen sind nicht kompatibel.
  • Manche Parameter wurden umbenannt (z.B. -ptem statt -pem zur Einstellung des PDF-Exportmodus), daher wird das Durchsehen der Dokumentation empfohlen.
  • Die neue Version muss mit “abbyyocr11” statt “abbyyocr9” benannt werden.

Weitere Information