Funzionalità
Come utilizzare l’applicazione CLI? - Esempi
abbyyocr -if sample.jpg -f HTML -hkl -of sample.html -f RTF -rmp -of sample.rtf
-
Il file sample.jpg verrà riconosciuto.
-
I risultati saranno esportati nei formati
-
Le linee originali nel testo riconosciuto saranno conservate durante l’export in formato
HTML (-hkl).
-
Il layout della pagina di sorgente non sarà conservato quando si esporta il testo riconosciuto in formato RTF (-rmp).
abbyyocr -ii -fm -if sample.jpg -tet UTF8 -of sample.txt
-
Il file sample.jpg verrà riconosciuto in modalità veloce (-fm).
-
I colori dell’immagine preparata saranno invertiti durante la conversione in formato interno (-ii).
-
I risultati saranno esportati in un file di testo Unicode UTF8 (-tet UTF8).
Caratteristiche + funzionalità
ABBYY CLI OCR for Linux permette facilmente l’accesso istantaneo alla tecnologia di alta qualità di ABBYY su piattaforma Linux. L’elaborazione può essere controllata e automatizzata in modo semplice tramite terminale/riga di comando.
I seguenti formati di documenti e immagini possono essere aperti ed elaborati:
-
PDF
-
BMP
-
PCX
-
DCX
-
JPEG
-
JPEG2000
-
TIFF
-
PNG
b) Funzionalità di elaborazione e di riconoscimento:
L’elaborazione e il riconoscimento delle immagini sono controllati tramite una serie di parametri:
-
Trattamento delle immagini
Correzione dell’inclinazione, formato dell’immagine, parametri della compressione, risoluzione dell’immagine, pulizia dell’immagine, inversione del colore, divisione di pagine doppie.
-
Parametri del riconoscimento
Modalità veloce/bilanciata, riconoscimento del formato (ad es. corsivo), lingue di riconoscimento da utilizzare, riconoscimento di tipi di caratteri misti, ad esempio testo normale, battuto a macchina, stampante a matrice di punti, OCR-A, OCR-B e MICR (E13b).
-
Riconoscimento di codici a barre
I 17 codici a barre
1D più comuni e per i codici a barre
2D: PDF 417, Aztec, DataMatrix, QRCode
posizionati in qualsiasi punto di un documento.
c) Opzioni di export:
FineReader Engine CLI for Linux propone opzioni e formati di output sofisticati:
-
Parametri di sintesi
Parametri dei metodi di esportazione dei risultati del riconoscimento, ad es. caratteri, paragrafi, colore del testo, hyperlink…
I risultati del riconoscimento possono essere esportati in questi formati:
-
-
solo testo
-
testo sull’immagine
-
immagine sul testo
-
solo immagine
-
PDF protetti
-
-
-
-
-
-
Ulteriori dettagli nella documentazione (in inglese).
Lingue OCR
Tipi di codici a barre
-
1D: Check Code 39, Check Interleaved 25, Code 128, Code 39, EAN 13, EAN 8, Interleaved 25, CODABAR (without checksum), UCC Code 128, Code 2 di 5 (Industrial, IATA, Matrix), Code 93, UPC-A, UPC-E e Postnet.
-
2D: PDF 417, Aztec, DataMatrix, QRCode
Estensioni di licenza