ABBYY FineReader Engine
Les technologies de reconnaissance complètes d'ABBYY FineReader Engine
Reconnaissance
Une gamme complète de technologies de reconnaissance
Pour l’étape de reconnaissance du texte à proprement parler, ABBYY FineReader Engine propose un ensemble complet de technologies de reconnaissance. Ces technologies fournies comprennent la reconnaissance des textes dactylographiés (OCR), la reconnaissance des textes manuscrits (ICR) et la reconnaissance des codes-barres (OBR). En tant que leader sur ce marché, ABBYY est l’entreprise qui propose le plus grand nombre de langues pouvant être reconnues en OCR et celles-ci peuvent même être combinées. Voyez ci-après la liste des technologies disponibles et des options de traitement.
Reconnaissance optique de caractères (OCR)
La reconnaissance de texte imprimé est disponible en plus de 200 langues :
-
Langues européennes (alphabets latin, cyrillique, arménien, grec)
-
Langues non européennes : chinois, japonais, coréen, arabe, farsi, thaï, vietnamien, hébreu, birman (prévisualisation)
-
FineReader XIX – pour d’anciens documents, livres et journaux publiés entre 1600 et 1937, en anglais, français, allemand, italien ou espagnol, avec d’anciennes polices de caractères telles que les polices Fraktur, Schwabacher et gothiques
-
Reconnaissance OCR-A, OCR-B, MICR (E13B), CMC7 et de documents imprimés avec des imprimantes matricielles par points ou tapés à la machine à écrire
Reconnaissance intelligente de caractères (ICR)
La reconnaissance de texte manuscrit est disponible en plus de 120 langues :
- Langues européennes et non européennes
- 22 types régionaux d’écriture manuelle
- Reconnaissance de caractères manuscrits dans des champs et cadres
- ICR pour les chiffres indiens utilisés dans les pays arabes
La reconnaissance d’informations manuscrites en différentes langues (ICR multilingue) est possible.
Reconnaissance de codes-barres (OBR)
- Codes-barres 1D et 2D
- Extraction rapide de codes-barres. Cette fonction permet la recherche automatique et la reconnaissance de codes-barres quel que soit l’angle du document.
Mode de reconnaissance précis
Il s’agit du mode de reconnaissance le plus précis, permettant d’obtenir la meilleure qualité de reconnaissance. Recommandé si vous comptez réutiliser le contenu reconnue.
Mode de reconnaissance «Rapide»
Ce mode permet d’accélérer la vitesse de traitement de 200-250%, si bien que cette technologie est idéale pour la gestion des contenus (CMS), la gestion des données (DMS) et les systèmes d’archivage.
Loading component...
Reconnaissance plein-texte et reconnaissance par champ
En général, deux types de reconnaissance sont possibles : reconnaissance plein texte et reconnaissance par champs. La reconnaissance plein texte est utilisée pour la conversion des documents et nécessite habituellement l’utilisation d’une technologie OCR. La reconnaissance par champs est employée pour extraire des données spécifiques et nécessite l’usage, notamment, des technologies OCR et ICR.
Le tableau suivant montre les différences :
| Specification | Full text recognition | Field-level recognition |
|---|---|---|
| Used for: | Document conversion, books archiving | Data capture / Data extraction |
| Document analysis: | General document analysis, document analysis for invoices, document analysis for full-text indexing | Manual blocks specification for field-level recognition |
| Recognition technologies: | OCR with up to 99% accuracy | OCR, ICR, OMR, Barcodes recognition with predefined data types and values range. 99.99% accurate |
| Verification: | Recommended (for content reuse) | Obligatory (as accuracy is a critical issue in most cases) |
| Synthesis: | Used for document reconstruction | Not used |
| Export format: | Document files (RTF, DOC, PDF, etc.) | Export to XML file or database |







