Comment fonctionne la technologie OCR ou ROC ?

Pour numériser un document sur papier, vous avez le choix entre le ressaisir et corriger toutes les fautes de frappe, le transformer au format numérique en le scannant ou en le prenant en photo, ou encore, la meilleure des solutions, d'utiliser la technologie OCR/ROC ou "Reconnaissance Optique des Caractères".

comment fonctionne la technologie OCR

Qu’est-ce que l’OCR ?

L’optical character recognition (OCR) en anglais ou reconnaissance optique des caractères (ROC) en français, est une technologie bien avancée de reconnaissance de texte. Elle permet de convertir automatiquement les documents scannés, les PDF ainsi que les photos numériques en fichiers interrogeables et modifiables.

Un collègue vient de vous envoyer un article de journal et vous devez en extraire les informations pertinentes ? En utilisant les fonctions basiques d'un scanner, vous n’obtiendrez qu’un fichier image. Pour rendre le document exploitable et modifiable, vous devrez utiliser l’OCR. Ce logiciel qui reconnaît les images, reconstituera les mots et les phrases entièrement, et vous pourrez extraire en un rien de temps les informations importantes de l’article.

ⓘ En cliquant sur l'article ci-dessus, vous serez redirigé vers sa fiche produit sur sa fiche produit sur Amazon.fr. Notre site internet participe au programme Partenaire AMAZON et réalise ainsi un bénéfice sur les achats qui remplissent les conditions requises. Prix affiché en EURO et actualisé toutes les 24 heures. Le dernier relevé de prix à été effectué le 08/10/24 à 14:09:15.

Quelle technologie se cache derrière l’OCR ?

Mais comment fonctionne-t-il ? Qu’est-ce qui se cache derrière cette technologie de reconnaissance de textes ? Le programme analyse entièrement la structure de l’image du document en divisant la page en plusieurs éléments très distincts : images, tableaux, textes, etc. Les lignes seront d’abord définies en mots puis après en caractères. Une fois les caractères isolés, l’OCR procède à la comparaison de ces derniers avec un groupe de modèles d’images grâce auxquels les premières hypothèses sont avancées sur ce que signifient les caractères.

C’est à partir de ces hypothèses que la reconnaissance optique des caractères commence à analyser les différentes variantes des courbures des lignes en mots et des mots en caractères. Après avoir revu toutes les hypothèses, le programme livre enfin un texte qu’il pense être conforme à l’image précédente.

Certains logiciels OCR comme ABBYY FineReader embarque aussi des dictionnaires de différentes langues. Cette dernière option permet d’affiner un peu plus l’analyse d’un niveau texte à un niveau mot. La prise en charge du dictionnaire contribue beaucoup à l’amélioration de la précision de la reconnaissance des documents et facilite énormément les vérifications des résultats.

Découvrir les modèles de crayons numériques avec OCR