Comment fonctionne la technologie OCR ou ROC ?

Pour numériser un document sur papier, vous avez le choix entre le ressaisir et corriger toutes les fautes de frappe, le transformer au format numérique en le scannant ou en le prenant en photo, ou encore, la meilleure des solutions, d'utiliser la technologie OCR/ROC ou "Reconnaissance Optique des Caractères".

comment fonctionne la technologie OCR

Qu’est-ce que l’OCR ?

L’optical character recognition (OCR) en anglais ou reconnaissance optique des caractères (ROC) en français, est une technologie bien avancée de reconnaissance de texte. Elle permet de convertir automatiquement les documents scannés, les PDF ainsi que les photos numériques en fichiers interrogeables et modifiables.

Un collègue vient de vous envoyer un article de journal et vous devez en extraire les informations pertinentes ? En utilisant les fonctions basiques d'un scanner, vous n’obtiendrez qu’un fichier image. Pour rendre le document exploitable et modifiable, vous devrez utiliser l’OCR. Ce logiciel qui reconnaît les images, reconstituera les mots et les phrases entièrement, et vous pourrez extraire en un rien de temps les informations importantes de l’article.