Tutoriel ⚔ Configurer la reconnaissance de texte OCR sur Windows

Sylvain* · 30/9/24

Introduction

Ce tutoriel vous explique comment configurer la reconnaissance de texte OCR (Optical Character Recognition) sur votre système Windows pour extraire du texte à partir d'images ou de fichiers PDF. Cette fonctionnalité est utile pour convertir des documents physiques en texte numérique.

Prérequis

• Un ordinateur sous Windows 11

• Droits administrateur

• Un logiciel compatible avec l'OCR (tel que Windows Scan, Microsoft OneNote ou un autre outil d'OCR)

• Un scanner (si vous travaillez avec des documents physiques)

Méthodologie

Utiliser Microsoft OneNote pour l'OCR

• Ouvrez Microsoft OneNote et insérez l'image contenant le texte à reconnaître.

• Faites un clic droit sur l'image et sélectionnez Copier le texte de l'image.

• Collez le texte reconnu dans une page OneNote ou dans un autre document.

• Vous pouvez également utiliser cette fonctionnalité pour extraire du texte d'un fichier PDF si vous l'ouvrez dans OneNote.

Pour plus d’informations, consultez Microsoft Support.

Utiliser Windows Scan et PowerShell pour l'OCR

• Installez l'application Windows Scan depuis le Microsoft Store si elle n'est pas déjà disponible sur votre appareil.

• Scannez votre document physique à l'aide de Windows Scan.

• Une fois l'image ou le PDF obtenu, ouvrez PowerShell en tant qu'administrateur pour automatiser l'extraction de texte via un script d'OCR (vous pouvez utiliser des modules tiers comme Tesseract OCR).

• Téléchargez et installez Tesseract OCR, puis exécutez la commande suivante :

Code:

tesseract C:\Chemin\vers\image.png C:\Chemin\vers\sortie.txt -l fra

• Remplacez C:\Chemin\vers\image.png par le chemin de l'image et fra par la langue appropriée (ex: eng pour l'anglais).

• Le texte extrait sera enregistré dans le fichier sortie.txt.

Pour plus d’informations, consultez Microsoft Learn.

Configurer l'OCR via l’Éditeur du Registre (Regedit)

• Appuyez sur Win + R, tapez regedit, puis appuyez sur Entrée.

• Accédez à la clé suivante pour configurer les options OCR :

Code:

HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows\CurrentVersion\OCR

• Modifiez les valeurs pour activer/désactiver certaines langues ou fonctionnalités spécifiques de l'OCR selon vos besoins.

Soyez prudent lors de la modification du Registre, car cela peut affecter le comportement de votre système.

Pour plus d’informations, consultez Google Results.

Astuce

Utilisez des images de haute qualité pour obtenir de meilleurs résultats avec l'OCR, car des images floues ou à faible résolution peuvent donner des résultats imprécis.

Avertissement

Les résultats de l'OCR peuvent varier selon la qualité de l'image et la langue. Vérifiez toujours manuellement le texte extrait pour éviter les erreurs.

Conseil

Si vous avez besoin d'OCR pour des documents en plusieurs langues, assurez-vous d'installer des modules linguistiques supplémentaires dans votre logiciel d'OCR ou dans le système.

Conclusion

Grâce à ce tutoriel, vous savez maintenant comment configurer et utiliser la reconnaissance de texte OCR pour extraire facilement du texte à partir d'images ou de documents PDF.

Vous trouvez Tutoriaux-Excalibur intéressant ?

Tutoriel ⚔ Configurer la reconnaissance de texte OCR sur Windows

Sylvain*

Campagne de dons

Dons pour T-E

Messages récents

En ligne

Statistiques des forums

Nouveaux membres

Partager cette page

Nous accordons une grande importance à votre vie privée