
Ce tutoriel vous explique comment configurer la reconnaissance de texte OCR (Optical Character Recognition) sur votre systÚme Windows pour extraire du texte à partir d'images ou de fichiers PDF. Cette fonctionnalité est utile pour convertir des documents physiques en texte numérique.

âą Un ordinateur sous Windows 11
âą Droits administrateur
âą Un logiciel compatible avec l'OCR (tel que Windows Scan, Microsoft OneNote ou un autre outil d'OCR)
âą Un scanner (si vous travaillez avec des documents physiques)


⹠Ouvrez Microsoft OneNote et insérez l'image contenant le texte à reconnaßtre.
⹠Faites un clic droit sur l'image et sélectionnez Copier le texte de l'image.
âą Collez le texte reconnu dans une page OneNote ou dans un autre document.
⹠Vous pouvez également utiliser cette fonctionnalité pour extraire du texte d'un fichier PDF si vous l'ouvrez dans OneNote.
Pour plus dâinformations, consultez Microsoft Support.

⹠Installez l'application Windows Scan depuis le Microsoft Store si elle n'est pas déjà disponible sur votre appareil.
âą Scannez votre document physique Ă l'aide de Windows Scan.
âą Une fois l'image ou le PDF obtenu, ouvrez PowerShell en tant qu'administrateur pour automatiser l'extraction de texte via un script d'OCR (vous pouvez utiliser des modules tiers comme Tesseract OCR).
⹠Téléchargez et installez Tesseract OCR, puis exécutez la commande suivante :
Code:
tesseract C:\Chemin\vers\image.png C:\Chemin\vers\sortie.txt -l fra
⹠Remplacez C:\Chemin\vers\image.png par le chemin de l'image et fra par la langue appropriée (ex: eng pour l'anglais).
⹠Le texte extrait sera enregistré dans le fichier sortie.txt.
Pour plus dâinformations, consultez Microsoft Learn.

⹠Appuyez sur Win + R, tapez regedit, puis appuyez sur Entrée.
⹠Accédez à la clé suivante pour configurer les options OCR :
Code:
HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows\CurrentVersion\OCR
⹠Modifiez les valeurs pour activer/désactiver certaines langues ou fonctionnalités spécifiques de l'OCR selon vos besoins.
Soyez prudent lors de la modification du Registre, car cela peut affecter le comportement de votre systĂšme.
Pour plus dâinformations, consultez Google Results.

Utilisez des images de haute qualité pour obtenir de meilleurs résultats avec l'OCR, car des images floues ou à faible résolution peuvent donner des résultats imprécis.

Les résultats de l'OCR peuvent varier selon la qualité de l'image et la langue. Vérifiez toujours manuellement le texte extrait pour éviter les erreurs.

Si vous avez besoin d'OCR pour des documents en plusieurs langues, assurez-vous d'installer des modules linguistiques supplémentaires dans votre logiciel d'OCR ou dans le systÚme.

GrĂące Ă ce tutoriel, vous savez maintenant comment configurer et utiliser la reconnaissance de texte OCR pour extraire facilement du texte Ă partir d'images ou de documents PDF.