Pour récupérer du texte sous une forme éditable se trouvant sur une image, à part bien sûr le recopier à la main, il faut pour cela disposer d’un utilitaire spécialisé à même de reconnaître et de traiter les caractères. Ce processus s’appelle OCR (optical character recognition ce qui en Français donne reconnaissance optique des caractères) qui a été implémenté dans de nombreux programmes ou services en ligne pour réaliser cette tâche fastidieuse. Le traitement OCR, même s’il n’est pas fiable à 100 % et dépend en grande partie de la qualité du document original, constitue un moyen pratique pour s’éviter de longues ressaisies de textes que l’on trouve sur des fichiers PDF ou en JPEG qui ont été scannés en mode image.

Avec l’extension pour Chrome Project Naptha on va disposer d’un module OCR directement depuis le menu contextuel du navigateur. Après avoir affiché une image qui contient du texte, un clic droit de souris donne accès à l’interface de l’extension qui est prévue pour faire une reconnaissance optique des caractères, récupérer le texte de l’image par copier-coller dans le presse-papier pour l’éditer dans un logiciel de traitement de texte ou pour traduire le texte sélectionné. La langue du texte est automatiquement reconnue par l’extension.

Project Naptha sera utile pour récupérer le texte des infographies, des fichiers PDF scannés en mode image, des copies d’écran de mail ou de tweets, de diagrammes, etc. Le site du développeur explique avec beaucoup de détails le fonctionnement de son extension en s’appuyant sur des exemples d’utilisations. Elle permet aussi de supprimer des zones complètes de texte sur l’image ainsi que de le modifier (pour cela il faut aller dans le sous-menu Translate, choisir Reprint Text puis de saisir le texte de remplacement dans la zone d’édition.

project-naptha

Le traitement OCR peut être fait sur des images enregistrées en local. Pour cela il faut à partir de la page des extensions de Chrome (on y accède en saisissant chrome://extensions/ dans la barre d’adresses du navigateur), cocher la case Autoriser l’accès aux URL de fichier pour donner cet accès à l’extension.

L’extension est encore largement en phase de développement, mais les résultats sont pour ce que j’ai pu constater assez satisfaisants en terme de fiabilité.

Source : Project NapthaSite Web du développeur (démonstration complète de l’extension)

Boutons de partage :
Twitter Facebook Google Plus Linkedin email
Article rédigé par Eric Weyland