Reconnaissance de caractères Unicode

Il n’est pas toujours évident de trouver le code Unicode d’un caractère ou son petit nom sauf si on aime passer des heures à consulter des tables de correspondance.

Cette norme mondiale a été conçue pour coder n’importe quel caractère pour qu’il soit traité en informatique sous la forme d’un nombre qui est la seule entité que les ordinateurs savent manipuler sous forme binaire, c’est-à-dire une suite de 0 et de 1.

Cela concerne bien entendu les alphabets latins, mais aussi les caractères qui sont utilisés par d’autres langues : hébreux, arabe, cyrillique, japonais, chinois, arménien… ou encore les caractères dits spéciaux (symboles mathématiques, signes musicaux, icônes texte…).

Cette norme facilite les échanges de textes dans diverses langues. Ainsi chaque caractère, quel que soit le système d’écriture attribue un nom et un identifiant numérique à tous les caractères. La norme Unicode a été adoptée par tous les systèmes informatiques ainsi que par tous les logiciels.

La dernière version Unicode 10.0 a été publiée en juin 2017. Cette norme est en perpétuelle évolution.

L’application en ligne Shapecatcher permet de trouver le code d’un caractère en le dessinant grossièrement à l’aide de la souris. Il suffit de le tracer pour que l’intelligence de l’algorithme se mette en branle afin de l’identifier.

Shapecatcher reconnaît plus de 11 000 caractères Unicode ainsi que des glyphes et les compare à celui que vous dessinez pour proposer les meilleures correspondances.

reconnaissance-caractere-unicode

Les caractères des alphabets japonais, coréen et chinois ne sont pas reconnus par l’application.

Pour y arriver, il faut quand même avoir une bonne mémoire pour savoir restituer le caractère à main levée puis cliquer sur le bouton Recognize pour lancer la reconnaissance.

Évidemment, plus le dessin est conforme à la forme du caractère recherché, plus la reconnaissance se fait correctement. Il faut donc s’appliquer pour obtenir de bons résultats.

shapecatcher-exemple

Quand un caractère est identifié par l’application, une ou plusieurs correspondances sont indiquées. Le nom du caractère est mentionné ainsi que son code en notation hexadécimale.

En cliquant sur le lien More Info, on affiche quelques informations supplémentaires sur le caractère désigné : nom, notations décimale et hexadécimale, raccourci clavier à utiliser sur Windows et Linux pour afficher le caractère, code à saisir au clavier

L’application Shapecatcher est particulièrement utile si on connaît la forme d’un caractère en particulier, mais qu’on ignore ou qu’on a oublié son nom.

Sur le site de Shapecatcher, on trouve aussi quelques informations sur la norme Unicode.

Ceux que la norme Unicode intéresse consulteront avec profit le site Web officiel de la norme The Unicode Consortium.