Quand on est développeur (codeur souvent), nous nous en passons de certains mots techniques, mais que l'on utilise très souvent sans pour autant les connaître. Ainsi dans cet article je vous parle de l'encodage UTF-8.
UTF-8 est un système de codage de caractères. Il vous permet de représenter des caractères sous forme de texte ASCII, tout en autorisant les caractères internationaux, tels que les caractères chinois.
L'UTF-8 est l'un des systèmes d'encodage les plus populaires.
Pour commencer à utiliser UTF-8, vous devez d'abord vous familiariser avec le jeu de caractères ASCII de base.
Alors qu'est-ce que le jeu de caractères ASCII ?
ASCII utilise des points de code 7 bits pour représenter 128 caractères différents. Ces points de code sont divisés en 95 caractères imprimables, qui comprennent les 26 lettres de l'alphabet anglais (A à Z, majuscules et minuscules), les 10 chiffres (0 à 9) et de différents de signes de ponctuation et d'autres symboles. .
Il existe également 33 caractères non imprimables, qui incluent des caractères de contrôle (clavier) comme le retour chariot et le saut de ligne, ainsi que divers autres caractères utilisés pour des choses comme le formatage du texte.
Mais quelle est la différence entre l'UTF-8 et le code ASCII ?
C'est là que ça devient intéressant, l'UTF-8 étend le jeu de caractères ASCII pour utiliser des points de code 8 bits, ce qui permet jusqu'à 256 caractères différents.
Cela signifie que UTF-8 peut représenter tous les caractères ASCII imprimables, ainsi que les caractères non imprimables.
UTF-8 comprend également une variété de caractères internationaux supplémentaires, tels que les caractères chinois et les caractères arabes.
Cas d'utilisation
Comment utiliser UTF-8 dans vos pages Web ? Exemple HTML UTF-8
Vous n'avez pas vraiment besoin de savoir comment cela fonctionne (bien que je vous le dise dans un instant.) Vous pouvez configurer le codage de caractères UTF-8 dans votre code HTML avec une seule ligne de HTML située dans la section de votre code :
<!DOCTYPE html>
<html>
<head>
<meta charset="utf-8">
</head>
</html>
UTF-8 est un choix sonore pour l'encodage Encore une fois, UTF-8 est un système d'encodage super efficace. Il peut représenter un large éventail de caractères tout en restant compatible avec l'ASCII. Cela en fait un choix judicieux pour une utilisation dans des logiciels internationalisés.
J'espère que vous avez trouvé cela utile. Si vous souhaitez en savoir plus sur la programmation et la technologie, veuillez vous abonner à la news letter pour ne pas manquer les articles prochains.