Inversion des codages des caractères UTF-8 et ASCII

Cette page encodée en Unicode (charset=UTF-8) a été mal interprétée par le navigateur en charset=Windows-1257: Baltique (Windows-1257).
Unicode Latin+ | Unicode Chinois | GBK | Idéogrammes | ASCII | Table ASCII | ASCII => UTF-8 | UTF-8 => ASCII
Affichage du caractĆØre Ć©
MnƩmonique
Cause d'Erreur
é
UTF-8 => ASCII
Page stockƩe en fichier local en format Unicode UTF-8 interprƩtƩe par erreur en ASCII
ASCII => UTF-8
Page stockƩe en fichier local en format ASCII interprƩtƩe par erreur en Unicode UTF-8

Quand une page est stockée dans le serveur en format Unicode UTF-8, mais affichée dans le navigateur par erreur en mode de caractère uni-octet, abusivement appelé ASCII, ie, en charset=windows-1252, ce caractère Unicode UTF-8 prend deux places.

Essayez le caractère é Unicode: il est doublé en é

Il était une fois dans l'Ouest de la Chine... il faisait froid en hiver.

   

Au contraire si votre page est stockée dans le serveur web en format ANSI/ASCII, mais affichée dans le navigateur du client par erreur en mode de caractère multi-octet UTF-8, appelé Unicode, en mode Unicode UTF-8, ie, en charset=UTF-8, ce caractère ASCII devient plus mince encore pour devenir un diamant point d'interrogation ou carrĆ© vide, comme s'il n'est pas assez costaud pour occuper même une seule place dans le monde Unicode qui est multi-octet.

En règle générale, quand votre fichier est en codage plus petit, plus maigre que le codage du navigateur à l'affichage, le diamant point d'interrogation ou carré vide � apparaît.

Essayez le caractère é ASCII: il est réduit en diamant point d'interrogation ou carrĆ© vide �.

Il �tait une fois dans l'Ouest de la Chine... il faisait froid en hiver.

Il est utile de préciser que tous les caractères ASCII du code 0 à 127 gardent toujours les mêmes codes sans changement quelque soit le codage des caractères, ASCII, GBK, Unicode...

Tous les caractères ASCII étendus du code 0 à 255 (2**8=256, uni-octet, mono-byte) peuvent être stockés soit dans un fichier ASCII, soit en format Unicode UTF-8. Le contraire n'est pas vrai, les caractères multi-octet (multi-byte) avec un code supérieur ou égal à 256, qui ne peuvent être conservés que dans un fichier Unicode comme UTF-8, ou bien dans un format spécifique (code page pays) tel le GBK pour les idéogrammes chinois.

Sur le web, un caractĆØre Unicode peut en outre s'exprimer en code entitĆ© HTML, ainsi stockĆ© dans un fichier du codage ASCII. Par exemple, l'idĆ©ogramme 语 signifiant Langue, peut ĆŖtre stockĆ© en mode ASCII par la chaĆ®ne 语, composĆ©e uniquement des ampersand &, diĆØse #, suivi par des chiffres du numĆ©ro dĆ©cimal de ce caractĆØre en Unicode, et terminĆ© par un point-virgule ;.

Citation de Mao pour tester:

中国应对人类作出较大的�献!

La Chine doit faire une contribution relativement grande Ơ l'HumanitƩ !

ويتعين على الصين تقديم اسهامات اكبر للبشرية!

Китай должен сделать больший вклад в человечество!

Κίνα θα πρέπει να συμβάλει περισσότερο στην ανθρωπότητα!

中国は人�に大きな貢献をしてください!

ב�ין יש תרומה גדולה לאנושות!

च�न मानव जाति क� लिए एक ब�़ा य�गदान करना चाहिए!

จีนควรจะให้�ีส่วนร่ว��ากขึ้นเพื่อ�นุษยชาติ!

چین باید سهم بیشتری به انسان را!

China shall make a relatively great contribution to the Man Kind!

Cette page est stockée dans le disque dur en format UTF-8 sans BOM. Mais je vous propose de l'afficher en différents codages. Elle peut devenir illisible si le codage diffère trop. Il faut revenir en UTF-8 si vous avez mal à la tête. Testez vous-même sur votre navigateur en cliquant sur les liens suivants:

[Détection Auto] (auto) | Arabe (ISO-8859-6) | Arabe (Windows-1256) | ASCII Europe Occidentale (ISO-8859-1) | ASCII Europe Occidentale (Windows-1252) | Baltique (ISO-8859-4) | Baltique (Windows-1257) | Celtique (ISO-8859-14) | Chinois Simplifié (GB18030) | Chinois Simplifié (GB2312) | Chinois Simplifié (GBK) | Chinois Simplifié (HZ) | Chinois Traditionnel (Big5) | Coréen (EUC-KR) | Cyrillique (ISO-8859-5) | Cyrillique (KOI8-R) | Cyrillique (KOI8-U) | Cyrillique (Windows-1251) | Estonien (ISO-8859-13) | Europe Centrale (ISO-8859-2) | Europe Centrale (Windows-1250) | Europe Sud (ISO-8859-3) | Grec (ISO-8859-7) | Grec (Windows-1253) | Hébreu (Windows-1255) | Hébreu (ISO-8859-8) | Hébreu (ISO-8859-8-l) | Japonais (EUC-JP) | Japonais (ISO-2022-JP) | Japonais (Shift_JIS) | Latin 9 (ISO-8859-15) | Nordic (ISO-8859-10) | Roumain (ISO-8859-16) | Thaï (TIS-620) | Turc (ISO-8859-9) | Turc (Windows-1254) | Unicode (UTF-16LE) | Unicode (UTF-8) | Vietnamien (Windows-1258).

Unicode Latin+ | Unicode Chinois | GBK | Idéogrammes | ASCII | Table ASCII | ASCII => UTF-8 | UTF-8 => ASCII
jinMonnaies | zhongHorloge | yiTraduction | ciDictionnaires | xieEcrire | zhuanEncoder

Envoyez vos commentaires (1)

1. Visiteur *.*.182.* - 2015-10-19 10:04:52
ويتعين على الصين تقديم اسهامات اكبر للبشرية!
Email Web

Veuillez recopier la chaƮne :
Texte Ć  recopier.

Chaussures Chinoises > Inversion des codages des caractères UTF-8 et ASCII
  
FenĆŖtre contextuelle    Fermer
Veuillez patienter...