Quand une page est stockée dans le serveur en format Unicode UTF-8, mais affichée dans le navigateur par erreur en mode de caractère uni-octet, abusivement appelé ASCII, ie, en charset=windows-1252, ce caractère Unicode UTF-8 prend deux places.
Essayez le caractère é Unicode: il est doublé en é
Il était une fois dans l'Ouest de la Chine... il faisait froid en hiver.
Au contraire si votre page est stockée dans le serveur web en format ANSI/ASCII, mais affichée dans le navigateur du client par erreur en mode de caractère multi-octet UTF-8, appelé Unicode, en mode Unicode UTF-8, ie, en charset=UTF-8, ce caractère ASCII devient plus mince encore pour devenir un diamant point d'interrogation ou carrĂŠ vide, comme s'il n'est pas assez costaud pour occuper même une seule place dans le monde Unicode qui est multi-octet.
En règle gÊnÊrale, quand votre fichier est en codage plus petit, plus maigre que le codage du navigateur à l'affichage, le diamant point d'interrogation ou carrÊ vide � apparaÎt.
Essayez le caractère é ASCII: il est réduit en diamant point d'interrogation ou carrĂŠ vide �.
Il �tait une fois dans l'Ouest de la Chine... il faisait froid en hiver.
Il est utile de prÊciser que tous les caractères ASCII du code 0 à 127 gardent toujours les mêmes codes sans changement quelque soit le codage des caractères, ASCII, GBK, Unicode...
Tous les caractères ASCII Êtendus du code 0 à 255 (2**8=256, uni-octet, mono-byte) peuvent être stockÊs soit dans un fichier ASCII, soit en format Unicode UTF-8. Le contraire n'est pas vrai, les caractères multi-octet (multi-byte) avec un code supÊrieur ou Êgal à 256, qui ne peuvent être conservÊs que dans un fichier Unicode comme UTF-8, ou bien dans un format spÊcifique (code page pays) tel le GBK pour les idÊogrammes chinois.
Sur le web, un caractère Unicode peut en outre s'exprimer en code entitĂŠ HTML, ainsi stockĂŠ dans un fichier du codage ASCII. Par exemple, l'idĂŠogramme čŻ signifiant Langue, peut ĂŞtre stockĂŠ en mode ASCII par la chaĂŽne 语, composĂŠe uniquement des ampersand &, dièse #, suivi par des chiffres du numĂŠro dĂŠcimal de ce caractère en Unicode, et terminĂŠ par un point-virgule ;.
ä¸ĺ˝ĺşĺŻšäşşçąťä˝ĺşčžĺ¤§çč´ĄçŽďź
La Chine doit faire une contribution relativement grande Ă l'HumanitĂŠ !
ŮŮŘŞŘšŮŮ ŘšŮ٠اŮŘľŮŮ ŘŞŮŘŻŮ٠اسŮا٠ات اŮبع ŮŮبشعŮŘŠ!
ĐиŃаК дОНМон ŃдоНаŃŃ ĐąĐžĐťŃŃиК вкНад в ŃоНОвоŃĐľŃŃвО!
Îίνι θι ĎĎÎĎξΚ νι ĎĎ ÎźÎ˛ÎŹÎťÎľÎš ĎÎľĎΚĎĎĎĎÎľĎÎż ĎĎΡν ινθĎĎĎĎĎΡĎÎą!
ä¸ĺ˝ăŻäşşéĄăŤĺ¤§ăăŞč˛˘çŽăăăŚăă ăăďź
×ץ×× ×׊ תר××× ××××× ××× ×׊×ת!
ŕ¤ŕĽŕ¤¨ ऎञना ŕ¤ŕ¤žŕ¤¤ŕ¤ż ŕ¤ŕĽ लिठŕ¤ŕ¤ एथटञ यŕĽŕ¤ŕ¤Śŕ¤žŕ¤¨ ŕ¤ŕ¤°ŕ¤¨ŕ¤ž ŕ¤ŕ¤žŕ¤šŕ¤żŕ¤!
ŕ¸ŕ¸ľŕ¸ŕ¸ŕ¸§ŕ¸Łŕ¸ŕ¸°ŕšŕ¸Ťŕšŕ¸Ąŕ¸ľŕ¸Şŕšŕ¸§ŕ¸ŕ¸Łŕšŕ¸§ŕ¸Ąŕ¸Ąŕ¸˛ŕ¸ŕ¸ŕ¸śŕšŕ¸ŕšŕ¸ŕ¸ˇŕšŕ¸ŕ¸Ąŕ¸ŕ¸¸ŕ¸Šŕ¸˘ŕ¸ŕ¸˛ŕ¸ŕ¸´!
ÚŰ٠باŰŘŻ ŘłŮ٠بŰŘ´ŘŞŘąŰ Ř¨Ů Ř§Ůسا٠عا!
China shall make a relatively great contribution to the Man Kind!
Cette page est stockÊe dans le disque dur en format UTF-8 sans BOM. Mais je vous propose de l'afficher en diffÊrents codages. Elle peut devenir illisible si le codage diffère trop. Il faut revenir en UTF-8 si vous avez mal à la tête. Testez vous-même sur votre navigateur en cliquant sur les liens suivants:
[Auto Detection] (auto) | Arabic (ISO-8859-6) | Arabic (Windows-1256) | ASCII Western European (ISO-8859-1) | ASCII Western European (Windows-1252) | Baltic (ISO-8859-4) | Baltic (Windows-1257) | Central European (Windows-1250) | Chinese Simplified (GB18030) | Chinese Simplified (GB2312) | Chinese Simplified (GBK) | Chinese Simplified (HZ) | Chinese Traditional (Big5) | Cyrillic (ISO-8859-5) | Cyrillic (KOI8-R) | Cyrillic (KOI8-U) | Cyrillic (Windows-1251) | Greek (Windows-1253) | Hebrew (Windows-1255) | Hebrew (ISO-8859-8-l) | Celtic (ISO-8859-14) | Central European (ISO-8859-2) | Estonian (ISO-8859-13) | Greek (ISO-8859-7) | Hebrew (ISO-8859-8) | Japanese (EUC-JP) | Japanese (ISO-2022-JP) | Japanese (Shift_JIS) | Korean (EUC-KR) | Latin 9 (ISO-8859-15) | Nordic (ISO-8859-10) | Roumain (ISO-8859-16) | South European (ISO-8859-3) | Thai (TIS-620) | Turkish (ISO-8859-9) | Turkish (Windows-1254) | Unicode (UTF-16LE) | Unicode (UTF-8) | Vietnamese (Windows-1258).