Quand une page est stockée dans le serveur en format Unicode UTF-8, mais affichée dans le navigateur par erreur en mode de caractère uni-octet, abusivement appelé ASCII, ie, en charset=windows-1252, ce caractère Unicode UTF-8 prend deux places.
Essayez le caractère é Unicode: il est doublé en é
Il était une fois dans l'Ouest de la Chine... il faisait froid en hiver.
Au contraire si votre page est stockée dans le serveur web en format ANSI/ASCII, mais affichée dans le navigateur du client par erreur en mode de caractère multi-octet UTF-8, appelé Unicode, en mode Unicode UTF-8, ie, en charset=UTF-8, ce caractère ASCII devient plus mince encore pour devenir un diamant point d'interrogation ou carr�İ vide, comme s'il n'est pas assez costaud pour occuper même une seule place dans le monde Unicode qui est multi-octet.
En r�¨gle g�İn�İrale, quand votre fichier est en codage plus petit, plus maigre que le codage du navigateur � l'affichage, le diamant point d'interrogation ou carr�İ vide � appara��t.
Essayez le caractère é ASCII: il est réduit en diamant point d'interrogation ou carr�İ vide �.
Il �tait une fois dans l'Ouest de la Chine... il faisait froid en hiver.
Il est utile de pr�İciser que tous les caract�¨res ASCII du code 0 � 127 gardent toujours les m�Şmes codes sans changement quelque soit le codage des caract�¨res, ASCII, GBK, Unicode...
Tous les caract�¨res ASCII �İtendus du code 0 � 255 (2**8=256, uni-octet, mono-byte) peuvent �Ştre stock�İs soit dans un fichier ASCII, soit en format Unicode UTF-8. Le contraire n'est pas vrai, les caract�¨res multi-octet (multi-byte) avec un code sup�İrieur ou �İgal � 256, qui ne peuvent �Ştre conserv�İs que dans un fichier Unicode comme UTF-8, ou bien dans un format sp�İcifique (code page pays) tel le GBK pour les id�İogrammes chinois.
Sur le web, un caract�¨re Unicode peut en outre s'exprimer en code entit�İ HTML, ainsi stock�İ dans un fichier du codage ASCII. Par exemple, l'id�İogramme èŻ signifiant Langue, peut �Ştre stock�İ en mode ASCII par la cha��ne 语, compos�İe uniquement des ampersand &, di�¨se #, suivi par des chiffres du num�İro d�İcimal de ce caract�¨re en Unicode, et termin�İ par un point-virgule ;.
ä¸ċ½ċşċŻıäşşçħğä½ċşè�ċ¤§çè´Ħç�ïĵ
La Chine doit faire une contribution relativement grande � l'Humanit�İ !
ÙÙĜŞĜıÙÙ ĜıÙÙ Ĝ§ÙĜµÙÙ ĜŞÙĜŻÙÙ Ĝ§Ĝ³ÙĜ§Ù Ĝ§ĜŞ Ĝ§ÙĜ¨Ĝħ ÙÙĜ¨Ĝ´ĜħÙĜİ!
��¸Ñ�°�ı �´���ğ�ĥ�µ�½ Ñ�´�µ�ğ�°ÑÑ �ħ���ğÑÑ�¸�ı �²�ş�ğ�°�´ �² Ñ�µ�ğ���²�µÑ�µÑÑ�²��!
ÎÎŻÎ½Îħ θÎħ ÏÏÎÏεÎı νÎħ ÏÏ ÎĵβÎĴÎğεÎı ÏεÏÎıÏÏÏÏεÏÎż ÏÏην ÎħνθÏÏÏÏÏηÏÎħ!
ä¸ċ½�ŻäşşéĦ�Ğċ¤§��Şè²˘ç����Ĥ�� ��ïĵ
××Ħ×× ××İ ×Ş×¨××× ××××× ××× ××İ×ת!
à¤à�न à¤�à¤�नव à¤à¤�à¤¤à¤ż à¤à� à¤²à¤żà¤ à¤à¤ à¤Ĵà¤Ħà¤ĵà¤� à¤Żà�à¤à¤Ĥà¤�न à¤à¤°à¤¨à¤� à¤à¤�à¤ıà¤żà¤!
à¸à¸µà¸à¸à¸§à¸£à¸à¸°àıà¸Ğàıà¸Ħà¸µà¸Şàıวà¸à¸£àıวà¸Ħà¸Ħาà¸à¸à¸ĥàıà¸àıà¸à¸·àıà¸à¸Ħà¸à¸¸à¸İà¸˘à¸à¸²à¸à¸´!
ÚÛÙ Ĝ¨Ĝ§ÛĜŻ Ĝ³ÙÙ Ĝ¨ÛĜ´ĜŞĜħÛ Ĝ¨Ù Ĝ§ÙĜ³Ĝ§Ù ĜħĜ§!
China shall make a relatively great contribution to the Man Kind!
Cette page est stock�İe dans le disque dur en format UTF-8 sans BOM. Mais je vous propose de l'afficher en diff�İrents codages. Elle peut devenir illisible si le codage diff�¨re trop. Il faut revenir en UTF-8 si vous avez mal � la t�Şte. Testez vous-m�Şme sur votre navigateur en cliquant sur les liens suivants:
[D�İtection Auto] (auto) | Arabe (ISO-8859-6) | Arabe (Windows-1256) | ASCII Europe Occidentale (ISO-8859-1) | ASCII Europe Occidentale (Windows-1252) | Baltique (ISO-8859-4) | Baltique (Windows-1257) | Celtique (ISO-8859-14) | Chinois Simplifi�İ (GB18030) | Chinois Simplifi�İ (GB2312) | Chinois Simplifi�İ (GBK) | Chinois Simplifi�İ (HZ) | Chinois Traditionnel (Big5) | Cor�İen (EUC-KR) | Cyrillique (ISO-8859-5) | Cyrillique (KOI8-R) | Cyrillique (KOI8-U) | Cyrillique (Windows-1251) | Estonien (ISO-8859-13) | Europe Centrale (ISO-8859-2) | Europe Centrale (Windows-1250) | Europe Sud (ISO-8859-3) | Grec (ISO-8859-7) | Grec (Windows-1253) | H�İbreu (Windows-1255) | H�İbreu (ISO-8859-8) | H�İbreu (ISO-8859-8-l) | Japonais (EUC-JP) | Japonais (ISO-2022-JP) | Japonais (Shift_JIS) | Latin 9 (ISO-8859-15) | Nordic (ISO-8859-10) | Roumain (ISO-8859-16) | Tha�Ż (TIS-620) | Turc (ISO-8859-9) | Turc (Windows-1254) | Unicode (UTF-16LE) | Unicode (UTF-8) | Vietnamien (Windows-1258).