Inversion of codings of UTF-8 and ASCII characters

Cette page encodée en Unicode (charset=UTF-8) a été mal interprétée par le navigateur en charset=ISO-8859-7: Greek (ISO-8859-7).
Unicode Latin+ | Unicode Chinois | GBK | Ideograms | ASCII | ASCII Table | ASCII => UTF-8 | UTF-8 => ASCII
Affichage du caractère é
MnΓ©monique
Cause d'Erreur
é
UTF-8 => ASCII
Page stockΓ©e en fichier local en format Unicode UTF-8 interprΓ©tΓ©e par erreur en ASCII
ASCII => UTF-8
Page stockΓ©e en fichier local en format ASCII interprΓ©tΓ©e par erreur en Unicode UTF-8

Quand une page est stockée dans le serveur en format Unicode UTF-8, mais affichée dans le navigateur par erreur en mode de caractère uni-octet, abusivement appelé ASCII, ie, en charset=windows-1252, ce caractère Unicode UTF-8 prend deux places.

Essayez le caractère é Unicode: il est doublé en é

Il était une fois dans l'Ouest de la Chine... il faisait froid en hiver.

   

Au contraire si votre page est stockée dans le serveur web en format ANSI/ASCII, mais affichée dans le navigateur du client par erreur en mode de caractère multi-octet UTF-8, appelé Unicode, en mode Unicode UTF-8, ie, en charset=UTF-8, ce caractère ASCII devient plus mince encore pour devenir un diamant point d'interrogation ou carrΓ© vide, comme s'il n'est pas assez costaud pour occuper même une seule place dans le monde Unicode qui est multi-octet.

En règle générale, quand votre fichier est en codage plus petit, plus maigre que le codage du navigateur à l'affichage, le diamant point d'interrogation ou carré vide � appara�t.

Essayez le caractère é ASCII: il est réduit en diamant point d'interrogation ou carrΓ© vide �.

Il �tait une fois dans l'Ouest de la Chine... il faisait froid en hiver.

Il est utile de prΓ©ciser que tous les caractΓ¨res ASCII du code 0 Γ  127 gardent toujours les mΓͺmes codes sans changement quelque soit le codage des caractΓ¨res, ASCII, GBK, Unicode...

Tous les caractΓ¨res ASCII Γ©tendus du code 0 Γ  255 (2**8=256, uni-octet, mono-byte) peuvent Γͺtre stockΓ©s soit dans un fichier ASCII, soit en format Unicode UTF-8. Le contraire n'est pas vrai, les caractΓ¨res multi-octet (multi-byte) avec un code supΓ©rieur ou Γ©gal Γ  256, qui ne peuvent Γͺtre conservΓ©s que dans un fichier Unicode comme UTF-8, ou bien dans un format spΓ©cifique (code page pays) tel le GBK pour les idΓ©ogrammes chinois.

Sur le web, un caractΓ¨re Unicode peut en outre s'exprimer en code entitΓ© HTML, ainsi stockΓ© dans un fichier du codage ASCII. Par exemple, l'idΓ©ogramme θ―­ signifiant Langue, peut Γͺtre stockΓ© en mode ASCII par la chaΓ�ne 语, composΓ©e uniquement des ampersand &, diΓ¨se #, suivi par des chiffres du numΓ©ro dΓ©cimal de ce caractΓ¨re en Unicode, et terminΓ© par un point-virgule ;.

Citation de Mao pour tester:

δΈ­ε›½εΊ”ε―ΉδΊΊη±»δ½œε‡ΊθΎƒε€§ηš„θ΄‘ηŒ�!

La Chine doit faire une contribution relativement grande Γ  l'HumanitΓ© !

ويΨͺΨΉΩŠΩ† ΨΉΩ„Ω‰ Ψ§Ω„Ψ΅ΩŠΩ† ΨͺΩ‚Ψ―ΩŠΩ… Ψ§Ψ³Ω‡Ψ§Ω…Ψ§Ψͺ Ψ§ΩƒΨ¨Ψ± Ω„Ω„Ψ¨Ψ΄Ψ±ΩŠΨ©!

ΠšΠΈΡ‚Π°ΠΉ Π΄ΠΎΠ»ΠΆΠ΅Π½ ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ больший Π²ΠΊΠ»Π°Π΄ Π² чСловСчСство!

Κίνα ΞΈΞ± πρέπΡι Ξ½Ξ± συμβάλΡι Ο€Ξ΅ΟΞΉΟƒΟƒΟŒΟ„Ξ΅ΟΞΏ στην Ξ±Ξ½ΞΈΟΟ‰Ο€ΟŒΟ„Ξ·Ο„Ξ±!

δΈ­ε›½γ―δΊΊι‘žγ«ε€§γγͺθ²’ηŒ�をしてください!

Χ‘Χ‘Χ™ΧŸ Χ™Χ© ΧͺΧ¨Χ•ΧžΧ” Χ’Χ“Χ•ΧœΧ” ΧœΧΧ Χ•Χ©Χ•Χͺ!

ΰ€šΰ₯€ΰ€¨ ΰ€�ΰ€Ύΰ€¨ΰ€΅ ΰ€œΰ€Ύΰ€€ΰ€Ώ ΰ€•ΰ₯‡ ΰ€²ΰ€Ώΰ€ ΰ€ΰ€• ΰ€¬ΰ€‘ΰ€Όΰ€Ύ ΰ€―ΰ₯‹ΰ€—ΰ€¦ΰ€Ύΰ€¨ ΰ€•ΰ€°ΰ€¨ΰ€Ύ ΰ€šΰ€Ύΰ€Ήΰ€Ώΰ€!

ΰΈˆΰΈ΅ΰΈ™ΰΈ„ΰΈ§ΰΈ£ΰΈˆΰΈ°ΰΉƒΰΈ«ΰΉ‰ΰΈ‘ΰΈ΅ΰΈͺΰΉˆΰΈ§ΰΈ™ΰΈ£ΰΉˆΰΈ§ΰΈ‘ΰΈ‘ΰΈ²ΰΈΰΈ‚ΰΈΆΰΉ‰ΰΈ™ΰΉ€ΰΈžΰΈ·ΰΉˆΰΈ­ΰΈ‘ΰΈ™ΰΈΈΰΈ©ΰΈ’ΰΈŠΰΈ²ΰΈ•ΰΈ΄!

Ϊ†ΫŒΩ† باید Ψ³Ω‡Ω… بیشΨͺری Ψ¨Ω‡ Ψ§Ω†Ψ³Ψ§Ω† Ψ±Ψ§!

China shall make a relatively great contribution to the Man Kind!

Cette page est stockΓ©e dans le disque dur en format UTF-8 sans BOM. Mais je vous propose de l'afficher en diffΓ©rents codages. Elle peut devenir illisible si le codage diffΓ¨re trop. Il faut revenir en UTF-8 si vous avez mal Γ  la tΓͺte. Testez vous-mΓͺme sur votre navigateur en cliquant sur les liens suivants:

[Auto Detection] (auto) | Arabic (ISO-8859-6) | Arabic (Windows-1256) | ASCII Western European (ISO-8859-1) | ASCII Western European (Windows-1252) | Baltic (ISO-8859-4) | Baltic (Windows-1257) | Central European (Windows-1250) | Chinese Simplified (GB18030) | Chinese Simplified (GB2312) | Chinese Simplified (GBK) | Chinese Simplified (HZ) | Chinese Traditional (Big5) | Cyrillic (ISO-8859-5) | Cyrillic (KOI8-R) | Cyrillic (KOI8-U) | Cyrillic (Windows-1251) | Greek (Windows-1253) | Hebrew (Windows-1255) | Hebrew (ISO-8859-8-l) | Celtic (ISO-8859-14) | Central European (ISO-8859-2) | Estonian (ISO-8859-13) | Greek (ISO-8859-7) | Hebrew (ISO-8859-8) | Japanese (EUC-JP) | Japanese (ISO-2022-JP) | Japanese (Shift_JIS) | Korean (EUC-KR) | Latin 9 (ISO-8859-15) | Nordic (ISO-8859-10) | Roumain (ISO-8859-16) | South European (ISO-8859-3) | Thai (TIS-620) | Turkish (ISO-8859-9) | Turkish (Windows-1254) | Unicode (UTF-16LE) | Unicode (UTF-8) | Vietnamese (Windows-1258).

Unicode Latin+ | Unicode Chinois | GBK | Ideograms | ASCII | ASCII Table | ASCII => UTF-8 | UTF-8 => ASCII
jinCurrencies | zhongClock | yiTranslation | ciDictionaries | xieWriting | zhuanEncode

Give us feedback (1)

1. Visitor *.*.182.* - 2015-10-19 10:04:52
ويΨͺΨΉΩŠΩ† ΨΉΩ„Ω‰ Ψ§Ω„Ψ΅ΩŠΩ† ΨͺΩ‚Ψ―ΩŠΩ… Ψ§Ψ³Ω‡Ψ§Ω…Ψ§Ψͺ Ψ§ΩƒΨ¨Ψ± Ω„Ω„Ψ¨Ψ΄Ψ±ΩŠΨ©!
Email Web

Please copy the string:
String to copy.

Chinese Shoes > Inversion of codings of UTF-8 and ASCII characters
  
Popup Window    Close
Patience please...