什么是錕斤拷

12/5/08

維基:錕斤拷的來歷

錕斤拷是一種計算機軟件系統內部錯誤編碼導致的文字不正常顯示的現象。

原因:Unicode標准中定義了一個Replacement Character,標記為U+FFFD,作用為:

A character used as a substitute for an uninterpretable character from another encoding. The Unicode Standard uses U+FFFD replacement character for this function.

U+FFFD的UTF-8編碼結果為“EF BF BD”。如果有一大段文字都是采用了“U+FFFD U+FFFD”作為占位符的話,那么這段字符的UTF-8流十六進制格式為“EF BF BD EF BF BD...”。

如果錯誤的放置於GB2312/GBK/CP936編碼環境裏顯示的話,最終字符為錕斤拷,他們分別是錕(0xEFBF),斤(0xBDEF),拷(0xBFBD)。由於Web大量采用Gb2312和UTF-8混合編碼,該現象在互聯網十分普遍。據悉,該現象產生的原因是多方面的,一來是Microsoft、Sun等壟斷公司對打廣告投入大量資金,但是對編碼問題這種細節做得不夠細致,二來是PM經常克扣程序員工資,導致程序員代碼激情和質量下降。

鏈接推薦:錕斤拷錕斤拷 - 經典Unicode亂碼

留言