常用的編碼有以下方式:
1、ASCII碼。
ASCII碼,總共有128個,用一個字節的低7位表示,0到31是控制字符如換行回車刪除等。32到126是打印字符,可以通過鍵盤輸入并且能夠顯示出來。
2、ISO-8859-1。
128個字符顯然是不夠用的,于是ISO組織在ASCII碼基礎上又制定了一些列標準用來擴展ASCII編碼,它們是ISO-8859-1到ISO-8859-15,其中ISO-8859-1涵蓋了大多數西歐語言字符,所有應用的最廣泛。ISO-8859-1仍然是單字節編碼,它總共能表示256個字符。
3、GB2312。
它的全稱是《信息交換用漢字編碼字符集基本集》,它是雙字節編碼,總的編碼范圍是A1到F7,其中從A到A9是符號區,總共包含682個符號,從B0到F7是漢字區,包含6763個漢字。
4、GBK。
全稱叫《漢字內碼擴展規范》,是國家技術監督局為windows95所制定的新的漢字內碼規范,它的出現是為了擴展GB2312,加入更多的漢字,它的編碼范圍是8140到FEFE(去掉XX7F)總共有23940個碼位,它能表示21003個漢字,它的編碼是和GB2312兼容的,也就是說用GB2312編碼的漢字可以用GBK來解碼,并且不會有亂碼。
5、GB18030。
全稱是《信息交換用漢字編碼字符集》,是我國的強制標準,它可能是單字節、雙字節或者四字節編碼,它的編碼與GB2312編碼兼容,這個雖然是國家標準,但是實際應用系統中使用的并不廣泛。
6、UTF-16。
UTF-16具體定義了Unicode字符在計算機中存取方法。UTF-16用兩個字節來表示Unicode轉化格式,這個是定長的表示方法,不論什么字符都可以用兩個字節表示,兩個字節是16個bit,所以叫UTF-16。UTF-16表示字符非常方便,每兩個字節表示一個字符,這個在字符串操作時就大大簡化了操作,這也是Java以UTF-16作為內存的字符存儲格式的一個很重要的原因。
7、UTF-8。
UTF-16統一采用兩個字節表示一個字符,雖然在表示上非常簡單方便,但是也有其缺點,有很大一部分字符用一個字節就可以表示的現在要兩個字節表示,存儲空間放大了一倍,在現在的網絡帶寬還非常有限的今天,這樣會增大網絡傳輸的流量,而且也沒必要。而UTF-8采用了一種變長技術,每個編碼區域有不同的字碼長度。不同類型的字符可以是由1~6個字節組成。
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com