字符集
维基百科,自由的百科全书
字符集,或稱字集,是指文字的集合;將固定數目的文字編序,以方便作通訊、教育、資訊處理等用途。
字符集通常有兩種,一是專為電腦資訊處理而設,如:ASCII、Unicode、GB 2312、大五碼(Big5)、CNS 11643等。一是作其他用途的,如教育用的生字表、通訊用的電報碼等。
字符集和編碼(Encoding)不同。字符集只是文字的集合,不一定適合作網絡傳送、處理,有時須經編碼(Encode),將字元對應至所屬的特定二元表示法後,才能應用。如CNS 11643和GB 2312可以使用ISO 2022、EUC等標準編碼。Unicode可依不同需要以UTF-8、UTF-16、UTF-32等方法編碼。有些字符集如Big5通常不須額外編碼即可使用,故Big5既是字符集又是編碼。
目录 |
[编辑] 常用電腦字符集
- ASCII
- ISO 10646/Unicode
- GB 2312
- GBK
- GB 18030
- Big5
- 香港增補字符集(HKSCS,是Big5的擴充版本)
- 國家標準中文交換碼 (CNS 11643)
- CCCII
- JIS X 0201(半角日語假名)
- JIS X 0208(日語漢字字集,可以使用ISO 2022、Shift_JIS或EUC編碼)
- ISO 8859