GB18030 (含少數民族文字 70000個漢字) 中文字符集


GB18030 有兩個版本:GB18030-2000 和 GB18030-2005。

GB18030-2005 與 GB18030-2000 的編碼體係結構是完全相同的。

GB18030-2000 是 GBK 的取代版本,是在 GBK 基礎上增加瞭 CJK 統一漢字擴充 A 漢字


2000 年發布的 GB18030-2000, 全名《信息技術漢字編碼字符集基本集的擴充》。

GB18030-2000 僅規定瞭常用非漢字符號和 27533 個漢字 (包括部首 部件等) 的編碼。 GB18030-2000 是全文強製性標準, 市場上銷售的産品必須符閤。

國傢標準 GB18030-2000 《信息交換用漢字編碼字符集基本集的補充》 是我國繼 GB2312-1980 和 GB13000-1993 之後最重要的漢字編碼標準, 是我國計算機係統必須遵循的基礎性標準之一。

GB18030-2000 編碼標準是由信息産業部和國傢質量技術監督局在 2000 年 3 月 17 日聯閤發布的, 並將作為一項國傢標準在 2001 年的 1 月正式強製執行。

GB18030-2005 是在 GB18030-2000 基礎上增加瞭 CJK 統一漢字擴充 B 漢字


GB18030-2005《信息技術中文編碼字符集》是我國自主研製的以漢字為主, 並包含多種我國少數民族文字 (譬如:藏 濛古 傣 彝 朝鮮 維吾爾文等) 的超大型中文編碼字符集強製性標準,收入漢字 70000 餘個。

2005 年發布的 GB18030-2005, 是在 GB18030-2000 的基礎上增加瞭 42711 個漢字和多種我國少數民族文字編碼, 增加的這些內容是推薦性的。

故 GB18030-2005 為部分強製性標準,自發布之日起代替 GB18030-2000。

GB18030-2005 的單字節編碼部分、雙字節編碼部分和四字節編碼部分的 CJK 統一漢字擴充 A (即:0x8139EE39 — 0x82358738) 部分為強製性。

01. 在四字節字符錶中增加 CJK 統一漢字擴充 B 和已在 GB13000 中編碼的我國少數民族文字字符的字形。

其實 GB18030-2000 已經映射瞭這些碼位, 但 GB18030-2000 沒有給齣這些字符的字形。

02. 調整字符 ? 編碼。

03. 去掉瞭單字節編碼的歐元符號 (0x80)。

聲明: 其實 GBK 和 GB18030-2000 都沒有單字節編碼的歐元符號,微軟的 CP936 纔有這個符號並定義在 0x80。

內容錶

  1. GB18030-2000
  2. GB18030-2005

上一話題

Base128 字符集

下一話題

UTF8 字符集

快速搜索