程序员杂志2001增值合定本的配套光碟中有GBK的规范,但是我不懂其含义,有谁能为我解释一下。

解决方案 »

  1.   

    GBK编码是中国大陆制订的、等同于UCS的新的中文编码扩展国家标准。GBK工作小组于1995年10月,同年12月完成GBK规范。该编码标准兼容GB2312,共收录汉字21003个、符号883个,并提供1894个造字码位,简、繁体字融于一库。
    Windows95/98简体中文版的字库表层编码就采用的是GBK,通过GBK与UCS之间一一对应的码表与底层字库联系。英文名:Chinese Internal Code Specification中文名:汉字内码扩展规范1.0版双字节编码,GB2312-80的扩充,在码位上和GB2312-80兼容范围:8140~FEFE(剔除xx7F)共23940个码位包含21003个汉字,包含了ISO/IEC 10646-1中的全部中日韩汉字
      

  2.   

    在电脑上显示是汉字,但是存储的是汉字的内码(GBK码)。比如:“啊”字的GBK码为0xB0A1,你在文本文件中键入一个“啊”字,存盘。用二进制编辑器打开这个文本文件你可以看到二进制数据B0A1。
      

  3.   

    那么,GBK码是按汉字的什么顺序编码的?我发现有的地方是按音序编码,有的地方又是按部首编码的!能给我它的编排规律吗?谢谢!
      

  4.   

    GBK编码组成:
    1. GB2312-80的全部汉字、非汉字符号。
    2. GB13000-1中的其他CJK汉字。(以上两项合计20902个GB化汉字)。
    3.《简化汉字总表》中尚未收入GB13000-1的52个汉字。
    4.《康熙字典》及《辞海》中尚未收入GB13000-1的部首及重要构件共28个。
    5. 13个汉字结构符
    6. Big5中未被GB2312-80收入的,但是在GB13000-1中存在的图形符号139个。
    7. 带音调的拼音字母30个和ɑ及ɡ
    8. 汉字"〇"(GB13000-1/UCS=3007 "零")
    9. GB12345-90中编码的竖排标点符号19个,但凡是GB13000-1中没有编码的暂不收入。
    10.从GB13000-1的CJK兼容区挑选出来的21个汉字。
    11.31个IBM OS/2专用符号汉字字序:
    1. GB2312-80的汉字依然按原有的I级字、II级字,分别按拼音、部首/笔划排列。
    2. GB13000-1的其他CJK汉字,按UCS代码大小顺序排列。
    3. 追加的80个汉字与部首/构件,与上述两类字汇分开,按康熙字典页码.字位单独排列。
      

  5.   

    GBK编码组成:
    1. GB2312-80的全部汉字、非汉字符号。
    2. GB13000-1中的其他CJK汉字。(以上两项合计20902个GB化汉字)。
    3.《简化汉字总表》中尚未收入GB13000-1的52个汉字。
    4.《康熙字典》及《辞海》中尚未收入GB13000-1的部首及重要构件共28个。
    5. 13个汉字结构符
    6. Big5中未被GB2312-80收入的,但是在GB13000-1中存在的图形符号139个。
    7. 带音调的拼音字母30个和ɑ及ɡ
    8. 汉字"〇"(GB13000-1/UCS=3007 "零")
    9. GB12345-90中编码的竖排标点符号19个,但凡是GB13000-1中没有编码的暂不收入。
    10.从GB13000-1的CJK兼容区挑选出来的21个汉字。
    11.31个IBM OS/2专用符号汉字字序:
    1. GB2312-80的汉字依然按原有的I级字、II级字,分别按拼音、部首/笔划排列。
    2. GB13000-1的其他CJK汉字,按UCS代码大小顺序排列。
    3. 追加的80个汉字与部首/构件,与上述两类字汇分开,按康熙字典页码.字位单独排列。
      

  6.   

    对楼上的补充:
     ★码位分配及顺序
      GBK 亦采用双字节表示,总体编码范围为 8140-FEFE,首字节在 81-FE 之间,尾字节在 40-FE 之间,剔除 xx7F 一条线。总计 23940 个码位,共收入 21886 个汉字和图形符号,其中汉字(包括部首和构件)21003 个,图形符号 883 个。
      全部编码分为三大部分:  1. 汉字区。包括:
      a. GB 2312 汉字区。即 GBK/2: B0A1-F7FE。收录 GB 2312 汉字 6763 个,按原顺序排列。
      b. GB 13000.1 扩充汉字区。包括:
      (1) GBK/3: 8140-A0FE。收录 GB 13000.1 中的 CJK 汉字 6080 个。
      (2) GBK/4: AA40-FEA0。收录 CJK 汉字和增补的汉字 8160 个。CJK 汉字在前,按 UCS 代码大小排列;增补的汉字(包括部首和构件)在后,按《康熙字典》的页码/字位排列。  2. 图形符号区。包括:
      a. GB 2312 非汉字符号区。即 GBK/1: A1A1-A9FE。其中除 GB 2312 的符号外,还有 10 个小写罗马数字和 GB 12345 增补的符号。计符号 717 个。
      b. GB 13000.1 扩充非汉字区。即 GBK/5: A840-A9A0。BIG-5 非汉字符号、结构符和“○”排列在此区。计符号 166 个。  3. 用户自定义区:分为(1)(2)(3)三个小区。
      (1) AAA1-AFFE,码位 564 个。
      (2) F8A1-FEFE,码位 658 个。
      (3) A140-A7A0,码位 672 个。
      第(3)区尽管对用户开放,但限制使用,因为不排除未来在此区域增补新字符的可能性。 ★字形
      GBK 对字形作了如下的规定:
      1. 原则上与 GB 13000.1 G列(即源自中国大陆法定标准的汉字)下的字形/笔形保持一致。
      2. 在 CJK 汉字认同规则的总框架内,对所有的 GBK 编码汉字实施“无重码正形”(“GB 化”);即在不造成重码的前提下,尽量采用中国新字形。
      3. 对于超出 CJK 汉字认同规则的、或认同规则尚未明确规定的汉字,在 GBK 码位上暂安放旧字形。这样,在许多情况下 GBK 收入了同一汉字的新旧两种字形。
      4. 非汉字符号的字形,凡 GB 2312 已经包括的,与 GB 2312 保持一致;超出 GB 2312 的部分,与 GB 13000.1 保持一致。
      5. 带声调的拼音字母取半角形式。
      

  7.   

    GBK码位分配
    ============
    总体采用8140-FEFE的矩形图区,剔除xx7F一条线。共23940个码位。
    其中,标准编码区分为5个;用户自定义区3个。┏━━┯━━━━━┯━━━┯━━━┯━━━━┯━━━━━━━━━━┓
    ┃类别│  矩形区  │码位数│字符数│字符名称│   备    注         ┃
    ┠──┼─────┼───┼───┼────┼──────────┨
    ┃符号│ A1A1-A9FE│  846 │  717 │图形符号│GB2312及GB12345为主 ┃
    ┃标准├─────┼───┼───┼────┼──────────┨
    ┃区  │ A840-A9A0│  192 │  166 │图形符号│Big5及结构符等      ┃
    ┠──┼─────┼───┼───┼────┼──────────┨
    ┃汉字│ B0A1-F7FE│ 6768 │ 6763 │  汉字  │GB2312              ┃
    ┃标  ├─────┼───┼───┼────┼──────────┨
    ┃准  │ 8140-A0FE│ 6080 │ 6080 │  汉字  │GB13000             ┃
    ┃区  ├─────┼───┼───┼────┼──────────┨
    ┃    │ AA40-FEA0│ 8160 │ 8160 │  汉字  │GB13000等           ┃
    ┠──┼─────┼───┼───┼────┼──────────┨
    ┃用户│ AAA1-AFFE│  564 │      │        │                    ┃
    ┃自定├─────┼───┼───┼────┼──────────┨
    ┃义区│ F8A1-FEFE│  658 │      │        │                    ┃
    ┃    ├─────┼───┼───┼────┼──────────┨
    ┃    │ A140-A7A0│  672 │      │        │限制使用            ┃
    ┗━━┷━━━━━┷━━━┷━━━┷━━━━┷━━━━━━━━━━┛
      

  8.   

    举例说明:GB2312-80汉字区,B0A1-F7FE
    其中B0A1-D7FE为I级字,按拼音排列
    B0 0   1   2   3   4   5   6   7   8   9   A   B   C   D   E   F
    A     啊  阿  埃  挨  哎  唉  哀  皑  癌  蔼  矮  艾  碍  爱  隘  
    B 鞍  氨  安  俺  按  暗  岸  胺  案  肮  昂  盎  凹  敖  熬  翱  
    C 袄  傲  奥  懊  澳  芭  捌  扒  叭  吧  笆  八  疤  巴  拔  跋  
    D 靶  把  耙  坝  霸  罢  爸  白  柏  百  摆  佰  败  拜  稗  斑  
    E 班  搬  扳  般  颁  板  版  扮  拌  伴  瓣  半  办  绊  邦  帮  
    F 梆  榜  膀  绑  棒  磅  蚌  镑  傍  谤  苞  胞  包  褒  剥  D8A1-F7FE为II级字,按部首/笔划排列
    D8 0   1   2   3   4   5   6   7   8   9   A   B   C   D   E   F
    A     亍  丌  兀  丐  廿  卅  丕  亘  丞  鬲  孬  噩  丨  禺  丿  
    B 匕  乇  夭  爻  卮  氐  囟  胤  馗  毓  睾  鼗  丶  亟  鼐  乜  
    C 乩  亓  芈  孛  啬  嘏  仄  厍  厝  厣  厥  厮  靥  赝  匚  叵  
    D 匦  匮  匾  赜  卦  卣  刂  刈  刎  刭  刳  刿  剀  剌  剞  剡  
    E 剜  蒯  剽  劂  劁  劐  劓  冂  罔  亻  仃  仉  仂  仨  仡  仫  
    F 仞  伛  仳  伢  佤  仵  伥  伧  伉  伫  佞  佧  攸  佚  佝 符号区:
    A1 0   1   2   3   4   5   6   7   8   9   A   B   C   D   E   F
    4                                 
    5                                 
    6                                 
    7                               
    8                                 
    9                                 
    A      、  。  ·  ˉ  ˇ  ¨  〃  々  —  ~  ‖  …  ‘  ’  
    B “  ”  〔  〕  〈  〉  《  》  「  」  『  』  〖  〗  【  】  
    C ±  ×  ÷  ∶  ∧  ∨  ∑  ∏  ∪  ∩  ∈  ∷  √  ⊥  ∥  ∠  
    D ⌒  ⊙  ∫  ∮  ≡  ≌  ≈  ∽  ∝  ≠  ≮  ≯  ≤  ≥  ∞  ∵  
    E ∴  ♂  ♀  °  ′  ″  ℃  $  ¤  ¢  £  ‰  §  №  ☆  ★  
    F ○  ●  ◎  ◇  ◆  □  ■  △  ▲  ※  →  ←  ↑  ↓  〓  A2 0   1   2   3   4   5   6   7   8   9   A   B   C   D   E   F
    4                                 
    5                                 
    6                                 
    7                               
    8                                 
    9                                 
    A   ⅰ  ⅱ  ⅲ  ⅳ  ⅴ  ⅵ  ⅶ  ⅷ  ⅸ  ⅹ            
    B   ⒈  ⒉  ⒊  ⒋  ⒌  ⒍  ⒎  ⒏  ⒐  ⒑  ⒒  ⒓  ⒔  ⒕  ⒖  
    C ⒗  ⒘  ⒙  ⒚  ⒛  ⑴  ⑵  ⑶  ⑷  ⑸  ⑹  ⑺  ⑻  ⑼  ⑽  ⑾  
    D ⑿  ⒀  ⒁  ⒂  ⒃  ⒄  ⒅  ⒆  ⒇  ①  ②  ③  ④  ⑤  ⑥  ⑦  
    E ⑧  ⑨  ⑩      ㈠  ㈡  ㈢  ㈣  ㈤  ㈥  ㈦  ㈧  ㈨  ㈩    
    F   Ⅰ  Ⅱ  Ⅲ  Ⅳ  Ⅴ  Ⅵ  Ⅶ  Ⅷ  Ⅸ  Ⅹ  Ⅺ  Ⅻ      A3 0   1   2   3   4   5   6   7   8   9   A   B   C   D   E   F
    4                                 
    5                                 
    6                                 
    7                               
    8                                 
    9                                 
    A   !  "  #  ¥  %  &  '  (  )  *  +  ,  -  .  /  
    B 0  1  2  3  4  5  6  7  8  9  :  ;  <  =  >  ?  
    C @  A  B  C  D  E  F  G  H  I  J  K  L  M  N  O  
    D P  Q  R  S  T  U  V  W  X  Y  Z  [  \  ]  ^  _  
    E `  a  b  c  d  e  f  g  h  i  j  k  l  m  n  o  
    F p  q  r  s  t  u  v  w  x  y  z  {  |  }   ̄  A4 0   1   2   3   4   5   6   7   8   9   A   B   C   D   E   F
    4                                 
    5                                 
    6                                 
    7                               
    8                                 
    9                                 
    A   ぁ  あ  ぃ  い  ぅ  う  ぇ  え  ぉ  お  か  が  き  ぎ  く  
    B ぐ  け  げ  こ  ご  さ  ざ  し  じ  す  ず  せ  ぜ  そ  ぞ  た  
    C だ  ち  ぢ  っ  つ  づ  て  で  と  ど  な  に  ぬ  ね  の  は  
    D ば  ぱ  ひ  び  ぴ  ふ  ぶ  ぷ  へ  べ  ぺ  ほ  ぼ  ぽ  ま  み  
    E む  め  も  ゃ  や  ゅ  ゆ  ょ  よ  ら  り  る  れ  ろ  ゎ  わ  
    F ゐ  ゑ  を  ん                        A5 0   1   2   3   4   5   6   7   8   9   A   B   C   D   E   F
    4                                 
    5                                 
    6                                 
    7                               
    8                                 
    9                                 
    A   ァ  ア  ィ  イ  ゥ  ウ  ェ  エ  ォ  オ  カ  ガ  キ  ギ  ク  
    B グ  ケ  ゲ  コ  ゴ  サ  ザ  シ  ジ  ス  ズ  セ  ゼ  ソ  ゾ  タ  
    C ダ  チ  ヂ  ッ  ツ  ヅ  テ  デ  ト  ド  ナ  ニ  ヌ  ネ  ノ  ハ  
    D バ  パ  ヒ  ビ  ピ  フ  ブ  プ  ヘ  ベ  ペ  ホ  ボ  ポ  マ  ミ  
    E ム  メ  モ  ャ  ヤ  ュ  ユ  ョ  ヨ  ラ  リ  ル  レ  ロ  ヮ  ワ  
    F ヰ  ヱ  ヲ  ン  ヴ  ヵ  ヶ                  A6 0   1   2   3   4   5   6   7   8   9   A   B   C   D   E   F
    4                                 
    5                                 
    6                                 
    7                               
    8                                 
    9                                 
    A   Α  Β  Γ  Δ  Ε  Ζ  Η  Θ  Ι  Κ  Λ  Μ  Ν  Ξ  Ο  
    B Π  Ρ  Σ  Τ  Υ  Φ  Χ  Ψ  Ω                
    C   α  β  γ  δ  ε  ζ  η  θ  ι  κ  λ  μ  ν  ξ  ο  
    D π  ρ  σ  τ  υ  φ  χ  ψ  ω                
    E ︵  ︶  ︹  ︺  ︿  ﹀  ︽  ︾  ﹁  ﹂  ﹃  ﹄      ︻  ︼  
    F ︷  ︸  ︱    ︳  ︴                    A7 0   1   2   3   4   5   6   7   8   9   A   B   C   D   E   F
    4                                 
    5                                 
    6                                 
    7                               
    8                                 
    9                                 
    A   А  Б  В  Г  Д  Е  Ё  Ж  З  И  Й  К  Л  М  Н  
    B О  П  Р  С  Т  У  Ф  Х  Ц  Ч  Ш  Щ  Ъ  Ы  Ь  Э  
    C Ю  Я                              
    D   а  б  в  г  д  е  ё  ж  з  и  й  к  л  м  н  
    E о  п  р  с  т  у  ф  х  ц  ч  ш  щ  ъ  ы  ь  э  
    F ю  я                            A8 0   1   2   3   4   5   6   7   8   9   A   B   C   D   E   F
    4 ˊ  ˋ  ˙  –  ―  ‥  ‵  ℅  ℉  ↖  ↗  ↘  ↙  ∕  ∟  ∣  
    5 ≒  ≦  ≧  ⊿  ═  ║  ╒  ╓  ╔  ╕  ╖  ╗  ╘  ╙  ╚  ╛  
    6 ╜  ╝  ╞  ╟  ╠  ╡  ╢  ╣  ╤  ╥  ╦  ╧  ╨  ╩  ╪  ╫  
    7 ╬  ╭  ╮  ╯  ╰  ╱  ╲  ╳  ▁  ▂  ▃  ▄  ▅  ▆  ▇  
    8 █  ▉  ▊  ▋  ▌  ▍  ▎  ▏  ▓  ▔  ▕  ▼  ▽  ◢  ◣  ◤  
    9 ◥  ☉  ⊕  〒  〝  〞                      
    A   ā  á  ǎ  à  ē  é  ě  è  ī  í  ǐ  ì  ō  ó  ǒ  
    B ò  ū  ú  ǔ  ù  ǖ  ǘ  ǚ  ǜ  ü  ê  ɑ    ń  ň    
    C ɡ          ㄅ  ㄆ  ㄇ  ㄈ  ㄉ  ㄊ  ㄋ  ㄌ  ㄍ  ㄎ  ㄏ  
    D ㄐ  ㄑ  ㄒ  ㄓ  ㄔ  ㄕ  ㄖ  ㄗ  ㄘ  ㄙ  ㄚ  ㄛ  ㄜ  ㄝ  ㄞ  ㄟ  
    E ㄠ  ㄡ  ㄢ  ㄣ  ㄤ  ㄥ  ㄦ  ㄧ  ㄨ  ㄩ          