標准漢字編碼有94行多少列
1. 常用漢字編碼標准有哪些GB2312-80共分多少個區每個區有多少位
你學計算機嗎?常用漢字編碼標准有BIG-5GBK和GB2312-80。GB2312-80分為94個區,每個區包含94個字元,共收錄漢字6763個。
2. 漢字的區位碼、國標碼和機內碼
1、區位碼和國標碼 (1)國標:1981年,我國制訂了「中華人們共和國國家標准信息交換漢字編碼」,代號為「GB2312-80」。 (2)區位碼:按國標規定,漢字編碼表有94行94列,其行號01~94稱為區號,列號01~94稱為位號。一個漢字所在的區號和位號簡單地組合在一起就構成了這個漢字的區位碼。 GB2312-80區位碼=區號+位號(採用十進制) 符:2391例1:漢字「啊」處於16區的01位,則其區位碼為1601。 (3)國標碼:又稱為「交換碼」,它是在不同漢字處理系統間進行漢字交換時所使用的編碼。國標碼採用兩個位元組表示,它與區位碼的關系是:國標碼高位位元組=(區號)16+(20)16國標碼低位位元組=(位號)16+(20)16例2:漢字「啊」的區位碼為1601,則其國標碼為(3021)16。 2、漢字內碼(機內碼) (1)概念:在計算機內部表示漢字的代碼。 (2)特點:漢字內碼採用兩個位元組,一個漢字占兩個ASCII字元;漢字內碼最高位為1,ASCII碼最高位為0 (3)漢字內碼與區位碼的關系:漢字內碼高位位元組=(區號)16+(A0)16漢字內碼低位位元組=(位號)16+(A0)16 例3:漢字「啊」的區位碼為1601,則其漢字內碼為(B0A1)16。 3、漢字外碼(漢字輸入碼) (1)概念:是指從鍵盤上輸入的代表漢字的編碼,又稱「漢字輸入碼」。例如區位碼、拼音碼、五筆字型碼等。國標碼=區位碼+2020H
(區位和位碼分別由十進制轉換為對應的十六進制後+2020H)
機內碼=國標碼+8080H
例: 「大」字的區位碼為2083, 20D=14H 83D=53H 1453H+2020H=3473H
所以,國標碼為3473H,
B4F3H=3473H+8080H 所以,機內碼為B4F3H。
3. ASCII編碼和漢字編碼有什麼關系。
ASCII碼佔一個位元組,漢字不是用ASCII碼編碼的,一般有GBK2312和UTF-8等編碼方式,他們都佔2個位元組。
4. 漢字的區位碼和國標碼之間是怎麼換算的
區位碼、國標碼與機內碼的轉換關系方法:(1)區位碼先轉換成十六進制數表示
(2)(區位碼的十六進製表示)+2020H=國標碼;
(3)國標碼+8080H=機內碼
舉例:以漢字「大」為例,「大」字的區內碼為2083
解:1、區號為20,位號為83
2、將區位號2083轉換為十六進製表示為1453H
3、1453H+2020H=3473H,得到國標碼3473H
4、3473H+8080H=B4F3H,得到機內碼為B4F3H三、小結:字元編碼的兩種表示方式:ASCII(字元的表示);GB2312(國標碼,漢字編碼)
區位碼、國標碼與機內碼的轉換關系方法:(1)區位碼先轉換成十六進制數表示
(2)(區位碼的十六進製表示)+2020H=國標碼;
(3)國標碼+8080H=機內碼
舉例:以漢字「大」為例,「大」字的區內碼為2083
解:1、區號為20,位號為83
2、將區位號2083轉換為十六進製表示為1453H
3、1453H+2020H=3473H,得到國標碼3473H
4、3473H+8080H=B4F3H,得到機內碼為B4F3H三、小結:字元編碼的兩種表示方式:ASCII(字元的表示);GB2312(國標碼,漢字編碼)
區位碼、國標碼與機內碼的轉換關系方法:(1)區位碼先轉換成十六進制數表示
(2)(區位碼的十六進製表示)+2020H=國標碼;
(3)國標碼+8080H=機內碼
舉例:以漢字「大」為例,「大」字的區內碼為2083
解:1、區號為20,位號為83
2、將區位號2083轉換為十六進製表示為1453H
5. 漢字編碼有哪些
漢字的編碼體系主要有以下幾種:
⑴ 國標、區位、「准國標」
國標是將七千餘個漢字以及標點符號、外文字母等,排成一個94行、94列的方陣。方陣中每一橫行稱為一個「區」,每個區有94個「位」。一個漢字在方陣中的坐標,稱為該字的區位碼。為了與美標(ASCII)的形象碼的范圍重合,出現了「國標碼」,即將區位碼的兩個十進制數都加上32,得到該漢字的國標碼。
當需要區分國標碼和美標碼時,出現了「准國標」,即將國標碼的兩個數字各加上128,而把原來的國標碼稱為「純國標」。
⑵ GBK
GBK碼是GB碼的擴展字元編碼,對多達兩萬多的簡繁漢字進行了編碼。
⑶ BIG5碼
BIG5碼是針對繁體漢字的漢字編碼。
⑷ HZ碼
HZ碼是在Internet上廣泛使用的一種漢字編碼,它是以「純國標」的中文與美標碼混用為方案。
⑸ ISO 2022 CJK碼
這是國際標准組織為各種語言字元制定的編碼標准。CJK是中、日、韓語的合稱。它主要在Internet中使用。
⑹ UCS和ISO 10646
UCS是由ISO 10646定義的,是其他字元集標準的一個超集,保證與其他字元集是雙向兼容的,它包含了所有已知語言的字元。
⑺ Unicode
Unicode提供一種統一的字元標識方法,它是16位編碼的,具備世界各地計算機與出版行業所用字元的全部代碼。而且它的產生是以各個國家或國標字元編碼為基礎的。目前,Unicode在網路、Windows系統和很多大型軟體中得到應用。
建議你去圖書館找些書查查,書本會介紹得很清楚的,嘿嘿.
6. 漢字系統把一個漢字表示為兩個位元組的二進制編碼,這種制編碼叫
國標gb2312-80規定,全部國標漢字及符號組成94×94矩陣,每行稱區,每列稱位,這種編碼方式就叫做區位碼.
因區碼和位碼組合是在01至94范圍內,會與ascii碼產生沖突,於是制定了漢字內碼:規定為高位內碼=區碼+20h+80h;
低位內碼=位碼+20h+80h.所以各種輸入法都是按這個標准去編寫的.
因此,把一個漢字表示為兩個位元組的二進制碼,這種編碼稱為區位碼,或稱為內碼.
7. 為什麼漢字編碼採用94*94的方陣
在此方陣中,每一行稱為一個"區",每一列稱為一個"位"。這個方陣實際上組成一個有94個區(編號由01到94),每個區有94個位(編號由01到94)的漢字字元集。每兩個位元組分別用兩位十進制編碼,前位元組的編碼稱為區碼,後位元組的編碼稱為位碼,此即區位碼,其中,高兩位為區號,低兩位為位號。這樣區位碼可以唯一地確定某一漢字或字元;反之,任何一個漢字或符號都對應一個唯一的區位碼,沒有重碼。如「保」字在二維代碼表中處於17區第3位,區位碼即為「1703 」。
8. 二進制如何轉為漢字
1. 漢字信息交換碼(國標碼)
《信息交換用漢字 編碼字元集·基本集》是我國於1980年制定的國家標准 GB2312-80,代號為國標碼,是國家規定的用於漢字信息處理使用的代碼依據。
GB2312-80中規定了信息交換用的6763個漢字和682個非漢字圖形符號(包括幾種外文字母、數字和符號)的代碼。
6763個漢字又按其 使用頻度、組詞能力以及用途大小分成一級常用漢字3755個和二級常用漢字3008個。
一級漢字按拼音字母順序排列;若遇同音字,則 按起筆的筆形順序排列;若起筆相同,則按第二筆的筆形順序排列,依次類推。所謂筆形順序,就是橫、豎、撇、點和折的順序。二級漢字按 部首順序排列。
在此標准中,每個漢字(圖形符號)採用雙位元組表示。每個位元組只用低7位,最高位恆為1。由於低7位中有34種狀態是用 於控制字元,因此,只有94(128-34=94)種狀態可用於漢字編碼。這樣,雙位元組的低7位只能表示94×94=8836種狀態。
編碼范圍
二進制數碼
十進制數碼
基本 ASCII 碼
00000000~01111111
0~127
控制字元
00000000~00100000、01111111
0~32、127
可用漢欄位
00100001~01111110
33~126 (1~94)
擴充 ASCII 碼
10000000~11111111
128~255
控制字元
10000000~10100000、11111111
128~160、255
GB2312-80
10100001~11111110
161~254 (1~94)
此標準的漢字編碼表有94行、94列,其行號稱為區號,列號稱為位號。雙位元組中,用 高位元組表示區號,低位元組表示位號。非漢字圖形符號置於第1~11區,一級漢字3755個且於第16~55區,二級漢字3008個置於第56~87區。
每個圖形字元的漢字交換碼,均用兩個位元組的低7位二進制碼表示。漢字國標碼通常用十六進制數表示。
例如:「中」字的區號為 54,位號為48,計算它的二進制數和十六進制數國標碼。
解:先將區、位號分別加上 32 :
54+32=86
48+32=80
分別轉換為二進制數:
(86)10=01010110
(80)10=0 1010000
得到二進制數國標碼為:
01010110 01010000。
最後通過 8 4 2 1 ── 二進製取位法轉換成十六 進制漢字國標碼為:5650。
又如「國」字的區號為25,位號為90,用以上相同的方法得到它的國標碼為:
二進制:00111001 01111010
十六進制:397A
----------------------------------------------------------------
基於以上原則,則
11000100,11100011,10111010,11000011
>(1100 0100 1110 0011)2,(1011 1010 1100 0011)2
>(C4E3)16,(BAC3)16
>查表可知:C4E3>>『你』,BAC3>>『好』
9. 在標準的漢字編碼表中有94行、94列。其行號稱為區號,列號稱為位號。一級漢字3775個置於哪個區
16*16/8*3755=120160位元組=120KB
10. 國家標准信息交換用漢字編碼基本字元集GB2312(80)中給出的二維代碼表,共有__________。
70.國家標准信息交換用漢字編碼基本字元集GB2312(80)中給出的二維代碼表,共有( B )。
A.94行×49列 B.94行×94列 C.49行×94列 D.49行×49列
在你的題里也就是選 A .
這個事一整套的題目。全套見鏈接: