JIS X 0201-1997(旧JIS C 6220、ISO646準拠)
7ビット1バイト :文字セット2種類を制御符号で切り替えて使う。1セット33-126の94文字分。
01---CL---313233---------------GL----------------126127
0001-制御符号-1f2021--------------英数字-------------7e7f
0001-制御符号-1f2021--------------カナ--------------7e7f
00は未定義、20は空白(space)、7fは削除(delete)。Cはcontrol character(制御文字)、Gはgraphic character(図形文字)。
8ビット1バイト
01---CL---313233---------6364---GL-------------126127 128129--CR--159160161-------------GR---223224-----254255
0001-制御符号-1f2021--数記号--3f40---英字------英字----7e7f 8081-制御符号-9fa0a1--句読点-------カナ---dfe0-------feff
a0-ffのうちa0,ffが文字領域として使えるようになった?。2000JISでは、保留領域。C0=CL, C1=CR。

JISコード(JIS X 0208-1978)(旧JIS C 6226-1978。いわゆる旧JIS)と区点コード、シフトJIS、EUC
1---CL---313233---------6364---GL-------------126127 128129--CR--159160161-------------GR---223224-----254255
0001-制御符号-1f2021---------3f40----文字---------------7e7f
  • 文字集合を7ビット2バイト(第1バイト縦軸と第2バイト横軸で表現する)に符号化したのがJISコード。
  • 区点コードは、JISコードと同じ文字集合を同じ"形容"のまま1区1点から始まり94区94点まで抜けがないように符号を付けたもの。
  • JISの文字集合を山葵色領域にずらし(形容を変え)符号を付け替えたのがシフトJIS。群青・天色領域は山葵色領域にぴったり収まる。
  • 左上から右、下への方向の文字列とみて変換する。どれも8836字分=94*94=47*188。
  • シフトJISは8ビットの使用が前提、1バイト文字で使われていないコードを第1バイトとした。この符号が現われると、8ビット2バイト文字と解釈され、第2バイトも読みとる。8ビット1バイト文字で使われる制御符号や英数字が現れれば、それだけ読みとればいい。制御符号を使わずに1バイト文字と2バイト文字の混在ができる。
  • JISを鬱金色矩形領域に移動するとEUCになる。
01abcdef
20gh1点94点i
21



30
j1
1区-7区[非漢字]k
8区-15区[自由領域]
16区-[第1水準漢字]
50l-47区[第1水準漢字]m
48区-[第2水準漢字]
7en94
-83区[第2水準漢字]o
84区-94区[自由領域]
7fpqrstu
8001-制御符号-1f2021---------40---文字--------------7e 7f 8081-制御符号-9f a0a1--句読点-------カナ---dfe0---fcfdfeff
81abc[非漢字]-
-[第1水準
81
|
9f
-[自由領域]
漢字]--[第2水準漢字]-
de
a0fg1点94点a0hij
a1 k1
1nk l xEUCy
1fz
1k
dfm 1k n
2k
fco 2fz -[第2水準 e0
ef
漢字]-- [自由領域]pq
(0208では定義不能) f0
fc
(0208では定義不能)rs
fet941点94点fe uEUC v
ff01-制御符号-1f2021-----------文字-----------7e 7f 8081-制御符号-9fa0a1--句読点-------カナ---dfe0---fcfdfeff
        
JIS、区点、シフトJIS、EUCの符号(コード)のまとめ(JIS X 0208:1997、付JIS X 0213:2000)
--区点JISShiftJISEUC
規定
字数
容量
1-94点
第1バイト
第2バイト
21-7e
第1バイト
第2バイト
40-7e/80-fc
第1バイト
第2バイト
a1-fe
J
I
S
0
2
0
8
第1水準
非漢字=7行
記号1471881区、2区21**、22**空き849f-889e



ea9f-effc
-
数字/ローマ字62943区23**
ひらがな/カタカナ1691884区、5区24**,25**
ギリシャ/キリル文字1141886区、7区26**,27**
空き領域=8行†327528区-15区28**-2f**
第1水準漢字
(3021〜4f53)=32行
2965300816区-47区21**-4f**
第2水準漢字
(5021〜737f)=36行
3384338448区-83区50**-7e**
空き領域=11行‡6103484区-94区74**-7e**
94行×94列687988361区-94区21**-7e**-a1**-fe**
0
2
1
3
実装水準3。1面。94行×94列878788361区-94区
2面。26行243624441,3-5,8,12-15区
78-94区
2面。空き領域=68行063922,6-7,9-11区
16-77区
2面。94行×94列243688361区-94区
実装水準4。2面×94行×94列1122317672



J
I
S
非漢字=3.5行
空き領域(0213の第3水準)=4行
第1水準漢字=16行
第2水準漢字前半=7.5行
計31行
582881**-9f**
第2水準漢字後半=10.5行
空き領域(0213の第3水準)=5.5行
計16行
3008e0**-ef**
(0213の2面=第4水準)13行2444f0**-fc**
60行×188列-11280----
†83年、8区に罫線素片追加。 ‡83年、84区に4文字追加、90年に2文字追加。
漢字文字数非漢字文字数全文字数
第1水準漢字2,965文字第2水準漢字3,390文字6,355文字524文字6,879文字
第3水準漢字1,249文字第4水準漢字2,436文字3,685文字659文字4,344文字
実装水準3/漢字(1+2+3)7,604文字1,183文字8,787文字
実装水準4/漢字(1+2+3+4)10,040文字1,183文字11,223文字