互換29組表示/2000JISで消えた規定/互換29組の文字情報/
包摂参照
97JIS互換29文字(ABの規定)
●(
A)=83JISの例示字体と、(
B)=78JISの例示字体をユニコードで表示する。
78JISの例示字体で当用漢字字体表に準じて簡略化できるものは、簡略化され、同じ区点に置かれた。そのため78JISの例示字体は、83JISの文字セットから消えたように思われた。結果的に83JIS例示字体は、[拡張新字体][朝日文字]と呼ばれる字体の漢字をさしているのかもしれない。
しかし、97JISでは「
6.6.4過去の規格との互換性を維持するための包摂規準」p.244を設け、29区点の図形文字について、83JIS例示字体をA、78JIS例示字体をBと名付け、包摂するものとした。
参考1.「これらの包摂規準は、もっぱら過去の規格との互換性を維持するために設けられたものである。」
参考2.「..規格に適合していると主張するためには、..どちらの字体を採用したかを文書に明示することが必要である。」
参考3.「これらの区点位置は、この規格の過去及び現在の規格票の間で、矛盾する字体の整理・変更が行われているものである。」と説明している。
規格では字体の変更を、「(3)字体の変更」と「矛盾する字体の整理・変更」とで、全く異なる扱いをしたのである。字体及び字形の変更は、多数行われたにもかかわらず、97JISにいたって、29文字だけが特別扱いを受けたのである。
「矛盾する字体の整理・変更」とは何か、規格票、解説からは何が矛盾するか読みとれない。逆に矛盾しない字体の変更とは何か。
旧来から用いられている字体と、その簡略化された字体の両方とも、78JISでは例示字体として、別々の区点が割り振られている場合がある。
一方で、旧字体と新字体あるいは異体字の、どれかしか採用されていない場合は、97JISは、"包摂"という名の下に、それらをまとめて一つの区点に当てはめることにした。この考えが、78JISでとられていたかは、不明である。旧字体と新字体あるいは異体字のどこまでが一つの区点に当てはまるかを、はっきり決めていなかったようだ。
"包摂"は、漢字を構成する部分(JISの解説では{部分字体}という用語を造った)をどう扱うか、整理するための用語だ。漢字そのものだけでなく、部分字体に関しての規則である。もし、包摂規準に含まれていれば、これに従わなければならない。
ところが、すでに旧来から用いられている字体と、その簡略化された字体の両方とも、78JISでは例示字体として、別々の区点が割り振られている場合がある。こうした場合は、その部分字体については、お互いに包摂することができない。もし、包摂したとすれば、ある漢字が、別の区点を持ってしまうことになるからだ。
83JISでは多数の例示字体を、簡略体を採用する方向で変更してしまった。それらの簡略体は、これまではどの区点位置も与えられていなかった。しかし、これらの字体に含まれる部分字体やその部分字体を含む他の字体のなかには、旧字体、新字体・簡略体とも、独立の区点が与えられていた、という群がある。
97JISの考え方をすれば、同じ区点位置での字形の変更は、望ましくはないが、包摂されるからこそできる。苦労して推測すれば、
83JISはこの29区点について、同一の区点にはならないはずの字形に置き換えてしまったといっているようだ。これは矛盾すると、97JISは怒っているのだ。
例えば、亞と亜は、別区点位置が当てはめられている。だから包摂されていない。しかし、それらを部分字体とする
は、同区点で包摂されている。部分字体が包摂されていないのに、矛盾する。というのだろうか。
97JISでは、83JISになって消えてしまった字体Bを取り込むために、やむなく字体Bを字体Aの区点位置に置くことにした。また、例外規定を設け、ABは互換できると規定したのだ。
83JISで、まったく新しい区点に字体A群を配置すれば、例外規定として項を設けなくて済んだのだが、新しい区点を増やさないようにしたため、こうした例示字体の変更が行われたのだろう。
多数の例で、旧字体と新字体の両方に区点を割り振られている。包摂の規準を見本にすれば、包摂されても当然な文字群が多数包摂されていない。
すべての部分字体についての包摂規準をあらかじめ設け、異体字の統合を初めから意図していたら問題はなかったが、そういう問題意識で78JISは作られていない。そうなら、初めから多くの旧字体に区点が割り振られることはない。
29区点についても、これも単に"包摂規準"の一つであり、78JISでは字体Bが例示字体で、字体Aを包摂したのに対し、83JISでは字体Aが例示字体で、字体Bを包摂している、とは考えられないのか。つまり、部分字体を考えずに、包摂は文字全体で考えればいい。あるいは、これまで別区点が与えられていた文字については、包摂規準の例外とすればいい。
そうすれば、
6.6.4過去の規格との互換性を維持するための包摂規準はいらないのではないか。
この例外規定は、97JISが生み出した矛盾に思えてならない。
97JISで包摂とか互換とかいう用語をひねり出し、整合性を貫こうとするなら、はっきりとすべての漢字の部分字体の包摂規準を設け、包摂するのかしないのか、その中の例外は何か、を明示してくれればよかったのだ。97JISはそれをやらなかったので、以前のJISを批判することはできない。包摂についての、明らかな法則がないのだから、類推できない。せいぜい、包摂するかもしれない、と包摂の蓋然性を想起するだけだ。旧字体・新字体・俗字・本字・異体字(万人を納得させるこれらの定義はない)などを完全に列挙し、それぞれの位置づけを明示しない限り、利用者は包摂するかしないかを知ることはできない。
ところで、29文字以外の字体・字形変更が行われた文字群とは、どのような文字か、どのように変わったのか、を知るには「字典」を一字一字あたるしかない。
「字典」p244参照。「社会」p.116。
●
2000JISで消えた互換性維持の規定
JIS X 0213:2000(p.312参照)では、97JISの
6.6.4過去の規格との互換性を維持するための包摂規準を適応しないことにした。
A=83JISの例示字体と区点位置を生かし、B=78JISの例示字体に別の(面)区点mktを与えた。しかも1面に。
せっかく例外6.6.4を作って辻褄合わせをしたのに、あっさりと廃棄してしまったのだ。
●(
A)=83JISの例示字体と、□(
B)=78JISの例示字体
◇は、それぞれ独立した区点位置を持つ字体。
唖=アク、ア/おし。くちへん。10画。
JIS:3022、シフトJIS:88A0、区点:01602、Unicode:5516。大漢和:3743
□=アク、ア/おし。くちへん。11画。
mkt:1-15-8、Unicode:555E。新字源:1103、大漢和:3835
◇亜1601・亞4819、悪1613・惡5608、壷3659・壺5268
焔=エン/ほのお。ひへん。11画
JIS:316B、シフトJIS:898B、区点:01775、Unicode:7114。
□=エン/ほのお。ひへん。12画
mkt:1-87-49、Unicode:7130。新字源:4601、大漢和:19141。
◇旧2176・舊7149、稲1680・稻6743、陥2057・陷7992、児2789・兒4927
旧2176・舊7149、稲1680・稻6743の列挙は、意図に外れているのでは?
鴎=オウ/かもめ。とり。15画。
JIS:322A、シフトJIS:89A8、区点:01810、Unicode:9D0E。
□=オウ/かもめ。とり。22画。
mkt:1-94-69、Unicode:9DD7。新字源:9738、大漢和:47268
躯=ク/からだ。みへん。11画。
JIS:366D、シフトJIS:8BEB、区点:02277、Unicode:8EAF。
□=ク/からだ。みへん。18画。
mkt:1-92-42、Unicode:8EC0。新字源:8106、大漢和:38137
◇区2272・區5031、欧1804・歐6131、殴1805・毆6156、駆2278・驅8160、枢3185・樞6068
噛=ゴウ/か・む。くちへん。15画
JIS:337A、シフトJIS:8A9A、区点:01990、Unicode:565B。
□=コウ、ゴウ/か・む。くちへん。18画
mkt:1-15-26、Unicode:5699。新字源:1278、大漢和:4516。
◇歯2785・齒8379、齢4680・齡8384
侠=キョウ/きゃん。にんべん。8画
JIS:3622、シフトJIS:8BA0、区点:02202、Unicode:4FA0。新字源:249、大漢和:625。
□=キョウ/きゃん。にんべん。9画
mkt:1-14-26、Unicode:4FE0。新字源:248、大漢和:706。
頬=キョウ/ほほ、ほお。おおがい。15画
JIS:4B4B、シフトJIS:966A、区点:04343、Unicode:982C。
□=キョウ/ほお。おおがい。16画
mkt:1-93-90、Unicode:9830。新字源:9168、大漢和:43496。
◇峡2214・峽5423、挟2220・挾5749、狭2225・狹6437
鹸=ケン、カン、ゲン/−。ろ。19画
JIS:3834、シフトJIS:8CB2、区点:02420、Unicode:9E78。
□=ケン/あく。ろ。24画
mkt:1-94-76、Unicode:9E7C。新字源:9771、大漢和:47576。
ちなみに、"ろ"とは鹵8335。
蝉=セン、ゼン/せみ。むしへん。15画
JIS:4066、シフトJIS:90E4、区点:03270、Unicode:8749。
□=セン、ゼン、テイ、ダイ/−。むしへん。18画
mkt:1-91-66、Unicode:87EC。新字源:7270、大漢和:33616。
騨=ダ、タ、タン/−。うまへん。19画
JIS:424D、シフトJIS:91CB、区点:03445、Unicode:9A28。
□=タ、ダ、タン、ダン、テイ、ダイ、テン/−。うまへん。22画
mkt:1-94-20、Unicode:9A52。新字源:9421、大漢和:45002。
箪=タン/−。。たけかんむり。15画
JIS:433D、シフトJIS:925C、区点:03529、Unicode:7BAA。
□=タン/−。。たけかんむり。18画
mkt:1-89-73、Unicode:7C1E。新字源:5872、大漢和:26509。
◇単3517・單5137、戦3279・戰5705、禅3321・禪6724、弾3538・彈5528、襌7491・褝7492
禅3321・禪6724の列挙は意図に外れているのでは?これは2部分字体の略
麹=キク/こうじ。むぎ・ばくにょう。15画
JIS:396D、シフトJIS:8D8D、区点:02577、Unicode:9EB9。
□=キク/こうじ。むぎ・ばくにょう。19画
mkt:1-94-79、Unicode:9EB4。新字源:9802、大漢和:47818。
麺=メン/−。むぎ・ばくにょう。16画
JIS:4C4D、シフトJIS:96CB、区点:04445、Unicode:9EBA。
□=メン/むぎこ。むぎ・ばくにょう。20画
mkt:1-94-80、Unicode:9EB5。新字源:9797、大漢和:47827。
◇麦3994・麥8346、麩8347・麸8348。
屡=ル/しばしば。しかばね。12画
JIS:3C48、シフトJIS:8EC6、区点:02840、Unicode:5C61。新字源:1949、大漢和補遺文字:7770
□=ル/しばしば。しかばね。14画
mkt:1-47-64、Unicode:5C62。新字源:1948、大漢和補遺文字:7787。
◇数3184・數5843、楼4716・樓6076、薮4489・藪7314。
*ソウ11684、籔6856
繍=シュウ/ぬいとり。いとへん。17画
JIS:3D2B、シフトJIS:8F4A、区点:02911、Unicode:7E4D。
□=シュウ/ぬいとり。いとへん。19画
mkt:1-90-22、Unicode:7E61。新字源:6199、大漢和:27913。
◇粛2945・肅7073。
蒋=ショウ/−。くさかんむり。13画
JIS:3E55、シフトJIS:8FD3、区点:03053、Unicode:848B。
□=ショウ/−。くさかんむり。15画
mkt:1-91-22、Unicode:8523。新字源:6958、大漢和:31820。
醤=ショウ/ひしお。さけのとり・ひよみのとり。17画
JIS:3E5F、シフトJIS:8FDD、区点:03063、Unicode:91A4。
□=ショウ/ひしお。さけのとり・ひよみのとり。18画
mkt:1-92-89、Unicode:91AC。新字源:6958、大漢和:40011。
◇将3013・將5382、奨3009・奬5293=獎6450
*ショウ漿6289、鏘7922
掻=ソウ/か・く。てへん。11画
JIS:415F、シフトJIS:917E、区点:03363、Unicode:63BB。
□=ソウ/か・く。てへん。13画
mkt:1-84-86、Unicode:6414。新字源:3045、大漢和:12477。
◇蚤3934、騒3391・騷8159
掴=カク/つか・む。てへん。11画。
JIS:444F、シフトJIS:92CD、区点:03647、Unicode:63B4
□=カク/つか・む。てへん。14画。
mkt:1-84-89、Unicode:6451。新字源:3057、大漢和:12572。
◇国2581・國5202
カク幗5478、膕7118
填=テン、チン/−。つちへん。13画。
JIS:4536、シフトJIS:9355、区点:03722、Unicode:586B
□=テン、チン/−。つちへん。13画。
mkt:1-15-56、Unicode:5861。新字源:1465、大漢和補遺文字:5355。
顛=テン/いただき、たお・れる。おおがい。19画。
JIS:453f、シフトJIS:935E、区点:03731、Unicode:985B。新字源:9199
□=テン/いただき、たお・れる。おおがい。19画。
mkt:1-94-3、Unicode:985A。新字源:9198、大漢和:43628。
◇真3131・眞6635、慎3121・愼5638、鎮3635・鎭7915、槙4374・槇8402、鷏8323・鷆8322、
*シン嗔5149、瞋6651、11767
祷=トウ/いの・る。しめすへん。11画。
JIS:4578、シフトJIS:9398、区点:03788、Unicode:7977。新字源:5580
□=トウ/いの・る。しめすへん。19画。
mkt:1-89-35、Unicode:79B1。新字源:5579、大漢和:24852。
◇寿2887・壽5272、鋳3582・鑄7941、梼3778・檮5977、涛3783・濤6225、畴6539・疇6538
*トウ擣5814、オ11623、11878。チュウ儔4918、躊7720
涜=トク、けが・す、けが・れる。さんずい。10画。
JIS:4642F、シフトJIS:93C0、区点:03834、Unicode:6D9C
□=トク、けが・す、けが・れる。さんずい。18画。
mkt:1-87-29、Unicode:7006。新字源:4516、大漢和:18591。
◇売3968・賣7646、続3419・續6984、読3841・讀7606
*トク犢6425、牘6417、黷8366
嚢=ノウ/ふくろ。くち。18画。
JIS:4739、シフトJIS:9458、区点:03925、Unicode:56A2
□=ノウ/ふくろ。くち。22画。
mkt:1-15-32、Unicode:56CA。新字源:1297、大漢和:4633。
◇壌3077・壤5265、譲3089・讓7610、嬢3078・孃5348、穣3087・穰6753
これを同じ包摂されない類に入れるのは無理がある。よって矛盾してない。単なる例示字体の変更である。こんな字は知らないが。
*ノウ曩5908,さき
溌=ハツ/−。さんずい。12画。
JIS:482E、シフトJIS:94AC、区点:04014、Unicode:6E8C
□=ハツ/そそぐ。さんずい。15画。
mkt:1-87-9、Unicode:6F51。新字源:4480、大漢和:18225。
醗=ハツ/−。さけのとり・ひよみのとり。16画。
JIS:4830、シフトJIS:94AE、区点:04016、Unicode:9197
□=ハツ/−。さけのとり・ひよみのとり。19画。
mkt:1-92-90、Unicode:91B1。新字源:8547、大漢和:40041。
◇発4015・發6604、廃3949・廢5506
*ハツ撥5791、ハイ癈6583
莱=ライ/−。くさかんむり。10画。
JIS:4D69、シフトJIS:9789、区点:04573、Unicode:83B1
□=ライ/あかざ。くさかんむり。12画。
mkt:1-91-6、Unicode:840A。新字源:6879、大漢和:31262。
*挟、狭の包摂されない類とするのはおかしい。こちらが正しい来4572・來4852=徠5550
蝋=ロウ/−。むしへん。14画。
JIS:4F39、シフトJIS:9858、区点:04725、Unicode:874B
□=ロウ/ろう。むしへん。21画。
mkt:1-91-71、Unicode:881F。新字源:7299,7301、大漢和:33786。
◇鼡8375・鼠3345これを例に挙げるのはおかしい。猟4636・獵6458
*ロウ臘7136、鑞7945
攅=サン/あつ・まる。てへん。18画。
JIS:5A39、シフトJIS:9DB7、区点:05825、Unicode:6505。新字源:3147、大漢和:12933。
□=サン/あつ・まる。てへん。22画。
mkt:1-85-6、Unicode:6522。新字源:3146、大漢和:13030。
◇賛2731・贊7353、讃2730・讚7613、鑚7652・鑽7951
*サン簪6849、纉6983