97JIS及びその解説の批判
1.97JISの特徴
適用範囲 「6879文字の図形文字とそれらのビット組合せとの対応を規定する」もの。「字典」p.223-
図形文字6879文字の符号化
・漢字(第1水準2965文字、第2水準3390文字)計6355文字
・特殊文字(和字間隔1文字、記述記号18文字、読み分け記号8文字(訳語参照), 仮名又は漢字に準じるもの10文字、かっこ記号22文字、学術記号45文字、単位記号11文字、一般記号32文字)147文字
・数字10文字
・ラテン文字52文字
・ひらがな83文字
・カタカナ86文字
・ギリシャ文字48文字
・キリール文字66文字
・罫線素片32文字
- 収録の根拠明示
- 包摂規準の明示
97JISとその解説は、これまでのJIS規格の字形と符号化をすべて受け入れ、その根拠を明示するため、詭弁を弄しているとしか思えない。正確に定義しようとしているためか、かえって定義がわかりにくく、解説が親切でない。これまでのように誤解と混乱を招いてる。
2.97JISの用語の定義
図形文字 「制御機能以外で、通常、手書き・印字・表示の可視的表現をもち、一つ以上のビット組合せからなる符号化表現をもつ文字。」文字 「データの構成、制御又は表現に用いる構成単位の集合の要素。」
字体 「図形文字の図形表現としての形状についての抽象的概念。」
字形 「字体を、手書き、印字、画面表示などによって実際に図形として表現したもの。」「字典」pp.225−226。
3.用語の定義、用法のわかりにくさ
6.6 漢字の区点位置の解釈の項で規定されているのが、区点と字体あるいは字形との関連で、97JISで最も重要と思われる項だが、わかりにくい。(1)定義
6.6.1 区点位置と字体との対応では「漢字の区点位置の図形文字と一般に用いられる漢字の字体との対応は、その区点位置の例示字体並びに6.6.3(蛇口注:漢字の字体の包摂規準)及び6.6.4(蛇口注:その例外)によって定める」
区点位置と字体の対応「漢字の区点位置と一般に用いられている漢字の字体との対応は、その区点位置の例示字体並びに"包摂規準"によって定める」
備考1. 「例示字体及び包摂規準は、明朝体によって示す。これは、他の書体の利用を制限するものではなく、また書体にいかなる基準を与えるものではない」
備考2. 「例示字体は、この規格の区点位置を実現した一つの例であり、その字体を推奨するものではない。」
6.6.2 字体の実現としての字形では「この規格は、字体の図形的実現としての字形については規定しない。一つの字体の図形的表現としては、デザインの差に基づく複数の字形が考えられるが、この規格はそれらを互いに区別しない」「字典」p.231
(2)疑問と批判
これらの説明によると、個々の図形文字は、例示字体でしか規格されていないにもかかわらず、また、概念は、定義がはっきり示されているか、具体物がないと把握できないにもかかわらず、「書体にいかなる基準を与えるものではない」という説明になっている。例示されたものは、基準でない、というはおかしい。では基準はどこにあるのか、何もないのか。 備考1.では、明朝体でもゴシック体でも他の書体でも何を使ってもかまわないといっているようだが。そもそもある文字が、ある区点の図形文字であることを何で判断するのか。
"例示字体"という言葉を使っているが、字体は"抽象的概念"と定義しており、抽象概念を例示することができるのか。"例示字形"ではないのか。我々が各漢字をある漢字と認識するのは、多数の例示された文字によって、脳内に認識の素材と仕組みが形成されたからである。それは視覚的な線や点などの漢字の構成要素の相互の関係によって表されるパターン認識だけで認識されているわけではない。
この規格での「術語」の"字体"と、一般社会での言葉である"字体"を混合して使っている。「一般に用いられている漢字の字体」とは、後者であろう。これの字体は、抽象概念ではないだろう。 97解説で、わざわざ「"文字概念の符号化"の誤解」という項を設け、一般の理解を批判しているが、97JIS自体、再び"誤解"を生むような規定をしているではないか。「"文字概念の符号化"の誤解」は、次で触れる。
(3)「”文字概念の符号化”の誤解」への疑問
97解説では、「"JISX0208は、文字概念の符号化を行っている"との誤解が生まれ..」と指摘し、そうした誤解が生まれた理由は、参考資料の一文にある、としている。「字典」p.335-。
すなわち、第3次規格までの規定は
適用範囲 "この規格は、...図形文字の集合とその符号について規定する。"
適用範囲 備考 "この規格は、文字の種類とその符号を規定したもので、"とあり、
用語の定義では、図形文字の特徴の一つとして、"文字概念"を"名称、用途、字形、符号"と並置している、という。
つまり、「規格本文の文脈では、...文字概念は、図形文字の特徴の一つに過ぎない」。初めからこの規格は、「"図形文字"、すなわち、文字の種類に符号を与えているのであって、"文字概念"に符号を与えているのではないことは、明確である」というのだ。
ところが、規格ではない参考資料(解説)に「この規格は、文字概念とその符号を符号を定めることを本旨とし、その他字形設計などのことは範囲としない」と書いてあるが、これは明らかに間違いであり、この解説がその後の改正を誤った方向に導き広く誤解される原因となった、と97JIS解説では指摘している。(符号を)が重複しているのは、「字典」のママである。 では、本文の"文字概念"とは何か。規格本文が手元にないからわからない。また、"文字の種類"というのも、これだけではわからない。少しも明確ではない。97JISも明確ではなく、混乱を増加させている。
4."包摂"について
(1)97JISの定義
包摂(unification) 「複数の字体を区別せずに、同一の区点位置を与えることをいう」。
備考 ; 「図形文字は図形概念によるものであるので、異なる文字であっても図形概念として区別が困難なものは、この規格では、字体の包摂に準じて同一区点位置を与えることがある」「字典」p226
例として、「藝」の常用漢字体である「芸」と別起源の「芸」は、図形概念としての区別がわずかである"同形異字"とされており、図形文字としては区別することができないので、同一の区点位置を与える、と説明している。
6.6.3.漢字の字体の包摂規準
「...例示字体は、それぞれの区点位置に対応する」
「さらに、その例示字体を構成する各部分字体が置き換えられた字体も、その置き換えが..包摂規準の範囲内にあるときは、その区点位置に対応する」
包摂規準は185ある。連番○)が付けられおのおの説明されている。解説で、包摂を区点位置ごとに定めた"包摂規準"を規定として設けた、という。「字典」p337
包摂規準の実例や説明をみると、「うん」と「げい」のような全く区別ができない字形ではなく、また、常用漢字表の説明にあるような、とめるかはねるか、といったごくわずかな差(デザイン差)についての規準を意図しているのではなく、d)点画の増減の違い、e)類型の統合、f)筆法の簡化の違い、についての同一の図形文字として扱おうとする規準である。新字体と旧字体のように明らかな区別できる字体を、同一区点に位置づける規準である。
注:6.6.4.過去の規格との互換性を維持するための包摂規準
(2)包摂の定義への疑問−同形異字
表意文字は意味と一体であるから、字体は意味を含んだ抽象化された個々の文字(これが個々の文字概念)の図形的表現であるはずだ。たまたま同じ図形、非常に似た図形だからといって、同じ文字として認識されていないものを同一の場所に位置づけするのは、おかしいのではないか。
97JIS解説では、文字概念に符号を与えたものではなく、図形文字に符号を与えたと説明している。細かいことをいえば、「読み=音訓」を付記し、第1水準を並べた根拠としていることなどと矛盾しているが、これについては「読み=音訓」を付記したことは規格外であるとして許容している。並べなければ、符号化もできないのに。
包摂の定義の備考では、「図形文字は図形概念によるものであるので、異なる文字であっても図形概念として区別が困難なものは、この規格では、字体の包摂に準じて同一区点位置を与えることがある」と記述してある。
つまり、「図形文字」は一般にいう文字でなく、図形であるといっているのだ。「字典」p226。誤解を生む根本は、「図形文字」という用語にあるようだ。文字とは、本来象形文字、表意文字であり、"図形"のみを分離することはできない。あえて分離するなら「文字」という用語を使うことをやめ、"意味"という意を含まない用語にすることだ。
類形同字だけではなく、「芸」のように同形異字(別字)も含めて「包摂」としている。これは、78JISと83JIS間の混乱などを一つの規定で説明しようとしたためのもので、われわれの理解を難しくしている一因と思える。
(3)包摂の定義への疑問−類形同字
包摂の解説では、「天」の第一画と第二画の横棒がどちらが長くても「てん」であるという例、"しんにょう"の点は、一点でも二点でも、「文字の同定には影響がない。」「符号化されるか否かにかかわらず、文字の交換は必然的に字体の抽象化を伴う。符号化文字集合のあいまいさのない運用のためには、こうした抽象化の範囲を明確にし、それぞれの区点位置が、どのような字体を表現し、どのような字体を表現しないかを明確化することが必要である。」「字典」p337
これは、新字体旧字体を同じ区点位置の漢字として、規格内に取り込もうとする規準と考えられる。新旧字体の字体はどちらでもいいといっていると解釈してもおかしくない。
これでは、字体が異なるものが同じコードを持つことになる。
ところが、「"個々の文字の具体的字形設計などのことは、この規格の適用範囲とはしない"としている。しかし、具体的字形設計が適用範囲外であるとしても、第2次規格の改正で行ったように、"文字概念"の符号化であるからとして、符号化対象である文字の字体をみだりに変更することは適切ではない。一方、第2次・第3次改正の字形変更を自由に解釈し、自由に取捨選択するといった実装も、望ましいものではない」p336と解説している。
包摂規準で、実際上、新旧の字体が同じ区点に位置すると定義しながら、字体を変更してはならないとか、自由に選択してはならない、というのは大きな矛盾だ。 また、ここまで規定しながら、185の包摂規準の例を全て挙げていないのは、責任を回避していると思われてもしかたないだろう。
(4)包摂の定義への疑問−部分字体
包摂規準では、例えば、連番19)のように、「躍」は旁の部分が、ヨであるか、ンであるか、ノ二つであるかにかかわらず、同じ区点にあるとする。「耀」「擢」「躍」「曜」「燿」を例示している。つまり、包摂する部分字体とは、置換可能な部分字体ということだろう。とてもそうは思えない例が多いが。 a)では、「一つの区点位置に対して、字体の包摂規準を複数個適用してもいい。ただし、一つの部分字体に包摂規準の複数個を順次適用してはならない」とある。
連番1283886「迩」を例示。「しんにゅう」の点一つでも、点二つでも同一の区点位置にあるとする規準。また、連番31旁が欠の部分のように折り返したものと互換できる。この2つを同時に適用してもいいというのだ。
a)後段は、例がないので、意味がわからない。
無制限に部分字体を包摂すると、問題が起こる。
b)では、「包摂規準は、他のいずれかの区点位置の漢字までも包摂するような適用を行ってはならない」としている。
ある区点位置の漢字が、包摂規準が適用可能な字形あるいは部分字形(旁や偏やその一部)であっても、結果が他の区点の漢字になる場合は、適用できないという規定である。これを許すと、同じ字形とみなされる漢字に、複数の区点がつくことになる。"例外"(適用除外)規定である。
われわれはまず、一つの文字は、個々に分解して意味を理解したり、書くのではなく、全体としてとらえている。包摂規準は、ほとんどの場合、偏や旁あるいは、さらにそれを分解した解説者のいう"部分字体"についての規定である。これを例示した文字以外にも適用しようというのは、無理があるのでは。加藤弘一氏のいうように、すべて例示し、例示できないものは適用外とするといった規定の方が理解しやすい。
包摂(unification) 「複数の字体を区別せずに、同一の区点位置を与えることをいう」。
備考 ; 「図形文字は図形概念によるものであるので、異なる文字であっても図形概念として区別が困難なものは、この規格では、字体の包摂に準じて同一区点位置を与えることがある」「字典」p226
例として、「藝」の常用漢字体である「芸」と別起源の「芸」は、図形概念としての区別がわずかである"同形異字"とされており、図形文字としては区別することができないので、同一の区点位置を与える、と説明している。
6.6.3.漢字の字体の包摂規準
「...例示字体は、それぞれの区点位置に対応する」
「さらに、その例示字体を構成する各部分字体が置き換えられた字体も、その置き換えが..包摂規準の範囲内にあるときは、その区点位置に対応する」
包摂規準は185ある。連番○)が付けられおのおの説明されている。解説で、包摂を区点位置ごとに定めた"包摂規準"を規定として設けた、という。「字典」p337
包摂規準の実例や説明をみると、「うん」と「げい」のような全く区別ができない字形ではなく、また、常用漢字表の説明にあるような、とめるかはねるか、といったごくわずかな差(デザイン差)についての規準を意図しているのではなく、d)点画の増減の違い、e)類型の統合、f)筆法の簡化の違い、についての同一の図形文字として扱おうとする規準である。新字体と旧字体のように明らかな区別できる字体を、同一区点に位置づける規準である。
注:6.6.4.過去の規格との互換性を維持するための包摂規準
(2)包摂の定義への疑問−同形異字
表意文字は意味と一体であるから、字体は意味を含んだ抽象化された個々の文字(これが個々の文字概念)の図形的表現であるはずだ。たまたま同じ図形、非常に似た図形だからといって、同じ文字として認識されていないものを同一の場所に位置づけするのは、おかしいのではないか。
97JIS解説では、文字概念に符号を与えたものではなく、図形文字に符号を与えたと説明している。細かいことをいえば、「読み=音訓」を付記し、第1水準を並べた根拠としていることなどと矛盾しているが、これについては「読み=音訓」を付記したことは規格外であるとして許容している。並べなければ、符号化もできないのに。
包摂の定義の備考では、「図形文字は図形概念によるものであるので、異なる文字であっても図形概念として区別が困難なものは、この規格では、字体の包摂に準じて同一区点位置を与えることがある」と記述してある。
つまり、「図形文字」は一般にいう文字でなく、図形であるといっているのだ。「字典」p226。誤解を生む根本は、「図形文字」という用語にあるようだ。文字とは、本来象形文字、表意文字であり、"図形"のみを分離することはできない。あえて分離するなら「文字」という用語を使うことをやめ、"意味"という意を含まない用語にすることだ。
類形同字だけではなく、「芸」のように同形異字(別字)も含めて「包摂」としている。これは、78JISと83JIS間の混乱などを一つの規定で説明しようとしたためのもので、われわれの理解を難しくしている一因と思える。
(3)包摂の定義への疑問−類形同字
包摂の解説では、「天」の第一画と第二画の横棒がどちらが長くても「てん」であるという例、"しんにょう"の点は、一点でも二点でも、「文字の同定には影響がない。」「符号化されるか否かにかかわらず、文字の交換は必然的に字体の抽象化を伴う。符号化文字集合のあいまいさのない運用のためには、こうした抽象化の範囲を明確にし、それぞれの区点位置が、どのような字体を表現し、どのような字体を表現しないかを明確化することが必要である。」「字典」p337
これは、新字体旧字体を同じ区点位置の漢字として、規格内に取り込もうとする規準と考えられる。新旧字体の字体はどちらでもいいといっていると解釈してもおかしくない。
これでは、字体が異なるものが同じコードを持つことになる。
ところが、「"個々の文字の具体的字形設計などのことは、この規格の適用範囲とはしない"としている。しかし、具体的字形設計が適用範囲外であるとしても、第2次規格の改正で行ったように、"文字概念"の符号化であるからとして、符号化対象である文字の字体をみだりに変更することは適切ではない。一方、第2次・第3次改正の字形変更を自由に解釈し、自由に取捨選択するといった実装も、望ましいものではない」p336と解説している。
包摂規準で、実際上、新旧の字体が同じ区点に位置すると定義しながら、字体を変更してはならないとか、自由に選択してはならない、というのは大きな矛盾だ。 また、ここまで規定しながら、185の包摂規準の例を全て挙げていないのは、責任を回避していると思われてもしかたないだろう。
(4)包摂の定義への疑問−部分字体
包摂規準では、例えば、連番19)のように、「躍」は旁の部分が、ヨであるか、ンであるか、ノ二つであるかにかかわらず、同じ区点にあるとする。「耀」「擢」「躍」「曜」「燿」を例示している。つまり、包摂する部分字体とは、置換可能な部分字体ということだろう。とてもそうは思えない例が多いが。 a)では、「一つの区点位置に対して、字体の包摂規準を複数個適用してもいい。ただし、一つの部分字体に包摂規準の複数個を順次適用してはならない」とある。
連番1283886「迩」を例示。「しんにゅう」の点一つでも、点二つでも同一の区点位置にあるとする規準。また、連番31旁が欠の部分のように折り返したものと互換できる。この2つを同時に適用してもいいというのだ。
a)後段は、例がないので、意味がわからない。
無制限に部分字体を包摂すると、問題が起こる。
b)では、「包摂規準は、他のいずれかの区点位置の漢字までも包摂するような適用を行ってはならない」としている。
ある区点位置の漢字が、包摂規準が適用可能な字形あるいは部分字形(旁や偏やその一部)であっても、結果が他の区点の漢字になる場合は、適用できないという規定である。これを許すと、同じ字形とみなされる漢字に、複数の区点がつくことになる。"例外"(適用除外)規定である。
われわれはまず、一つの文字は、個々に分解して意味を理解したり、書くのではなく、全体としてとらえている。包摂規準は、ほとんどの場合、偏や旁あるいは、さらにそれを分解した解説者のいう"部分字体"についての規定である。これを例示した文字以外にも適用しようというのは、無理があるのでは。加藤弘一氏のいうように、すべて例示し、例示できないものは適用外とするといった規定の方が理解しやすい。
結局、包摂規準に関する規格を整理すると、以下のようになる。
この規格は、まず、ある区点に対応する字体αb(ある文字を図形として表現したもの)を例示している。
ただ字体αbには、形が大部分同じで部分的に異なる字体αBがある場合がある。字体αbは字体αBの略字あるいは代替する文字として歴史的に同じ意味で用いられてきた。部分的な相違について、歴史的にある規則B→bによっていると、暗黙の認識がある。字体αBは、例示字体としてどの区点にも配置されていない。そこで、字体αBも字体αbと同一の区点に配置することにした。
これは字体αBと字体αbについての規準であるが、部分b及びB{部分字体}を含む漢字についても、この規準を適用することにした。例えば、ある区点の例示字体γBと例示されていないγbの区点は、γBの区点、例示されていないδBとある区点の例示字体δbは、δbの区点とする。これらが「包摂規準」の適用である。
ただし、θBとθbがそれぞれ別の区点の例示字体である場合、θBをθbの区点に当てはめたり、その逆をしてはならない。
また、例示字体ΩBという文字は使われてきたが、Ωbという文字は使われた痕跡がない。こうした場合、ΩBの区点にΩbという文字を作って当てはめてはいけない。
さらに、よく似ている字形は、字体差ではなくデザイン差ということらしい。こうした場合も「包摂規準」で規定している。また、ある文字が字体Hであり、それと異なる文字が字体Hである場合も同じ区点に配置することにしているが、これも「包摂規準」という言葉で説明している。
同じ名前のフォント(明朝体などの書体。一定のデザイン意図に基づいて設計された文字のひと揃い)の同じ文字でも、メーカーにより字体差あるいはデザイン差があることがある。字形とはデザインと同じに考えられる。
この規格は、まず、ある区点に対応する字体αb(ある文字を図形として表現したもの)を例示している。
ただ字体αbには、形が大部分同じで部分的に異なる字体αBがある場合がある。字体αbは字体αBの略字あるいは代替する文字として歴史的に同じ意味で用いられてきた。部分的な相違について、歴史的にある規則B→bによっていると、暗黙の認識がある。字体αBは、例示字体としてどの区点にも配置されていない。そこで、字体αBも字体αbと同一の区点に配置することにした。
これは字体αBと字体αbについての規準であるが、部分b及びB{部分字体}を含む漢字についても、この規準を適用することにした。例えば、ある区点の例示字体γBと例示されていないγbの区点は、γBの区点、例示されていないδBとある区点の例示字体δbは、δbの区点とする。これらが「包摂規準」の適用である。
ただし、θBとθbがそれぞれ別の区点の例示字体である場合、θBをθbの区点に当てはめたり、その逆をしてはならない。
また、例示字体ΩBという文字は使われてきたが、Ωbという文字は使われた痕跡がない。こうした場合、ΩBの区点にΩbという文字を作って当てはめてはいけない。
さらに、よく似ている字形は、字体差ではなくデザイン差ということらしい。こうした場合も「包摂規準」で規定している。また、ある文字が字体Hであり、それと異なる文字が字体Hである場合も同じ区点に配置することにしているが、これも「包摂規準」という言葉で説明している。
同じ名前のフォント(明朝体などの書体。一定のデザイン意図に基づいて設計された文字のひと揃い)の同じ文字でも、メーカーにより字体差あるいはデザイン差があることがある。字形とはデザインと同じに考えられる。