間違いが多すぎる?!
満を持して現れた『超漢字』。だけどプレス発表文やTRONWAREなんかの記述には、前後矛盾する記述が散見される。一体どれが正しいんだ?
このページはあくまで小熊善之個人の責任において製作されており、坂村健先生及びTRONプロジェクト及びパーソナルメディア社は関与しておりません。
- 140万字と150万字
- 拡張しない場合のスクリプト層の広さに関する記述。
計算すると、一面辺りのコードエリアは48,400。それが31面スクリプト層に割り当てられているので、スクリプト層のコードエリアは1,500,400。正しくは150万ですね。
ちなみに最初にこの計算間違いをしたのは誰であろう、坂村先生その人である。TRONWARE vol.50の講演録が、この計算ミスを犯している。困ったもんだ。
- KS C 5601とKS X 1001
- 韓国語に関してKS C 5601という記述とKS X 1001という記述が飛び交っているけど、これはKS C 5601がKS X 1001に改称されたことによるもの。中身は同じはずだから、どっちでも構わないはずだけど、やっぱ改称されたんだから合わせて欲しいものだな。イージーミスってところか。
- Big 5とCNS11643-1986
- 台湾の文字コードであるBig 5とCNS11643-1986。CNS11643とBig 5だとコード体系も收録字数も全然違うのに、これらが混じっているのはどういうことか。
これはCNS11643のあとの数字が魔法のタネで、実は現在のCNS11643は1992年版だったりする。これが86年版であるということは何が違うかというと、92年に追加された第3〜第7面が入らないということだ。これらが入らない第1、第2面は、実はBig 5とほぼ互換なのだ。
ただし、Big 5とコード並びが全然違ううえに、Big 5にあったダブルコーディングが解消されていたりするし、追加されている字もある。
CNS11643の第1面と第2面が13,735字。Big 5が13,461字。TRONWARE vol.59によると、收録字数は13,735字。
どうやら超漢字は「CNS11643-1986」であり、Big 5ではないようだ。
- 15万字か13万字か
- この話は計算がややこしいので、とりあえず下の表を見て欲しい。
JIS X 0208:1997 | 6,879字 |
JIS X 0212-1990 | 6,067字 |
GB 2312 | 7,445字 |
KS X 1001 | 8,224字 |
CNS 11643-1986 | 13,735字 |
小計 | 42,350字 |
これは、『超漢字』收録予定文字セットのうち、私が字数を確認できたものだ。これだけで42,350字となる。要するにこれにあと何を足すかで字数が決まるわけだ。
今昔文字鏡が約9万字なので、これで約13万という値が出る。
さらにUnicode 2.0の非漢字部分が入るらしい。Unicode 2.0は総計で字数が38,885字。漢字は21,204字。差っ引くと17,683字ってことになるが、本当か? ついでにハングル11,172字を差し引くとさらに6,511字にまで減ってしまう。TRONWARE vol.59 p.38の19,000字ってどこから出てきたんだ? ねえ住谷さん!
結論。
13万よりは多そうだが、15万にはなりそうにない。困ったもんだ。