間違いが多すぎる?!

満を持して現れた『超漢字』。だけどプレス発表文やTRONWAREなんかの記述には、前後矛盾する記述が散見される。一体どれが正しいんだ？

このページはあくまで小熊善之個人の責任において製作されており、坂村健先生及びTRONプロジェクト及びパーソナルメディア社は関与しておりません。

140万字と150万字

　拡張しない場合のスクリプト層の広さに関する記述。
　計算すると、一面辺りのコードエリアは48,400。それが31面スクリプト層に割り当てられているので、スクリプト層のコードエリアは1,500,400。正しくは150万ですね。
　ちなみに最初にこの計算間違いをしたのは誰であろう、坂村先生その人である。TRONWARE vol.50の講演録が、この計算ミスを犯している。困ったもんだ。

KS C 5601とKS X 1001

　韓国語に関してKS C 5601という記述とKS X 1001という記述が飛び交っているけど、これはKS C 5601がKS X 1001に改称されたことによるもの。中身は同じはずだから、どっちでも構わないはずだけど、やっぱ改称されたんだから合わせて欲しいものだな。イージーミスってところか。

Big 5とCNS11643-1986

　台湾の文字コードであるBig 5とCNS11643-1986。CNS11643とBig 5だとコード体系も收録字数も全然違うのに、これらが混じっているのはどういうことか。
　これはCNS11643のあとの数字が魔法のタネで、実は現在のCNS11643は1992年版だったりする。これが86年版であるということは何が違うかというと、92年に追加された第3～第7面が入らないということだ。これらが入らない第1、第2面は、実はBig 5とほぼ互換なのだ。
　ただし、Big 5とコード並びが全然違ううえに、Big 5にあったダブルコーディングが解消されていたりするし、追加されている字もある。
　CNS11643の第1面と第2面が13,735字。Big 5が13,461字。TRONWARE vol.59によると、收録字数は13,735字。
　どうやら超漢字は「CNS11643-1986」であり、Big 5ではないようだ。

15万字か13万字か

　この話は計算がややこしいので、とりあえず下の表を見て欲しい。

小計	42,350字
JIS X 0208:1997	6,879字
JIS X 0212-1990	6,067字
GB 2312	7,445字
KS X 1001	8,224字
CNS 11643-1986	13,735字

　これは、『超漢字』收録予定文字セットのうち、私が字数を確認できたものだ。これだけで42,350字となる。要するにこれにあと何を足すかで字数が決まるわけだ。
　今昔文字鏡が約9万字なので、これで約13万という値が出る。
　さらにUnicode 2.0の非漢字部分が入るらしい。Unicode 2.0は総計で字数が38,885字。漢字は21,204字。差っ引くと17,683字ってことになるが、本当か？　ついでにハングル11,172字を差し引くとさらに6,511字にまで減ってしまう。TRONWARE vol.59 p.38の19,000字ってどこから出てきたんだ？　ねえ住谷さん！
　結論。
　13万よりは多そうだが、15万にはなりそうにない。困ったもんだ。