間違いが多すぎる?!

満を持して現れた『超漢字』。だけどプレス発表文やTRONWAREなんかの記述には、前後矛盾する記述が散見される。一体どれが正しいんだ?

Caution!
このページはあくまで小熊善之個人の責任において製作されており、坂村健先生及びTRONプロジェクト及びパーソナルメディア社は関与しておりません。


140万字と150万字
 拡張しない場合のスクリプト層の広さに関する記述。
 計算すると、一面辺りのコードエリアは48,400。それが31面スクリプト層に割り当てられているので、スクリプト層のコードエリアは1,500,400。正しくは150万ですね。
 ちなみに最初にこの計算間違いをしたのは誰であろう、坂村先生その人である。TRONWARE vol.50の講演録が、この計算ミスを犯している。困ったもんだ。
KS C 5601とKS X 1001
 韓国語に関してKS C 5601という記述とKS X 1001という記述が飛び交っているけど、これはKS C 5601がKS X 1001に改称されたことによるもの。中身は同じはずだから、どっちでも構わないはずだけど、やっぱ改称されたんだから合わせて欲しいものだな。イージーミスってところか。

Big 5とCNS11643-1986
 台湾の文字コードであるBig 5とCNS11643-1986。CNS11643とBig 5だとコード体系も收録字数も全然違うのに、これらが混じっているのはどういうことか。
 これはCNS11643のあとの数字が魔法のタネで、実は現在のCNS11643は1992年版だったりする。これが86年版であるということは何が違うかというと、92年に追加された第3〜第7面が入らないということだ。これらが入らない第1、第2面は、実はBig 5とほぼ互換なのだ。
 ただし、Big 5とコード並びが全然違ううえに、Big 5にあったダブルコーディングが解消されていたりするし、追加されている字もある。
 CNS11643の第1面と第2面が13,735字。Big 5が13,461字。TRONWARE vol.59によると、收録字数は13,735字。
 どうやら超漢字は「CNS11643-1986」であり、Big 5ではないようだ。
15万字か13万字か
 この話は計算がややこしいので、とりあえず下の表を見て欲しい。
JIS X 0208:19976,879字
JIS X 0212-19906,067字
GB 23127,445字
KS X 10018,224字
CNS 11643-198613,735字
小計42,350字
 これは、『超漢字』收録予定文字セットのうち、私が字数を確認できたものだ。これだけで42,350字となる。要するにこれにあと何を足すかで字数が決まるわけだ。
 今昔文字鏡が約9万字なので、これで約13万という値が出る。
 さらにUnicode 2.0の非漢字部分が入るらしい。Unicode 2.0は総計で字数が38,885字。漢字は21,204字。差っ引くと17,683字ってことになるが、本当か? ついでにハングル11,172字を差し引くとさらに6,511字にまで減ってしまう。TRONWARE vol.59 p.38の19,000字ってどこから出てきたんだ? ねえ住谷さん!
 結論。
 13万よりは多そうだが、15万にはなりそうにない。困ったもんだ。