というわけで、午前0時頃はFTRONのチャットやってました。
午前2時過ぎにチャットがお開きになって、その後は熟睡。午前10時頃に一度電話で起こされたけど、その後もまた眠り続け、結局起き出したのは午後4時頃。
寢正月万歳ってもんですな。
あとは本を読んで過ごしました。
小川一水の同人誌なんぞ読んでたりして。
時間は遡るが、2日の午前1時半頃、悪友から電話があった。何かと思えば、「頼んどいたメモリ買ってくれた?」ときた。
勿論こう答えた。「俺別に毎日毎日秋葉原行ってるんと違うんやで」
二人とも、年始の挨拶をしていないことに気付いたのは、電話を切る直前になってからだった。
今日は頑張ってキーボードを叩いてみた。
あんまり進捗はなかったけど。
ちょっとした図を作ったりとか。
それをpngにしてみたらNN4とIE4で正しく表示されなくて困ったり。
なんだかなぁ。
どうも挙動が変だと思ったら、HTMLにミスがあったりとか(笑)。
私の場合、全部テキストエディタで手書きしているので、ミスは誰のせいでもなく自分のせい。
このことについてちょっと最近感じていること。
いわゆるブラウザで閲覧している版面(……用語としては変なんだけど、他に適語が見当たらないので勘弁)は、HTMLでマークアップされたソーステキストをブラウザが解釋したものだ。こいつの著作権はどの辺に認められるのだろうか。
私の場合はいい。全部自分で書いてるんだから、このHTMLファイルの中身全てが私の著作物だ。
では出来合いのHTMLエディタやWeb authering tool類を用いてWeb Pageを作っているばあい、その製作者の著作権とは一体何に対して認められるものなのだろうか。
版面だろうか? しかし版面はHTMLをブラウザが解釋して表示するものだから、ブラウザによって見栄えがかなり違う。
ではそのテクストか? しかしタグを除いたテクストのことか? 一部の特殊文字はマークアップされて表現するしかないが、それは一体どういう扱いになるのか?
考え始めると切りがない。大体、ISO-2020-JP2へのエンコードは私だって機械任せなわけで、自分でバイナリエディタを操っているわけではない。もしエディタにバグがあって、エンコードミスを犯した場合、私の著作物はどこへ行ってしまうのだろうか。
悩ましい悩ましい。
ついでにそのまま新宿まで足を伸ばし、東急ハンズでちょっとばかりお買い物を。角2の封筒を大量に購入してくる。情報整理に角2の封筒を多用する関係で、消費量が多いのである。
最後に秋葉原へ寄って友人に頼まれていたメモリ他色々を買って終わり。
CD-Rの不良ロットに中ったらしい。
焼いても焼いても不良になる。それはもう見事なものだった。
記録面を見てみると、肉眼で分かるほど色素にムラがある。流石ノーブランドのバーゲン品だ、と妙な感心をしてしまった。
一方で、これに焼いていた情報が実は職場のバックアップデータだったりしたものだから、もう恐くてやってられない(爆)。
ちゃんとしたメディアを買って来るべきであろうか?(当たり前だ!)
有限状態オートマトンによる計算不能性の証明なんぞに思いを馳せていると、人間って凄いなぁとか思わなくもない。
で、続いてなんのことを考えるかというと、心眼による文字列読解の話なんだよね。
簡単な例を挙げると、「ステータス」が「ステ−タス」と書いてあっても人間読めるわけですよ、これが。私だったら、後者は「すて まいなす たす」って読みかねませんけど。(それは単に多言語のやり過ぎで心眼の機能が自動的に働かなくなっているから)
「ステ−タス」が「ステータス」の誤記なのか、本当に「すて まいなす たす」なのかは、有限状態オートマトンでは判斷できない。よーするにコンピュータでは判別できない。巨大な辞書と莫大な用例を用意して参照させれば、「“ステータス”の誤記である可能性が高い」と結論づけることはできるかも知れないけど……。
ところが人間という奴は、一見しただけで、「ステータス」と読んでしまうわけだ。もちろん書き手も「ステータス」だと思って書いてるし。それどころか、機械にまで「ステータス」と判じてもらうことを期待したりする。
ここに多言語処理の難しさがあるわけですね。
つまり、コンピュータって奴は曖昧性のある物を処理できない。だって有限状態オートマトンなんだもん。ところが現実の文字(というか文字列)って奴は曖昧なんだな、これが。だって人間がやってんだもん。
この両者の深遠なる溝を超克することを多言語処理(あるいは文字処理)ってやつは求められているわけなんで、たまにはコロ助に向かってデキッコナイスとか言いたくなる謎の外人さんな気分に浸るのよ。
(最後にワケのわからんネタで締めくくるのであった)
買ってきた雑誌の付録CDに、Netscape 6が入っていたので、試しにインストールしてみた。
感想。
起動が遅い。
挙動が重い。
メニューのフォントが小さい(17inchで1600×1200環境なので、メニューフォントなどを大きくしている)。っつーかスキンって選べるだけで自分で好き勝手にカスタマイズはでけんのか?
ショートカットファイルをドラッグ&ドロップしたら、ロケーションがショートカットファイルの場所になっちゃって、相対指定リンクが辿れなくなる。
時々わけもなく固まる。
アプリケーションとしての出来という一点だけなら、IE5.5の方が斷然上ですね。下手したらNN4より劣るかも。
でもHTMLの解釋や文字コードの処理についてはNN4より上なので、我慢してでも使うべきなのかもしれない。
でもなんか未完成品って感じがふんぷんです。
夕刻。竹居さんから襲撃予告を頂く。
21時頃、竹居さん襲来。
書庫に入ったり、文字コードの話をしたり、私の本来の専攻(日中戦争—太平洋戦争期の日本の対ユダヤ政策)の話をしたり。
夏コミで收集してきた本を漁ったりもした。かなり趣味が重複しているらしい。
こう書くと、きっと明日制服系のイベントのスタッフをするためにはるばる大阪から上京してくる男から何か言われるだろう。
竹居さんが食事をして来るかどうか微妙な時間帯だったので、うちで食べても大丈夫なように料理を作った。結局は竹居さんは事前に食べてきたので、私の明日の朝食になることになった(笑)。
今日こそは! CD-RWドライブを買うんだ!
殆ど一目散に秋葉原へ出かけ、PlextorのPX-W1210TSEを買ってきた。ついでに256MBのメモリと30GBのHDDも買ってきたが、これらは2月に発売されるInDesignを見越しての先行準備。
帰ってきてすぐに一枚CD-Rを焼いてみたのだが、流石というべきか当たり前と言うべきか、12倍速で書き込めてしまった。ISAのSCSIカードであることを考えると、やはりBurn-Proof機構が効いていると見るべきなのだろう。
焼いたメディアもちゃんと読めた。
かくしてお役御免となったCD-RWドライブは、友人に讓り渡されることとなるのであった。
定期券を切り替えました。
と書くと、「いよいよ秋葉原経由に変えたのか」とか勝手に早合点されそうなので書いておくと、少しだけ距離を伸ばして、神保町までの定期にしたのです(笑)。3ヶ月で1,500円くらい自腹を切ることになるのですが、職場の最寄り駅から神保町まで普通なら初乗りの160円ですので、3ヶ月で10回以上神保町へ寄れば元は取れる計算になります。3ヶ月で10回なんて余裕じゃないですか。往復なら5往復。楽勝。
さあ、これで交通費を気にせず神保町へ行けるぞっ♪
夜。デンパ大阪襲来。
昨夜のムーンライトながらで上京し、本日は蒲田での制服系イベントのスタッフをこなした疲れきった顏を引っ提げての到来。殆ど寢てないと言いつつも、書庫を漁っていく。
「怪しいものはないか〜」
と怪しげな声を発しながら書庫を徘徊。そんなものあるわけがなかろうに。歴史的文化的に貴重なものなら少なくはないが。
同人誌を読み漁ったりして9時半過ぎにファミレスへ河岸を移して食事& Talk。22時半に、彼はムーンライトながらに乗るために去っていった。
『システム管理者の眠れない夜』という本を読んで、本当に眠れなくなりそうになった(笑)。っつーか、私、システム管理者違うって。
なんか読みながら職場の環境をどうやって整えていこうかって真剣に考え始めている自分が嫌。
はあ。
とりあえず今日は他に二冊ほど本を読み終えた。
まだまだ残りは多い。
今日職場でちょっとショックなことがあったですよ。
「小熊さんって三十幾つだと思ってました」
いや、慣れてるんですけどね、ええ……。
まだ三十には三年ほどあるんですよ、ホントの話。
その昔、OFF会で歳を言ったら「詐欺だ」って言われたことありますからね。それに比べれば。
ふんっ。
今日は仕事が終わった後に秋葉原にちょっと寄ってから、東京シューレの学生ゼミへ。前回行けなかったので、3ヶ月ぶりくらいかな。
やっぱ月に一回くらいはこうやって教育問題で議論したりするのはいいよね。若い連中や尖がった連中と顏合わせて言葉を交わすのは、いい刺激。
今回は「評価」という点で議論が盛り上がった。
私なんかはどっちかというと、誰からどういう点数評価をされようとあまり気にしないところがあります。その評価だけで自分の価値が決まるわけでもなし。要は評聞に左右されなければいいわけで。もちろん、評価なんて他人のすることだから、基本的に自分が干渉するところではないということもありますが。
要は毅然としてりゃいいんですよ、気高くあれば。
BTRON Clubの発表原稿を書くために、最近の文字コード関係の資料なんかを再読したりしてたんだけど、あれだね、どれもこれも、妥協を重ねるうちに企画が骨拔きになってる感じ。ここまで来ちゃったら、いっそのこと文字コードによるテキスト処理を一回諦めてみてもいいかもしれない(笑)。
これはかつてπちゃんが言っていたことではあるんだけど。
例えば、コード組合せによる文字表現か、組合せ済み文字をコーディングするかは議論が常に白熱しているところだけど、僕に言わせれば白熱すべきところが違う。どっちにしろその記述言語における全組み合わせパターンを明確にして、文字区切りが一意に確定しうる状態になっていることが前提であり、それがなされてもいないのにそんな議論なんかしても、完全な空論なのだ。
日本語で考えれば、仮名文字に付く濁点などがそれにあたる。つまり、濁点が最初から付いたものを文字としてコーディングするか、あるいは濁点は別コードとして、被濁点文字+濁点という形で表現するかというのは本論ではなく、「どの文字に濁点が付き、どの文字にはつかず、そしてどこで文字の区切りとなるか」が明確であれば、どちらを採用しても結果的には同じことになる。逆にいえば、その点が不明確であれば、どっちを採っても半端な物になって問題が残る。
というわけで、どなたか文字コードの地獄を覗いて見たい人は、遠慮なく飛び込んでいって欲しい。特に若人。未来のコンピュータ環境は君を待っているぞっ(笑)。
佐川急便の不在票の関係で、今日は定時で切り上げて自宅へ直行です。
なかなかやってこない佐川急便を待つ間、久しぶりにGPMをやりました。って言っても、途中で上手くいかなくなったので初日からやり直したんですけど。奧が深いゲームですねぇ。
一昨日の文字コードの話の続き。
典型的な有構造結合音節文字であるハングルを例にしたい。ハングルは初声(子音)+中声(母音)+終声(子音)という韓国語の音韻構造に沿って、子音部品+母音部品+子音部品(ない場合と二文字の場合あり)という組み合わせで出来上がったいる。そのため、各部品の発音を覚えると、一応発音だけはできるようになっている。
さて、ここでこのハングルを文字コード化することを考える。
すると二通りの方法がすぐに思い付けるだろう。
ひとつは、構造があらかじめ分かっており、かつ組み合わせが有限であるのだから、文字コードの組み合わせで表現する方法。もう一つは、既に組み合わせた文字に順に文字コードを振っていく方法である。どちらにしろ、最終的に表現できるものは同じである。処理が少々異なる程度で。
つまり、どちらを選ぶかというのは、本来は美学の問題でしかない。
しかし、ここに別の思惑が絡むと話が厄介になる。
例えば、「組み合わせ上存在するが、実用上不要な文字」の存在である。これを表現可能にしておくのは無駄だという意見が出始めると、話は混沌とし始める。ちなみにハングルは単純計算で1万2千通りくらいの組み合わせパターンが存在するはずであるが、現実に使われているのはそのうち7千弱であると言われている。
この辺の処理を誤ると、Unicodeのような醜態を晒すことになる。
また逆に、組み合わせの時に終端をきちんと定めておかないと、組み合わせが有限にならなくなってしまい、結局処理出来ないことになる。
あらゆる文字を扱える文字コードというのは、理想ではあっても現実には存在しないのだ。文字コードの設計も、フォントの作成も、処理系の実裝も、人間の想定内ででしかなされないからだ。
文字処理とは、まず、例外を含めて有限組み合わせの中に文字表現追い込んでから、初めて議論されるものなのだ。
たったこれだけのことを知るのに、一体どれだけ私は時間を費やしたのだろうか。
大した欲望ではないが、私が多言語処理に関っていた二年少しの間に身につけたものを、後進に伝えたいと強く思う。
だからカモン!若人!(笑)
中野のまんだらけに行ったのが悪かったのか。
なんか手元にあるポケモンのオレンジカードを売っ払おうと思ったのだが、引き取ってもらえなかった(爆)。やはりこういうアホなアイテムはババなのか。素直にYahooオークションあたりにかけるべきだったな。
しかしなぁ、なんで俺んとこにこんなもん回ってくんねんな?
靴を買おう。
そう思って靴屋をはしごする。
生活を構成する四要素「衣食読住」の中で、私が一番手を拔いているのが衣であるのだが、履物だけは手を拔かないことにしている。なにしろ、スニーカーが半年保たないような人間なので、下手な靴など履こうものなら、マメやら靴ずれやらでえらい騷ぎになるのだ。
ここ数年、DUNLOPのスニーカーを愛用している。問題は、置いてある店がさほどないこと。つくばでも結構うろついたものだが、北区でも覚悟してうろつきまわった。近所の靴屋は初っ端に爆死。二件駄目だったところで、三件目でなんとDUNLOPの特約店を発見して、大いに喜ぶ。カタログを見ながら靴を注文した。
これで暫く靴の心配だけはしなくていいな(^^)。
急に冷え込んできたせいか、体の各所で関節が悲鳴をあげている。まあ、若いときに無茶苦茶やった身体なので、できることなら完全分解整備でもしてやりたい身体ではあるのだが、人間のからだは機械ほど便利にはできていないのですねん。
コトバは分かるが内容が分からない本を読むのは辛い。読書速度が急激に落ちる。
同じようなことは他でも言えるが。
さて、今日のトップニュースといえば、やはり『超漢字3』なのだろうか。
何にせよ、アナウンスから発売まで一ヶ月ないというスケジュールに首を傾げる向きもあるだろうし、また一部からはアレはどうなった?という疑問を頂くことと思う。
それについて、私はノーコメントとさせてもらう。
そういう疑問はパーソナルメディアにぶつけるのが筋であるし、また答えるのも当事者であるべきだ。答える義務を有するのもまた彼らである。
私の知りうる事実関係をここに書くことによって関係者に迷惑がかかるのは本意ではないし、今となっては積極的に関与して状況を動かす段階でもない。
どうでもいいことなのだが、chokanji.comのトップページはHTMLが間違っているし、プレスリリースには当初誤記があった(すでに修正されている)。もうちょっと愼重になってもいいと思うぞ。
コレはなにかというと、大修館書店から近日発売の『漢語新辞典』である。発売日はまだ先じゃないかと言わないで欲しい。なぜか手に入ってしまったのだ。よくある身近な不思議という奴である。
版型はA5版で、帯にも書いてあるように学習用漢和辞典ということである。値段は2,859円+消費税。しかし思うんだが、大修館って学習用漢和辞典として『新漢和辞典』と『現代漢和辞典』を出しているのだが、自社競合しないのか?(苦笑) 『漢語林』もあるしね。
それはともかく、著者は鎌田正先生と米山寅太郎先生。両先生とも、諸橋先生の直弟子で、『漢語林』『大漢語林』『大漢和辞典語彙索引』『大漢和辞典補巻』のコンビ。『漢語林』『大漢語林』ともに所有しているが、非常に良い辞典。この辞典も……と期待はある。
さて、この辞典のウリは、先の国語審議会での“表外漢字字体表”に対応したことと、“JIS第3、第4水準漢字対応”の二点であるらしい。親字の下に句点コード、JISコード、シフトJISコードの三つの番号が振られている。もっとも、第3第4水準漢字にはシフトJISコードは振られていないが。個人的には補助漢字の句点番号の方が用度は高いと思うが。
本文は全て2色刷りで見易く、引きやすい。各部首の最初に掲載字が一覧で載っているのは、『新字源』などで採用されている方式を取り入れたものだろう。解説はやや鬱陶しいと思うくらい。しかし、「これ一冊だけ」の人にはこれでいいのだろう。多少語句の典拠が薄いようにも思うが……。
部首索引は基本的に康煕字典の字形で引くようにできており、現在の省略形からは康煕字典体を参照するようになっていて好感が持てる。
人名索引や故事成句索引などもついている。
中国簡化字表および対照表や表外漢字字体表掲載字表など、表類も充実している。年表も当然ある。
ただ、なぜか四角號碼索引がなくなっているのが惜しい。まあ、そんなもので辞書を引ける奴がこの辞書を使うとは思えないと言われればそこまでだが……。
全体としては、よくできているし、学習用としてはちと難しいような気もするが、気輕に引く辞書としては收録字数の多彩さがウリなんだと思う。
でもやっぱりなんか釋然としないものがあるのは事実。この辞書買うんだったら、もうちょっと欲張って『大漢語林』+『語彙総覧』という気がする。(ちなみに『大漢語林』のコード表示はJIS第1第2+補助漢字の組み合わせ)
値段は6倍くらいになるけど(炸裂)。
chokanji.comのトップページは相変わらずHTMLが間違ったまま。ブラウザで表示されることが全てではないんだがな、世の中ってのは。
っつーか、そーゆー甘っちょろいことしてると、多言語に取り組む姿勢まで疑われかねんぞ〜。(少なくとも私は既に疑っているが)
あっちゃこっちゃ火ぃ吹いとるなぁ……。舞台裏はある程度知っているが、でもこればっかりは書けないことなんだよ。
希望としてはとっとと当事者たちが腹括って事実を詳らかにすることなんだが、その結果がどうなるかなど考えると、それはそれで頭が痛い。
明日のBTRON Clubに行きたくないと感じている人は何人くらいいるかな?
BTRON Clubにて、坂村先生の講演。「GTと今昔」。要するに超漢字3で今昔文字鏡が外されたことについての説明。
間違いではなかった(と思う)が、事実の全てではなかった。
今後このような説明が一般ユーザにまでなされるのかどうかは分からない。
最近この日記が恐いとかやさぐれているとか、いろいろ言われた。
心がすさんでるからだね。
昨日、二人ほどから「いつ本を読んでいるんだ」と質問された。
普通の小説の文庫本の場合、通勤中の地下鉄約20分で80ページくらい読める。往復すると大体160ページ。あとは家に帰って1時間も読めば一冊終わる計算。
ほら、何の不思議もない。
とりあえず昨日と今日で『月をめざした二人の科学者』(中公新書)を読了。
……あれ? セブンイレブンに本を取りに行くの忘れてる?
幸村誠の『プラネテス』(講談社モーニングコミックス)第1巻を買ってくる。週刊モーニングに不定期連載されていた宇宙物の漫画で、大のお気に入り。第1話が掲載されたのが99年1月だったので、足掛け2年で漸く単行本化。
夢の補給。
夢といえば夢ノ二のコミックスも出てた。『みずいろ』の第2巻。あ、「大石まさる」だっけ(意味不明爆)。
とりあえず昨日今日で『本の未来はどうなるか』(中公新書)を読み終えたので、次は『死体の叫び』に移る。その前に今日買ってきたコミックス5冊を消費。ほら、常識的な速度でしょ?>里見くん
大阪の駄目人間が「今日は給料日だし、日本橋に行きたいよ。[< 断じて禁断症状ではない!]」と書いていたが、これについては、確かに禁斷症状ではないだろう。酸素を求めて口をパクパクさせている金魚のことを「禁斷症状」と言ったりはしない。つまり、彼は既に加根田金男少年ではなくカネゴンなのである。カネゴンが金を食べないと死んでしまうように、彼はデンパ源となる濃ゆいアイテム無しには生きていけないのである。
休暇がとれない彼の健鬪を心から祈るものである。
SEGAのDreamcastだが、滅びることがわかったので買ってもいいかな、と考えている。しかしあのヴィジュアルメモリだけはいただけないのだよな。ハッキリ言って邪魔。
しかし……新聞各紙が一面で報道するようなことなのか、SEGAの家庭用ゲーム機撤退って?
なんか職場で久しぶりにコリオリ力を感じちゃいましたよ。風邪引きさんが大量に出て、今やノルマンディーに上陸した連合軍のごとき様相。もし今「ライアン二等兵を搜してこい」なんて命令を受けたら、その場で上官を殴り倒してMPに出頭し、軍事法廷で「上官は頭がおかしい。透明なドイツ人とフランス語で言い争っていた」って証言しますね(笑)。
私には今昔文字鏡を擁護するいかなる義理も責務もない。逆にTRONの録を食んだ者として、それなりの忠誠心をTRON側に示す必要がある……ような気がする。
しかし、今回の『超漢字3』と『今昔文字鏡』にまつわる一連のTRON社会の世論形成には、一方からの情報提供による世論誘導が行われているような気がしてならない。
誰かが右と言っているなら、とりあえず左を見るくらいの心の余裕が必要な気がするのだがいかがなものだろうか?
昨日の件について。
あくまで私が言いたいことは、「人体は正しく使え!!」ということ。意味が判らない人は、とりあえずわかつきめぐみの『きんぎんすなご』(講談社)でも読んで下さい。
おっと。
別に私は変人の勸めをしているわけではありませんよ。
午後、職場から電話。電話口でPCの操作についてあれこれ指示。リモート管理できるようにしたほうがいいのか? それより休日出勤そのものを減らした方が……。
里見くんが「小熊さんも、僕が想像していたよりは本を読んでなかったんですね。もう、毎日鬼のように読んでいるんだと思ってました。誤解していて、すいませんでした(汗)」と。
わかればよいのだ、わかれば。
ちなみに今週月〜土で読んだ本は、マンガを除けば五冊。今読んでいるのが『物語スイスの歴史』。
スイスって国は、個人的にとても興味がある。現代史をやっているものにとって「国家とはなにか?」という命題は結構重い。19世紀から20世紀にかけて、国家のありようは大きく変わった。国民国家や民族国家、宗教国家に労働者国家、自由の国なんてのもある。様々な国が自らのアイデンティティを主張し、争いあった。
スイスは、実はその成り立ちが自由都市の軍事同盟である。今でも憲法上の名前は「スイス盟約者団」だ。つい近年まで国民皆兵制度を敷き(現在は徴兵制)、どの国家とも同盟せず、軍事的独立を貫いてきた。
国家のアイデンティティというものが極めて希薄な日本という国に住んでいると、スイスのように強烈な個性を持った国に一種の眩しさと恐ろしさを感じる。
今晩はFTRONのチャット。
某デンパ大阪の日記より。
「書き忘れていたが、ちゃんと23日のうちにL○L○の全プレ「っ○○!」CDは申し込んだぞ。予想通りだという方は笑ってくれてもよろしい。 」
ぎゃはははははっ。
土日を振り返って何をしたか、と言われると、本を二冊程読み、雑誌を三冊程読み、そしてあとは料理とガンパレード・マーチだった。
明日からの一月最期の三日間。恐ろしく忙しい予定。
この整備を終えて、テストクリアしたら万全、いつでも実戦OKやね。
ん〜。
終わった。
よし、テストを……
「出撃」
え?
(以下怒濤の戦鬪20ターン)
ああ……折角直した機体が……。
というわけで(どういうわけだよ)、今日は怒濤の理事会でした。私が入局して以来こっち、理事会を経る度に書記局の仕事が増える一方っつーのが何ともはや。今日も明日からのことを考えるとかなり疲れます。
はやく学士と修士の論文使用の件を片付けないと、先方にご迷惑が。