ただのにっき
2006-06-30(金) [長年日記]
■ W-ZERO3のPQBoxに大富豪辞書を適用する
W-ZERO3上での日本語入力はPQBox(PPC版)で決まり! ……となったわけだが、一般的に配布されている辞書は欠けている単語が多すぎて、ちょっと実用には遠い。
Palm版を使っていた人におなじみの大富豪辞書を使いたいと思ったが、PQBox用に変換されたものを配布しているところはないようだ(富豪辞書はあるみたい)。「大富豪を使っている」という声はいくつかあるんだけど、配布してる人はいないのかなぁ。
しかたがないので自作。変換方法を見つけたので、Rubyでちょっとスクリプトを書いた。最終的にできあがった「128分割辞書」はdaifugo-pqbox-ppc.20060630.zip(追記: のちに改善版を公開)。どうしても自動化できない部分もあり、多少の手作業が入ってしまったのが悔やまれる。
上の変換方法にあるように、PQBoxは「パタン文字列」をPalm版由来のローマ字でなく、ひらがなで持ってしまっているので、欠落した送り仮名情報を補うためにただでさえ大きなデータがさらに肥大化してしまった。同じ理由で、英単語→日本語変換辞書も割愛せざるを得なかった。また、ローマ字→ひらがな変換の過程でダブった単語を削除するためにsort + uniqをかけたため、単語の出現順序が文字コード順に(結果として学習の手間がかかる)。以上、すべて「パタン文字列」ひらがな化の影響。どういう意図でこういう設計変更をしたのか、理解に苦しむ。
なお、ローマ字の扱いには、suikyo(水鏡)におおいに助けられた。Rubyバインディングがあるのはもちろん、ちゃんとDebianにパッケージが入ってるし! すばらし! 標準の「romaji」テーブルを変更して、「清音・大書き」用のテーブルを作るだけで一発変換。これがなかったら挫折してたね。
あとは顔文字はバッサリ(好みの問題)。
実際にインストールしてみたが、予想通り出現順序の問題はあるものの、それは学習が進めば解消するわけで、かなりストレスなく文章が入力できるようになった。とはいえ、学習の手間はバカにできないかも。大人しくdic-tk MEあたりを変換して使うか? いずれにしても、快適環境作るのにずいぶんと手間暇がかかるヤツだのぅ >W-ZERO3