トップ «前日 最新 翌日» 編集
RSS feed

ただのにっき


2006-06-30(金) [長年日記]

W-ZERO3のPQBoxに大富豪辞書を適用する

W-ZERO3上での日本語入力はPQBox(PPC版)で決まり! ……となったわけだが、一般的に配布されている辞書は欠けている単語が多すぎて、ちょっと実用には遠い。

Palm版を使っていた人におなじみの大富豪辞書を使いたいと思ったが、PQBox用に変換されたものを配布しているところはないようだ(富豪辞書はあるみたい)。「大富豪を使っている」という声はいくつかあるんだけど、配布してる人はいないのかなぁ。

しかたがないので自作。変換方法を見つけたので、Rubyでちょっとスクリプトを書いた。最終的にできあがった「128分割辞書」はdaifugo-pqbox-ppc.20060630.zip(追記: のちに改善版を公開)。どうしても自動化できない部分もあり、多少の手作業が入ってしまったのが悔やまれる。

上の変換方法にあるように、PQBoxは「パタン文字列」をPalm版由来のローマ字でなく、ひらがなで持ってしまっているので、欠落した送り仮名情報を補うためにただでさえ大きなデータがさらに肥大化してしまった。同じ理由で、英単語→日本語変換辞書も割愛せざるを得なかった。また、ローマ字→ひらがな変換の過程でダブった単語を削除するためにsort + uniqをかけたため、単語の出現順序が文字コード順に(結果として学習の手間がかかる)。以上、すべて「パタン文字列」ひらがな化の影響。どういう意図でこういう設計変更をしたのか、理解に苦しむ。

なお、ローマ字の扱いには、suikyo(水鏡)におおいに助けられた。Rubyバインディングがあるのはもちろん、ちゃんとDebianにパッケージが入ってるし! すばらし! 標準の「romaji」テーブルを変更して、「清音・大書き」用のテーブルを作るだけで一発変換。これがなかったら挫折してたね。

あとは顔文字はバッサリ(好みの問題)。

実際にインストールしてみたが、予想通り出現順序の問題はあるものの、それは学習が進めば解消するわけで、かなりストレスなく文章が入力できるようになった。とはいえ、学習の手間はバカにできないかも。大人しくdic-tk MEあたりを変換して使うか? いずれにしても、快適環境作るのにずいぶんと手間暇がかかるヤツだのぅ >W-ZERO3

関連する日記: 2006-07-12(水)
本日のツッコミ(全1件) [ツッコミを入れる]
TrackBack (2006-07-12(水) 23:50)

http://sho.tdiary.net/20060712.html#p01
ただのにっき
W-ZERO3のPQBoxに大富豪辞書を適用する(2)
こないだ作ったPQBox用の大富豪辞書、読みをコード順で並べたもんだから、よく使う単語を探して↓キーを延々と押さなきゃいけない場面が多く、ちょっとシャレにならなかった。 ので、心を入れ替えて(心の問題なのか?)、「読みの短い順」に並べ替えた。これなら、長い読み..


トップ «前日 最新 翌日» 編集
RSS feed