トップ 最新 追記
RSS feed

ただのにっき


2011-05-18(水) [長年日記]

XMDF形式の電子書籍を「自炊」してみた

なんでこんなことをする気になったのかという話は後半に書くとして、SpaceTownブックスなどで販売されているXMDF形式の電子書籍をKindleで読めるようにしてみた。いわば「電子書籍の自炊」である。お惣菜を買ってきて、ひと手間加えるみたいな?

似たようなことを考える人は当然いるわけで、手法的にはXMDF形式の電子書籍を無理やり変換してkindleで読むに書かれているとおり。UWSCのスクリプトは少しパラメタをいじってこんな感じ:

dir = "PATH_TO_IMAGE_FOLDER" //保存フォルダ
page = 2000 //ページ数
wait = 0.2 //ウェイトタイム 0.2sec

while True
   ifb GETKEYSTATE(VK_UP)
      for count = 1 to page
         id = GETID(GET_ACTIVE_WIN)
         SAVEIMG(dir+"/"+REPLACE(FORMAT(count, 4), " ", "0"), id, , , , , 1, 100)
         KBD(VK_LEFT)
         Sleep(wait)
      next
   endif
   Sleep(0.2)
wend

XMDFをWindowsで読むためのブンコビューアは、ウィンドウ幅を最小に、ウィンドウ高をできるだけ大きくとった上で、こんな感じの設定。このへんは使用しているディスプレイによって違ってくる:

  • フォント: LC明朝、28ポイント(Bold)
  • 文字間: 小
  • 行間: 小
  • 余白: なし

UWSCを走らせると、800枚超のjpgファイルができるので、それをjpgディレクトリの下に入れて、下記のスクリプトを(こんどはLinuxで)走らせれば、Kindle上でdot by dotなPDFファイル「out.pdf」ができる。-cropパラメタの値は削りたい余白に合わせて調整する:

#!/bin/sh                                                                                                 
for dir in png pdf; do
   if [ ! -d $dir ]; then mkdir $dir; fi
done

for jpg in jpg/*; do
   png=`echo $jpg|sed 's/jpg/png/g'`
   pdf=`echo $jpg|sed 's/jpg/pdf/g'`
   convert $jpg -chop 60x60 -gravity SouthEast -chop 15x60 -gravity NorthWest -resize 560 $png
   sam2p -j:quiet $png $pdf
done
pdftk pdf/* cat output out.pdf

Kindleに送るとこんな感じ。紙の文庫本を自炊したものより、字が大きめで読みやすい:

[写真]「自炊」したXMDFファイルをKindleで表示

ただ、ちょっとフォントが美しくないんだよなぁ。明朝の横画の太さがまちまちで、例えば「日」の字なんて中央の横線だけ妙に太かったりするので、これはブンコビューアのレンダリングエンジンがショボいのだと思う。フォントを入れ替えれば多少はいいかと思い、青キン明朝に変えてみたら「っ」のような小さい字の表示位置がぶっ飛んでしまったのでボツ。シャープさん、もうちょっとClearTypeの研究をしてくらはい。


さて、なんでこんなことをしているかというと、Twitterで風穴さん(@windhole)と「どんな電子書籍なら買う気になるか」という話をしていたのよ。おれは「20年後にもちゃんと読める」という条件を掲げて、端末依存やアプリ依存、非公開フォーマットの電子書籍は買いたくないという話をしたんだが、風穴さんは「制限なしXMDF」は消極的に許容しているという。

XMDFは最近、制作ツールを無償公開するなど、オープン化に一歩踏み出しているものの、(おれの予想では)数年以内にEPUB3に負けると思う。おそらくXMDF→EPUB3変換ツールの登場は時間の問題だろう。それなら今からDRMのかかっていないXMDFなら買っておいてもいいかもね。

だいたい、縦書の書籍では選択肢がほとんどないわけで、紙の本を買ってバラしてスキャンするのに対して、XMDFをビューアごとキャプチャして画像PDFにまとめるのでは、手間も金額も段違いに少ない。おまけにゴミも出ないから環境にも優しい。なんだ、紙の本を買うんだと思えば、躊躇する必要なんてなかったんだ。

というわけで、試しに「プリンセス・トヨトミ」を買ってみたわけだ。普段はけっして買わないベストセラーだけど、他に読みたいのがなかったので。

プリンセス・トヨトミ (文春文庫)
万城目 学
文藝春秋
¥869

これで買える電子書籍の幅が広がって「よかったよかった」ということになればいいのだが、試しにSF棚を見て「おっ、ハヤカワ文庫があるじゃん」と思ってリストアップしてみるとほとんど全部が「グイン・サーガ」だったりして、はっきりいってお話にならない。早川・創元という日本のSF二大レーベルが一番電子書籍に及び腰ってのはどうなんだよ、え?

Tags: ebook kindle
本日のツッコミ(全11件) [ツッコミを入れる]

Before...

ただただし [>yoosee ほう、それは興味深い! だとすると、「あんまり売れないから電子化する余力がない」とか「読者が年寄りば..]

NOBU [古いエントリwp上げてすみません。 ACCESS、EPUB 3準拠の電子書籍ビューワを発表 http://eboo..]

ただただし [「ただ伝説」言うなw それはさておき、このコンバータが一般向けに提供されるといいんですけど、まぁそれはないんじゃない..]

NOBU [そうなんです。キャプチャする気で買ったはいいけど、できなかったら悲しいのでまだ手を出してません。 「さよならジュピタ..]

lisper [画像ファイルに変換した後にOCRにかけてテキスト化しちゃうとか]

ただただし [OCRにかけて得られるのは(精度にやや難のある)テキストデータだけであって、レイアウトやルビなどの書籍の体裁となる重..]


2011-05-17(火) [長年日記]

tDiary: Amazon.co.jpへのリンクを短縮URLに変換

Issue#32で議論していたように、amazon.rbが生成する長ったらしいURLをbit.lyを使って短縮する仕掛けを入れた……のは今日(5/17)なんだけど、これを書いているのは5/19だったりして。

amazon.jsはまだまだ手抜きだけど(少なくとも同一ページ内ではキャッシュくらいすべきだし、下スクロールだけじゃなくて上スクロールにも対応すべきだ)、それより重要なのは今までなんとなく存在していたjsディレクトリの使い方を規定したことかな。doc/HOWTO-make-plugin.htmlも更新しておいたので(5/19)、開発者の人は参照されたし。

Tags: tDiary
本日のツッコミ(全6件) [ツッコミを入れる]

hsbt [テストの書き方も(ry どうするのがいいかなあ。]

kou [https://github.com/tdtds/tdiary-core/blob/master/misc/plug..]

sasasin [へんじがない。ただのしかばねのようだ。 http://www.tdiary.org/20021121.html]

ただただし [> hsbt javascriptのテスティングフレームワーク事情は(rubyのそれ以上に)知らないので、いろいろよ..]

kou [あぁ、そうなんですか。 であれば、設定画面の部分はrevertしなくてよかったんじゃないかと思います! Webからも..]

ただただし [それは、そのとおり(苦笑)。近いうちに戻しておきます。]


2011-05-15(日) [長年日記]

ドーラ、(だいたい)満一歳

[写真]甘えるドーラ

ドーラがうちに来たときにほぼ生後3ヶ月ということだったので、まぁそろそろ満一歳というところでしょう。当時は「血のつながらない妹」というキャラだったが、自宅周辺の野良猫事情を観察していると親が誰なのかだいたいわかるので、おそらく血のつながった兄妹だと思われる。もっともグスタフとはかなり性格が違って、あいかわらず野良っぽいというか独立心は旺盛だ。

とはいえ最近は(不妊手術後はとくに)甘えてくることも増えてきたので、次第に丸くなってくるんだろうなぁとは思うけど。抱っこが好きじゃないのはなんとかしていただきたい。あと、グスタフは満一歳で5.5kgもあったのに、ドーラはまだ3kg未満なので、もうちょっと大きくなってもらわないと不安だよなぁ。

[写真]餌を待っているところ

Tags: dora
本日のツッコミ(全3件) [ツッコミを入れる]

sora_h [もし本当だとしたら,すごい偶然だなあ<実は血が繋がってるような気がする]

ただただし [猫には縄張りがあるから、同じ場所で拾われた子猫が兄妹というのは、そんなに珍しい話ではないと思うよ。]

sora_h [ほー..]


トップ 最新 追記
RSS feed