トップ «前日 最新 翌日» 編集
RSS feed

ただのにっき


2011-05-18(水) [長年日記]

XMDF形式の電子書籍を「自炊」してみた

なんでこんなことをする気になったのかという話は後半に書くとして、SpaceTownブックスなどで販売されているXMDF形式の電子書籍をKindleで読めるようにしてみた。いわば「電子書籍の自炊」である。お惣菜を買ってきて、ひと手間加えるみたいな?

似たようなことを考える人は当然いるわけで、手法的にはXMDF形式の電子書籍を無理やり変換してkindleで読むに書かれているとおり。UWSCのスクリプトは少しパラメタをいじってこんな感じ:

dir = "PATH_TO_IMAGE_FOLDER" //保存フォルダ
page = 2000 //ページ数
wait = 0.2 //ウェイトタイム 0.2sec

while True
   ifb GETKEYSTATE(VK_UP)
      for count = 1 to page
         id = GETID(GET_ACTIVE_WIN)
         SAVEIMG(dir+"/"+REPLACE(FORMAT(count, 4), " ", "0"), id, , , , , 1, 100)
         KBD(VK_LEFT)
         Sleep(wait)
      next
   endif
   Sleep(0.2)
wend

XMDFをWindowsで読むためのブンコビューアは、ウィンドウ幅を最小に、ウィンドウ高をできるだけ大きくとった上で、こんな感じの設定。このへんは使用しているディスプレイによって違ってくる:

  • フォント: LC明朝、28ポイント(Bold)
  • 文字間: 小
  • 行間: 小
  • 余白: なし

UWSCを走らせると、800枚超のjpgファイルができるので、それをjpgディレクトリの下に入れて、下記のスクリプトを(こんどはLinuxで)走らせれば、Kindle上でdot by dotなPDFファイル「out.pdf」ができる。-cropパラメタの値は削りたい余白に合わせて調整する:

#!/bin/sh                                                                                                 
for dir in png pdf; do
   if [ ! -d $dir ]; then mkdir $dir; fi
done

for jpg in jpg/*; do
   png=`echo $jpg|sed 's/jpg/png/g'`
   pdf=`echo $jpg|sed 's/jpg/pdf/g'`
   convert $jpg -chop 60x60 -gravity SouthEast -chop 15x60 -gravity NorthWest -resize 560 $png
   sam2p -j:quiet $png $pdf
done
pdftk pdf/* cat output out.pdf

Kindleに送るとこんな感じ。紙の文庫本を自炊したものより、字が大きめで読みやすい:

[写真]「自炊」したXMDFファイルをKindleで表示

ただ、ちょっとフォントが美しくないんだよなぁ。明朝の横画の太さがまちまちで、例えば「日」の字なんて中央の横線だけ妙に太かったりするので、これはブンコビューアのレンダリングエンジンがショボいのだと思う。フォントを入れ替えれば多少はいいかと思い、青キン明朝に変えてみたら「っ」のような小さい字の表示位置がぶっ飛んでしまったのでボツ。シャープさん、もうちょっとClearTypeの研究をしてくらはい。


さて、なんでこんなことをしているかというと、Twitterで風穴さん(@windhole)と「どんな電子書籍なら買う気になるか」という話をしていたのよ。おれは「20年後にもちゃんと読める」という条件を掲げて、端末依存やアプリ依存、非公開フォーマットの電子書籍は買いたくないという話をしたんだが、風穴さんは「制限なしXMDF」は消極的に許容しているという。

XMDFは最近、制作ツールを無償公開するなど、オープン化に一歩踏み出しているものの、(おれの予想では)数年以内にEPUB3に負けると思う。おそらくXMDF→EPUB3変換ツールの登場は時間の問題だろう。それなら今からDRMのかかっていないXMDFなら買っておいてもいいかもね。

だいたい、縦書の書籍では選択肢がほとんどないわけで、紙の本を買ってバラしてスキャンするのに対して、XMDFをビューアごとキャプチャして画像PDFにまとめるのでは、手間も金額も段違いに少ない。おまけにゴミも出ないから環境にも優しい。なんだ、紙の本を買うんだと思えば、躊躇する必要なんてなかったんだ。

というわけで、試しに「プリンセス・トヨトミ」を買ってみたわけだ。普段はけっして買わないベストセラーだけど、他に読みたいのがなかったので。

プリンセス・トヨトミ (文春文庫)
万城目 学
文藝春秋
(no price)

これで買える電子書籍の幅が広がって「よかったよかった」ということになればいいのだが、試しにSF棚を見て「おっ、ハヤカワ文庫があるじゃん」と思ってリストアップしてみるとほとんど全部が「グイン・サーガ」だったりして、はっきりいってお話にならない。早川・創元という日本のSF二大レーベルが一番電子書籍に及び腰ってのはどうなんだよ、え?

Tags: ebook kindle
本日のツッコミ(全11件) [ツッコミを入れる]
こ~りん (2011-05-19(木) 04:22)

サイエンス"フィクション"の老舗だからねぇ

ただただし (2011-05-19(木) 06:27)

作家の方は新しもの好きが多いと思うんだけどねぇ。

ROYGB (2011-05-19(木) 09:13)

創元だと日本人のミステリーはわりと電子書籍になってますが、SFはレンズマンが目立つくらいですかね。

ただただし (2011-05-19(木) 13:31)

翻訳本は契約時に電子出版の項がないのがほとんどらしいので出しにくいのはわかるんですが、「レンズマンばっかり」というのは今どきそれはないだろうと言いたくなります。様子見というか、やる気ないんだろうなぁ。

yoosee (2011-05-19(木) 22:43)

自分で買おうとした際の印象なので数字をちゃんと調べてないんですが、Amazon.comの方ですらSci-FiのKindle率はあまり高くないんですよ。
そっちの方は特にベストセラー系の新刊はKindleになるけど、少し古い物やマイナータイトルはなりにくいという傾向がある気がします。

ただただし (2011-05-20(金) 06:53)

>yoosee
ほう、それは興味深い!
だとすると、「あんまり売れないから電子化する余力がない」とか「読者が年寄りばかりで紙の本しか欲しがらない」という仮説も成り立つなぁ(笑)。

NOBU (2011-10-13(木) 10:23)

古いエントリwp上げてすみません。

ACCESS、EPUB 3準拠の電子書籍ビューワを発表
http://ebook.itmedia.co.jp/ebook/articles/1110/12/news093.html

上記記事中、「.bookやXMDFなど国内で有力な電子書籍フォーマットからEPUBへの変換が
ワンクリックで忠実に行える」との記載がありました。
DRM付きのものまで変換できるか明記されていませんが、たださんの予言の通りですね。
尤も、ただ伝説に新たな1ページが加わってしまいそうで怖いですがw

小松左京御大の訃報以降、「さよならジュピター」を読みたくてあちこちで探しているのですが、
XDMF形式のものしか見つからず、このエントリの元記事の方法でpdf変換しようかまだ迷って
いるところです。(虚無回廊1&2、首都消失はブクオフで見つけてスキャンビーに送りました)

早くハード・ソフト・ストアの垣根をなくして欲しいものです。

ただただし (2011-10-13(木) 18:26)

「ただ伝説」言うなw
それはさておき、このコンバータが一般向けに提供されるといいんですけど、まぁそれはないんじゃないですかね。XMDF自体をハックして、自前で変換できるライブラリを誰かが書くという流れになるんじゃないかなぁと(個人的には)思いますが。
なお、私もブックオフで見つけた「復活の日」を読み返しているところです:-) 「さよならジュピター」、私も探してるんですが、たしかにないですね。でもXMDF版は悪名高きhontoやパブリでしか売ってなくないですか? あれはキャプチャできないんじゃ?

NOBU (2011-10-13(木) 20:18)

そうなんです。キャプチャする気で買ったはいいけど、できなかったら悲しいのでまだ手を出してません。
「さよならジュピター」はGALAPAGOS STOREにもあります。リーダーはGalaxy S2にはインストールできるんですが、タブレット(XOOM)には対応してないのでこれも二の足踏んでます。老眼が進んでるので(苦)、スマフォの小さい画面で読むのは辛いのです。
結局、楽天の中古市場で探すしかないですかねぇ。。。

lisper (2012-01-06(金) 22:41)

画像ファイルに変換した後にOCRにかけてテキスト化しちゃうとか

ただただし (2012-01-07(土) 08:54)

OCRにかけて得られるのは(精度にやや難のある)テキストデータだけであって、レイアウトやルビなどの書籍の体裁となる重要な情報が欠けてしまうので、検索目的以外にはあまり意味がありません。


トップ «前日 最新 翌日» 編集
RSS feed