トップ 最新 追記
RSS feed

ただのにっき


2010-12-05(日) [長年日記]

Kindle3向け自炊本作成手順、(おれ的)ベストプラクティス

注意: この記事は古くなっており、現時点ではベストでもなんでもなくなっている。進化した「Kindlize手法」についてはKindle3向けdot by dotな自炊PDFを(真面目に)作成するを参照されたい。

あれこれ試行錯誤の末、自分的にだいたい納得できるクオリティの自炊本作成手順ができたのでメモっておく。対象はKindle3。

例えばiPadをはじめとする大型タブレットだとこういう苦労はあまりなくて、気にせずフルカラーかグレースケールでスキャンしてPDFにしてしまえば難なく読めるんだろうけど、Kindle3やSONYのアレみたいなモノクロの5~6インチ画面向けにはいろいろ最適化が必要だ。だからKindleダメというわけじゃなくて、この軽さ、小ささ、そしてE-Inkの美しさを享受するためにちょっとした手順が増えることは厭わない、という話だ。

1. スキャン

自炊派の人たちの間では、この時点で各自のポリシーが違ってくるようだ。保存用にフルカラーで取る人もいるが、それだと古めの黄ばんだ本だと地に色がついてしまって、せっかくのE-Inkの白さが失われてしまう。ので、ここは(どうしてもという場合を除き)「白黒」で。

その他、ScanSnapの設定の主なところは以下のとおり。

  • 読み取りモード: スーパーファイン、白黒、両面、文字くっきり、白紙削除、傾き自動補正
  • ファイル形式: PDF、テキスト認識「しない」*1
  • 原稿: サイズ自動検出

2. トリミング

これはsasasinさんのpdf2mobi.shを使うが、彼の元PDFはフルカラーなので、やはり色々と設定が違う。ので、自分用にパラメタを変更してgistに置いておいた(pdf2kindle現在はRakefile化されてさらに進化している)。GPLバンザイ。方向性としては、

  • 画像のリサイズをいっさいしない(かえってサイズが大きくなるので。結果的に第二パラメタをなくした)
  • PPM(フルカラー)ではなくPGM(グレースケール)を使用
  • 文字くっきり化(ガンマ補正)をやめた(代わりにKindleの機能を使う)
  • PDFメタデータを最初に抽出

最後のメタデータだが、Kindle上で本のタイトルはファイル名から取られるけど著者名がPDFのAuthorから取られているので(しかも困ったことに日本語はダメ)、ここで入れておきたい。元のPDFに入れておけばいいじゃんという話なんだが、pdftoppmにはうまく取り出せないパターンがあるようなので、pdf2kindleがせっせと画像変換をしている間に、抽出したメタデータファイルをエディタで書き換えられるようにした。

実行時にはノンブルまで削除するためにトリミングのパラメタも指定する。今のところ文庫メインでやっているけど、ハヤカワ文庫だと「60 30 10 10」、創元文庫だと「35 85 15 15」あたりがちょうどいいみたい。

出来上がりはこんな感じで、こないだのとたいして違わないように見えるけど、実際にKindle上で見るとだいぶすっきりして「いかにもスキャンしました」的な感じがだいぶ薄れている。

[スクリーンショット]pdf2kindleによるPDF

3. OCR

できたPDFファイルはざっと出来上がりを確認後、ScanSnap付属ユーティリティでOCRにかける。まぁ、小説だったら別にやらなくてもいいかなという感じだけど、CPUの空き時間を見つけてバッチ処理してくれるモードがあるので、寝る前に仕掛けておけば朝にはできたてホカホカの自炊本ができあがっているという具合なので、やっておけばいいと思う。

あとはUSBでつないだKindleに放りこんでおけばいいんだから、たった3ステップ、楽なもんだ。たいして苦にはならないレベルまで自動化できたので満足じゃよ。

Tags: ebook kindle

*1 これがONだと連続して複数の本をスキャンしにくくなるので後回しにする。

本日のツッコミ(全11件) [ツッコミを入れる]

Before...

moriwaka [レイアウトを維持したい場合は -trim じゃなくて -crop にするとよいですね。我が家のLinuxはベアメタル..]

moriwaka [よく確認すると思ったように動いていなかったのでちょっと時間がかかってしまいました…… パッチはこちら: http:/..]

sasasin [画像補正のconvertと同じ要領で、PDF作成のconvertを並列化できます。最初のpdftoppmも、pdft..]

ただただし [>moriwaka ありがとうござます! 参考にします。 >sasasin まぁ、バッチ処理なので寝ている間に動か..]

倉橋 [pdf2mobi.shについてまったく使い方が分からないのですが、結構難しい話なのでしょうか?]

ただただし [倉橋さんのスキルやお使いのOSがわからないから、「分からない」だけではなんとも答えようがないですよ。 Linuxユ..]


2010-12-04(土) [長年日記]

仙台 1-1 川崎(TV観戦)

J1最終節。今年は天皇杯も早々に終わっちゃったので、これがシーズン最後の試合。今年は早じまいだなぁ。

わりと早くに得点して、いい感じで攻めていたので、油断して他のチャンネルに切り替えたりしていたら(最終節はお約束通り全試合同時スタートなのである)、いつの間にか追いつかれて、そのままドローで終わってしまった。高畑監督退任が決まっているので、勝って欲しかったんだけどなー。今年はホント、こういう展開が多いわ。

けっきょくリーグ最終順位は5位ということで、来季はACL出場はなし。楽になるけど、チーム作り直しになると思えばかえってよかったかも。あ、でも代わりにナビスコの試合数が多くなるのかな。

裏では朋友・FC東京のJ2降格が決まり、来年から多摩川クラシコはなしに。マリノスはよくわからない理由で主要選手が次々と切られてなんか大騒ぎだし、他にも各チームでベテランが何人も引退して、来季のJ1は、フロンターレも含めてずいぶん様変わりしそうだ。

Tags: frontale

2010-12-03(金) [長年日記]

小惑星探査機 はやぶさ物語 (生活人新書)(的川 泰宣)

「どうせ新書だし、中身薄いに違いない」と思って買わずにいたら勧められてしまったので、買ってみた。そして自炊後初めてすべてをKindle上で読んだ本(マンガ除く)となる*1

いやー、同じ的川さんの本ながら、先日読んだ「奇跡」よりずっといいですよ、こりゃ。新書だからってバカにしたらいかんなぁ。たしかに内容は薄いので、マニア向けにはまったく情報不足だが、もし今回の「はやぶさ騒動」で宇宙探査に興味を持った(でもあまり知識のない)人に勧めるなら本書が一番いいかも知れない。

「はやぶさ」の何がすごいのか、どんな意義を持っているのかという点については余すところなく伝えながらも、数年間にわたるイベントを上手にはしょりつつ、例によって熱く優しい的川節で語るのだ。口調がいつになくくだけていて柔らかいのがいいですな。「川口くん」とか、登場人物が「くん」付けなのも新鮮で。

小惑星探査機 はやぶさ物語 (生活人新書)
的川 泰宣
NHK出版
¥1

9784838721030

9784569792347

Tags: book hayabusa

*1 「jQueryクックブック」はチビチビ読んでるので。こういう読み方ができるのが電子書籍のいいところ。


トップ 最新 追記
RSS feed