トップ «前日 最新 翌日» 編集
RSS feed

ただのにっき


2012-11-22(木) [長年日記]

BOOKSCANが始めた「音声化チューニング」がすごい

BOOKSCANをネタにするときはたいてい褒める話なんだけど*1、今日プレミアム会員向けにα公開された「音声化チューニング」がすばらしいのでまた褒める。

チューニングサービスは、BOOKSCANで電子化された本を各社の電子書籍リーダー向けに余白を削ったりコントラストをあげたりしてくれるサービスだったのだけど、今日からここに「音声」に変換するサービスが増えた。これは、アクセシビリティに関わってるものとしては見逃せないので、本棚に入っていた適当な文庫本を選んで変換させてみた。

10分も待たずにできたとのお知らせ。サーバにはMP3ファイルができている。Nexus7にダウンロードして再生してみる。聞き取りやすい女性の声。音声は2倍速なので、(普段はそういう音声ソースを聞き慣れていない)自分はけっこう集中しないと意味を聞き取れなくなることがあったけど、これはたぶん慣れだ。

いやこれすごいよ。ほとんどおかしなところがない。まれに「パソコン」が「ぱそこそ」みたいに読まれたりする箇所はあるし、「ACT」が(アクトではなく)「えーしーてぃー」だったりなんて部分はあるけど、まぁ、小説を読む(聞く)分にはぜんぜん問題ない。BOOKSCANの技術力、あいかわらずハンパない。

日本のオーディオブック市場はもともとかなり寒い状況で、期待されたKindleすらText to Speechを削ったりとお先真っ暗な感じだったけど、まさかこっち方面から登場するとはなぁ。6インチ画面のでかい電子書籍端末なんて持ち歩く必要ないよ、ケータイで十分だよ。視覚障害者にかぎらず、晴眼者もこれは試してみるべき。

Tags: ebook

*1 著者インタビューもすごいけど顔ぶれがちょっとアレなので日記には書いてない(笑)。

本日のツッコミ(全3件) [ツッコミを入れる]
a (2013-02-24(日) 22:42)

こんばんは。
BOOKSCANで紹介されていたので、飛んできました。

さて、Wndowsユーザーなら、フリーソフトで音声化は可能です。
音声合成という技術を使います。
http://ja.wikipedia.org/wiki/%E9%9F%B3%E5%A3%B0%E5%90%88%E6%88%90

http://sourceforge.jp/projects/aozoravoice2/releases/?package_id=12158

な感じです。お役に立てば幸いです>アクセシビリティ

ただただし (2013-02-24(日) 22:53)

ええとですね、元になるテキストデータがある状況での音声合成技術が実用レベルなことくらいは当然既知ですよ。日常的にそこらじゅうで出会いますよね、合成音声。
そこに、スキャンした画像でできている自炊本、それをOCRして不自然さの少ない音声化をほどこし、Web上でポチポチするだけで送り届けてくれるサービスまで昇華したところを褒めてるわけです。

a (2013-02-24(日) 23:18)

お早いご返事どうもです。音声合成に関しては、ご存じだとは思っておりました。

今回、私が紹介した音声合成のフリーソフトですが、ある意味訳アリ品ですw 
なので、紹介させていただいた次第。

http://mahoro-ba.net/e1360.html
ご覧の通り、市販されている音声合成エンジンは商用利用不可で、
学校や、ボランティア活動にすら使えません。別途、商用利用のライセンスが必要です。

でも、Microsoft Speech Platformは、マイクロソフトに確認したところ、
商用利用が可能と分かり、学校や、ボランティア活動に無料で使えますという事です。
私以外にも、2~3人がマイクロソフトに確認しておりますれば、ご安心を。

私はアクセシビリティという言葉に反応しただけです。
また、音声合成エンジンのライセンスに関して、ご存じない方も多いので。


トップ «前日 最新 翌日» 編集
RSS feed