トップ 最新

ただのにっき

2014-07-09(水) [長年日記]

VoiceText Web APIで遊ぶ

昼すぎあたりからTwitterでVoiceTextという文字列をみかけるようになって、見てみたらVoiceText Web APIというのが公開されていた。(TV見ないのでよくしらないけど)「モヤモヤさまぁ~ず」内で使われているのと同じ合成音声エンジンのAPIらしい。開発にえにしテックが協力してるのでおれのTLに流れてきたんだな。

以前さとうささらを職場内で使ったけど、聴覚は上手に使うといいアテンションになるのでこういう自由度の大きなサービスは嬉しいね。VoiceTextでもさっそく遊んでみたけど、APIはシンプルで使いやすいし、声や感情も数種類から選べて組み合わせられるので、けっこう使える。文中の促音が消えてしまうことがあったり、疑問形の語尾上げが足らない感じはあるけど、まぁまぁ聞き取りやすいし実用にはさしつかえない。

サンプルにあるようにcurlで使ってもいいけど面倒なので、単純なRubyバインディングを書いてgemにしておいた。たぶん島田さんがもっとましな公式バインディングを持ってていずれ公開されるはずなので、それまでのつなぎ。

これで某県会議員の記者会見文字起こしをスクレイピングして、適当な長さに切りながら音声化して連続再生みたいな遊びも簡単にできます(おいやめろ)。speaker: takeru、emotion: anger、emotion_level: 2にするといい感じでした(show→takeruに訂正)。

Tags: ruby