オーディオブック

こちらでは、音声合成をオーディオブック作成に導入した事例を3つピックアップして紹介しています。AIの音声合成技術を上手に活用することで、さまざまなメリットを得られます。

オーディオブックの音声合成ソフト事例

VICKE Audiobook&Newsの事例

オーディオブックの抱える課題

今後、市場規模のさらなる拡大につなげていきたいと考えられているオーディオブック。けれども、市場成長を遂げるのに必要な流通量まで達していないという課題があります。電子書籍と比較すると、かなり少ないのが現状です。

その大きな理由としてあげられるのが、制作費の高さと長い製作期間です。オーディオブックの収録を、声優による生声によって行っていることが、その背景にあります。その結果として、売れ筋の本以外のオーディオブック化がスムーズに進まないのです。

AIを使い制作費を軽減

上述のように、オーディオブックの品揃えが悪く、また流通量も充分ではないという課題を解決する方法として検討したいのが、AI技術の導入です。つまり、オーディオブックを制作する際、これまでのように生声で読み上げるのではなく、AI音声合成を用いる方法です。制作コストは1割以下におさえられますし、また、納期の短縮も可能になります

そうなれば、売れ筋の本のみならずマイナーな作品の制作も対応できるようになるため、品揃えの充実につなげられるわけです。電子書籍のような本格的な市場規模の拡大も現実味を増すでしょう。

参照元:PR TIMES(https://prtimes.jp/main/html/rd/p/000000001.000125929.html)

ビジガクの事例

CoeFontを調整した音声

株式会社CoeFontのAI音声プラットフォームである「CoeFont」を採用してオーディオブック制作を行っているビジガク。CoeFonに独自の調整をかけることによって、聴きやすいニュートラルな音声をつくり出し、それを利用しています。

書籍と同時発売が実現可能になった

かつてのように人の声で収録する方法だと、オーディオブック制作に時間がかかりすぎていました。制作費も高く、一部の書籍のみをオーディオブック化するのが精いっぱい、という状況でした。

その手法からAI音声合成技術を活かすやり方へと切り替えることで、制作費および製作時間の削減に成功しています。配信後、必要に応じて修正したり微調整したりする作業も、以前ほど手間がかからないようになりました。ですから、今後は出版社との強い関係性を活かし、書籍とオーディオブックを同じタイミングで発売できるようにしていきたいと考えています。

参照元:図書印刷株式会社(https://www.tosho.co.jp/news/news20220325-01)

audiobook.jpの事例

AIで著名人の声に変換

AI技術を活用することによって、プロのナレーターによる朗読を、別の著名人の声になるよう変換して作成した「AI本人オーディオブック」を取り扱っています。プロの高い朗読技術と注目のAI技術とを組み合わせることで、従来のようなオーディオブックとは異なるタイプでありながら、聴きやすさもしっかりと確保された新商品を生み出すことに成功したのです。

参照元:PR TIMES(https://prtimes.jp/main/html/rd/p/000000373.000034798.html)

オーディオブックとは?

書籍やテキストなどの朗読を聴くことのできるオンライン上の音声コンテンツのことを、オーディオブックといいます。「目で読む」「耳で聴く」という相違点はあるものの、オンライン上で書籍の内容を知るという意味合いにおいては、電子書籍と類似した商品であるといえます。

オーディオブックの場合も、ウェブサイトやスマートフォンのアプリなどから、コンテンツを楽しむことができます。俳優や声優、ナレーターなどがオーディオブックの朗読を担当している商品が多いです。ただ、近頃では朗読の音声として、生声ではなくAI音声合成ソフトが朗読した音声を収録しているオーディオブックもみられます。

目的に合ったものはどれ?
ニーズ別音声合成ソフトのおすすめ3選

音声合成ソフトは入力した文字情報などを基に、電話の自動応対やe-learning教材、カーナビ、ゲームのキャラクターなど、さまざまな場面で「声」の役割を担ってくれるものです。
本サイトでは、数ある音声合成ソフトの中でも他社に負けない強みを持った3社を、その特徴ごとに紹介しています。

調整が簡単で質の高い
音声合成をしたい

AITalk®
(株式会社エーアイ)
特徴
先端ディープラーニングを導入した独自の技術で、
音質・肉質感の向上、多様な発話表現を実現。
利用シーン
日本語・英語・中国語をメインに、
品質重視のカーナビや館内放送、ニュース読み上げなど

芸能人の声を使った
音声合成をしたい

コエステーション
(コエステ株式会社)
特徴
9万以上の一般ユーザーだけでなく、
40以上に
のぼる有名人などの
豊富な「コエ」の数。
利用シーン
世界観やPR要素重視の
ゲームやYouTube動画など
(エンタメ系)

外国語をメインに
音声合成をしたい

ReadSpeaker
(HOYA株式会社)
特徴
中国語と区別して広東語も。
日本語、英語(アメリカ・イギリス)、韓国語をはじめ、
24言語に対応。
利用シーン
観光案内や美術館の音声ガイダンスと
いった、
外国籍の方の利用が多い場所など

【選定基準】Googleで「音声合成ソフト」と検索して出てきた、14社の中から、以下の条件に当てはまる企業を3社選出しました。(2022年2月調査時点)
・AITalk®
日本語話者が最多。ディープラーニングを用いた先端技術であるDNN音声合成を使った独自エンジン
・コエステーション
声優や芸能人などプロの声数が最多
・ReadSpeker
外国語の種類が豊富で、唯一外国語におけるイントネーション調整が可能。