音声合成ソフトによるナレーションの精度

最近は、音声合成ソフトによるナレーションを行うメディアが増えているようです。本記事では、音声合成ソフトによるナレーションの制度や、実際の導入事例について解説します。

音声合成ソフトによるナレーションの精度はどれくらい?

音声合成ソフトの精度は近年大きな発展を見せているといわれています。人が話しているのかと見紛うほどクオリティが高く、実際に多くのメディアで音声合成ソフトによるナレーションを採用しています。

以下に、実際に音声合成ソフトによるナレーションを導入しているテレビ番組をご紹介します。

街角ホワイトボード先生

「街角ホワイトボード先生」は、街角にホワイトボードを設置して世の中に伝えたいことを取り上げ、ホワイトボードを通して授業するというバラエティ番組です。

使用されたソフトは「ReadSpeaker」のAI音声合成「TTS, text-to-speech」。「TTS, text-to-speech」はこれまでもさまざまな番組で使用されていることからクオリティに対する信頼性が高いこと、また「TTS, text-to-speech」の音声が番組のコンセプトとマッチしていたことが採用の決め手となりました。

モヤモヤさまぁ~ず2

テレビ東京で放映されているバラエティ番組「モヤモヤさまぁ~ず2」では、ReadSpeaker のAI音声「SHOW」が採用されています。

元旦にナレーションを入れなければならないというスケジュールの中、ナレーターやタレントを呼ぶことは難しいと判断したのが「SHOW」を採用したきっかけだそうです。日本語の女性音声がきれいだったこと、話し方が面白かったことが採用の決め手となりました。

また、「モヤモヤさまぁ~ず2」では「VoiceText」も使用されています。独特のナレーションを展開している「ショウ君」は、「VoiceText」による音声です。

おはよう朝日です

テレビ朝日で放映されている朝の情報番組「おはよう朝日です」では、高品質音声合成ソフト「AITalk」採用されています。「おきたらんど」で出題される日替わりクイズの声はAITalkによるものです。

モーニングサテライト

テレビ東京で放映されている「モーニングサテライト」は、番組内のコーナー「クイックAIによる日経平均予想」において、「AITalk」が採用されています。AIロボットキャラクター「さきちゃん」の声はAITalkによるものです。

さきちゃんの音声は、地上波のニュース番組で初のレギュラー利用になります。

ダークシステム

TBSテレビで放映されているドラマNEO「ダークシステム 恋の王座決定戦」の中で、音声合成ソフト「VoiceText」が採用されています。恋愛をめぐって繰り広げられる戦いに登場する悪魔的なマシーンの声は「VoiceText」によるものです。

音声合成ソフトの基礎知識をチェック

音声合成ソフトの精度は発展を続けており、多くのテレビ番組で採用されています。今後もさまざまなメディアが活用するでしょう。

以下のホームページでは、音声合成ソフトに関する幅広い情報を発信しています。音声合成ソフトの概要からおすすめのソフトまで、導入を検討している人に必要な情報を網羅していますので、ぜひ参考にしてください。

音声合成ソフトの
基礎知識を見る

目的に合ったものはどれ?
ニーズ別音声合成ソフトのおすすめ3選

音声合成ソフトは入力した文字情報などを基に、電話の自動応対やe-learning教材、カーナビ、ゲームのキャラクターなど、さまざまな場面で「声」の役割を担ってくれるものです。
本サイトでは、数ある音声合成ソフトの中でも他社に負けない強みを持った3社を、その特徴ごとに紹介しています。

調整が簡単で質の高い
音声合成をしたい

AITalk®
(株式会社エーアイ)
特徴
先端ディープラーニングを導入した独自の技術で、
音質・肉質感の向上、多様な発話表現を実現。
利用シーン
日本語・英語・中国語をメインに、
品質重視のカーナビや館内放送、ニュース読み上げなど

芸能人の声を使った
音声合成をしたい

コエステーション
(コエステ株式会社)
特徴
9万以上の一般ユーザーだけでなく、
40以上に
のぼる有名人などの
豊富な「コエ」の数。
利用シーン
世界観やPR要素重視の
ゲームやYouTube動画など
(エンタメ系)

外国語をメインに
音声合成をしたい

ReadSpeaker
(HOYA株式会社)
特徴
中国語と区別して広東語も。
日本語、英語(アメリカ・イギリス)、韓国語をはじめ、
24言語に対応。
利用シーン
観光案内や美術館の音声ガイダンスと
いった、
外国籍の方の利用が多い場所など

【選定基準】Googleで「音声合成ソフト」と検索して出てきた、14社の中から、以下の条件に当てはまる企業を3社選出しました。(2022年2月調査時点)
・AITalk®
日本語話者が最多。ディープラーニングを用いた先端技術であるDNN音声合成を使った独自エンジン
・コエステーション
声優や芸能人などプロの声数が最多
・ReadSpeker
外国語の種類が豊富で、唯一外国語におけるイントネーション調整が可能。