
ここでは、音声合成サービス「FutureVoice Crayon」の特徴や導入事例についてまとめています。プロの声優・劇団員によるリアルな声を使って手軽に作成できるので、気になる人はぜひご覧ください。
FutureVoice Crayonは、NTTが長年蓄積したさまざまな音声パターンを活用しています。また、独自のニューラル波形生成音声合成処理により、実用的な処理性能を維持しつつ高品質な音声合成を提供できるのが特徴です。
FutureVoice Crayonでは、複数の話者をミックスして自分だけのオリジナル話者の作成が可能です。選べる話者は全部で50種類以上。また、話者の感情の割合やミックスする話者の割合まで細かく設定できます。
FutureVoice Crayon Actorは、声優・劇団・著名人など実際の「声のプロ」の音声を使って作成することが可能です。ナレーターの起用から収録までのコストが大幅に削減できるだけではなく、聞き手により親しみやすい印象を与えます。
感情を表現する音声合成技術は、バリエーション豊かな声を作成できる点が魅力です。例えば、同じ声でも、喜び、悲しみ、怒りなど、さまざまな感情を反映させた音声が生成可能です。これにより、より自然で人間味のあるコミュニケーションが実現します。また、声のトーンやピッチも自由に調整でき、シーンに応じた最適な音声を提供します。
この音声合成技術は、さまざまな機器に接続して利用することが可能です。モバイル端末や家電、さらには玩具にまで対応できるため、幅広い用途での活用が期待されています。特に、組み込み型のDNN音声合成エンジンは省リソースで動作するため、コストを抑えながら高品質な音声体験を提供できます。
報道局・情報向けの番組に登場する「AI×CGアナウンサー花里ゆいな」は、FutureVoice Crayonが搭載されています。深夜帯やボリュームのあるインターネットニュースにも顔出しで発信できるので、アナウンサー業務の負担軽減や制作の効率化につながっているようです。
※参照元:NTTテクノクロス株式会社公式HP:https://www.futurevoice.jp/case/example02/
工事現場がいる作業者への指示を円滑におこなう作業指示ロボット「工事統制支援ツール」にFutureVoice Crayonが導入されています。統制者が直接指示する回数が減り、音声合成の聞き取りやすさによって現場の作業効率も上がりました。
※参照元:NTTテクノクロス株式会社公式HP:https://www.futurevoice.jp/case/example10/
「Sota(ソータ)」は、言葉や手ぶりによって自然な対話ができるテーブルトップサイズのコミュニケーションロボットです。質問された内容に対しての回答など、FutureVoice Crayonの音声合成を利用して行っています。
キャラクターに合わせた独自の音声を作成することで、かわいらしく親しみやすい製品イメージが向上。コミュニケーションロボットに求められる個性ある存在感と汎用機としての一般性を両立しています。
参照元:FutureVoice Crayon公式HP:https://www.futurevoice.jp/case/example01/
スマートフォンなどの端末から無料視聴ができる「国立新美術館建築ガイドアプリCONIC」の音声として、FutureVoice Crayonが採用。 国立新美術館の建築に関する解説や館内の巡るツアーのナレーションに活用されています。
音声合成ですが、人と変わらない肉声感があるため違和感なく聞くことが可能です。簡単に説明の音声合成が作成できるため、コンテンツの修正や追加が発生した場合でもすぐ対応することができます。
参照元:FutureVoice Crayon公式HP:https://www.futurevoice.jp/case/example03/
NTTデータの「減災コミュニケーションシステム」は、地方自治体から地域住民に緊急防災情報を円滑に伝達するための速報告知放送システムです。多岐に渡る機器の音声合成としてFutureVoice Crayonが採用。
FutureVoice Crayon SDKを機器に組み込むことで、回線速度が低い環境下でもテキスト配信から高速で音声変換できます。一刻を争う非常時緊急速報時に、原稿の作成や放送など人手の作業を極力なくすことが可能となりました。
参照元:FutureVoice Crayon公式HP:https://www.futurevoice.jp/case/example04/
ダイキン工業のオンライン研修「ダイキン オンライン・トレーニング」のナレーション音声にFutureVoice Crayonが採用されています。辞書機能が備わっているため、空調関係の専門用語の読みやイントネーション修正も簡単です。
インターネット環境があれば、在宅や遠隔地でも24時間365日ナレーション音声を作成することが可能。ナレーションを収録する必要がないので収録費用がなくなり、定額料金での利用ができます。
参照元:FutureVoice Crayon公式HP:https://www.futurevoice.jp/case/example05/
NTT東日本のロボット型通信端末向けのクラウド型ロボットプラットフォームサービス「ロボコネスト」を活用したソリューションのひとつ「オリジナルロボットソリューション」は、独自のコミュニケーションロボットを作り、プレゼンテーション・見学案内・会社PR・受付で活用できるサービスです。
FutureVoice Crayon CustomVoiceサービスを利用することで、ロボット独自の声を再現。自然な音声合成を実現します。
参照元:FutureVoice Crayon公式HP:https://www.futurevoice.jp/case/example06/
FutureVoice Crayonが作り出した自然な音声を持つバーチャルアナウンサー「百道桃(ももちもも)」は、2019年よりRKB毎日放送の番組に出演。アナウンサーの稼働負荷軽減を実現します。
参照元:FutureVoice Crayon公式HP:https://www.futurevoice.jp/case/example08/
FutureVoice Crayon Cloudと、データグリッドの人物動画生成技術を活用し、オンライン学習動画サービスの講義を実現。音声データと講師の数分の動画から、AIで実際の講師が話しているような長尺の講義動画を自動的に生成します。
導入により、講師本人の説明や動画収録用の機材やスタジオがなくても講義動画の制作が可能になりました。また、音声の差し替えが必要な場面でもあらためて収録を行う必要がありません。
参照元:FutureVoice Crayon公式HP:https://www.futurevoice.jp/case/example09/
メディアオーパスプラスが提供する「Media Opus Contents+」は、講義や企業研修、先輩インタビューなどの映像化に特化した学びの映像制作サービスです。その音声として、FutureVoice Crayonが利用されています。
FutureVoice Crayonの感情音声や外国語を含む豊富なラインナップから要望に応じた話者を提供。導入することで、より多くの案件を受注することが可能になりました。
参照元:FutureVoice Crayon公式HP:https://www.futurevoice.jp/case/example11/
サンリオの「ハローキティロボット」は、ハローキティの声でコミュニケーションが取れるデスクトップ型ロボットです。
音声に、FutureVoice Crayon CustomVoiceを活用したオリジナル音声を採用。ファンも喜ぶかわいい声で、ぬいぐるみやおもちゃに代わるコミュニケーションツールを提供します。
参照元:FutureVoice Crayon公式HP:https://www.futurevoice.jp/case/example12/
短編映画を対象とした日本の映画祭「SSFF & ASIA 2024」のオープニング動画で、俳優の声にFutureVoiceのクロスリンガル音声合成技術を活用した演出を行いました。俳優本人の話し声のまま、ネイティブな外国語の音声を実現します。
参照元:FutureVoice Crayon公式HP:https://www.futurevoice.jp/case/example13/
FutureVoice Crayonは、独自のニューラル波形生成音声合成処理によって早い処理速度を維持しつつNTTで培った音声データを学習に組み込んだ音声の質の高さが魅力。50種類以上の音声話者の中からミックスしてオリジナル話者の作成も可能です。
FutureVoice Crayonは、NTTテクノクロス株式会社が制作しました。NTTグループの1つで、情報通信ネットワークに関するサービスの提供、ソフトウェアの設計・開発・販売を中心におこなっている会社です。
有名声優や劇団員・その他著名人の声を音声合成の素材としてそのまま使用可能です。たとえば、アニメ「おしりかじり虫」おしりかじり虫役の金田朋子さんやアニメ「鬼滅の刃」竈門炭治郎役の花江夏樹さんなど、人気・実力がある人が集まっています。
FutureVoice Crayon Cloudは、WEBブラウザ上でテキストを入力するだけで簡単に音声作成ができるクラウドサービスです。スマホアプリやWEBサービス向けの音声ガイダンスに適しています。
FutureVoice Crayon Serverは、電話自動音声対応や対話システム向けにネットワークを介して、自動的に音声作成をおこなうサーバシステムです。超高速処理によって、複雑な設定をしなくても、自動音声ガイダンスや電話応対が可能になりました。
FutureVoice Crayon SDKは、パッケージソフトやロボット、デジタルサイネージなどネットワークから切り離された状態で使用可能な音声合成ソフトウェア開発キットです。日本語以外に英語や中国語など外国語も対応。
FutureVoice Crayon Server MRCPオプションは、「SpeechRec Server」または「FutureVoice Crayon Server」を利用して、より高度な自動応答サービスが作成できます。たとえば、お客様がコールセンターに電話した場合、用件に合わせて専門スタッフに繋ぐことが可能です。
音声合成ソフトは入力した文字情報などを基に、電話の自動応対やe-learning教材、カーナビ、ゲームのキャラクターなど、さまざまな場面で「声」の役割を担ってくれるものです。
本サイトでは、数ある音声合成ソフトの中でも他社に負けない強みを持った3社を、その特徴ごとに紹介しています。
調整が簡単で質の高い
音声合成をしたい
芸能人の声を使った
音声合成をしたい
外国語をメインに
音声合成をしたい
【選定基準】Googleで「音声合成ソフト」と検索して出てきた、14社の中から、以下の条件に当てはまる企業を3社選出しました。(2022年2月調査時点)
・AITalk®
日本語話者が最多。ディープラーニングを用いた先端技術であるDNN音声合成を使った独自エンジン
・コエステーション
声優や芸能人などプロの声数が最多
・ReadSpeker
外国語の種類が豊富で、唯一外国語におけるイントネーション調整が可能。