様々なシーンで活躍する
音声合成ソフトを
徹底解析

自治体の防災無線や館内放送、
電話の自動応対、電子機器内アナウンスなど
さまざまなシーンで利用される「音声合成ソフト」。
本サイトでは音声合成ソフトがどんな可能性を秘めているのか、どんな活用ができるのかを紹介していきます。

おすすめの3選を見てみる

目的に合ったものはどれ?
ニーズ別音声合成ソフトの
おすすめ3選

調整が簡単で質の高い
音声合成をしたい

AITalk®
(株式会社エーアイ)

特徴
先端ディープラーニングを導入した独自の技術で、
音質・肉質感の向上、多様な発話表現を実現。
利用シーン
日本語・英語・中国語をメインに、
品質重視のカーナビや館内放送、
ニュース読み上げなど

芸能人の声を使った
音声合成をしたい

コエステーション
(コエステ株式会社)

特徴
9万以上の一般ユーザーだけでなく、
40以上に
のぼる有名人などの
豊富な「コエ」を収録。
利用シーン
世界観重視の
ゲームやYouTube動画など
(エンタメ系)

外国語をメインに
音声合成をしたい

ReadSpeaker
(HOYA株式会社)

特徴
中国語と区別して広東語も。
日本語、英語(アメリカ・イギリス)、
韓国語をはじめ、24言語に対応。
利用シーン
観光案内や美術館の音声ガイダンスと
いった、
外国籍の方の利用が多い場所など

【選定基準】Googleで「音声合成ソフト」と検索して出てきた、14社の中から、以下の条件に当てはまる企業を3社選出しました。(2022年2月調査時点)
・AITalk®
日本語話者が最多。ディープラーニングを用いた先端技術であるDNN音声合成を使った独自エンジン
・コエステーション
声優や芸能人などプロの声数が最多
・ReadSpeker
外国語の種類が豊富で、唯一外国語におけるイントネーション調整が可能。

【音声合成ソフト】ニーズ別
おすすめ3製品の詳細

調整が簡単で質の高い音声合成をしたい

AITalk®(株式会社エーアイ)

株式会社エーアイHP

引用元:株式会社エーアイ公式HP(https://www.ai-j.jp/)

AITalk®の特徴

自然で滑らかな
感情表現を得意とする
品質の良さ

AITalkは、省力でのデータ処理が高速化されることで、従来の音声合成ソフトより自然な感情表現を可能にしたソフトです。
この技術によってAITalkでは、「平静」「喜び」「怒り」「悲しみ」を簡単に表現することが可能になりました。
また特にAITalkは、日本語解析の強化により、正確性の高い漢字の読みやアクセントを得意としています。

老若男女、方言など
選べる日本語・外国語話者の
豊富さ

大人から子どもまで総勢18名の日本語話者の声があり、豊富な声から好みの音声を探せます。方言は関西弁が備わっているので、関西向けのコンテンツ制作にもおすすめです。
外国語は、英語や中国語・スペイン語やポルトガル語など全部で41言語が搭載されています。日本語だけでなく外国語の種類も豊富なので、外国語の音声合成を検討している人におすすめです。

「音」を必要とする
さまざまなシーンで
使える活用幅の広さ

AITalkは、PCへの文字入力でナレーション作成ができる「AITalk 声の職人」やPowerPointの文章をそのまま音声化できる「AITalk 声プラス」、小型でAndroid・iOS対応した「AITalk micro」といった、複数の製品を展開しています。 PCインストール型や機器組み込み型など充実しているため、音声を使いたい場面にぴったりなソフトが見つかるでしょう。
どんな音声合成ソフトが自分や会社にマッチするのかわからない場合でも、利用目的や利用場面の相談から受け付けています。

AITalk®の主な機能一覧

  • 自由文音声
    自由文音声

    自由文音声とは、
    テキスト記入欄に入力した文章を音声化したものです。このため、テキスト入力できる文言であればどんなものでも音声化が可能です。

  • 単語登録
    単語登録

    単語登録とは、
    専門用語や難しい単語もしくは定型文を登録して、音声合成を作成しやすくすることです。

  • 話速変換
    話速変換

    話速変換は、
    発声のスピードを変えることで、単語と単語や文節と文節の間に空白を作ったり、間を詰めたりできます。話速変換によって、より聞き手に伝わりやすい音声の生成が可能です。 

  • 感情表現
    感情表現

    感情表現は、
    喜怒哀楽を調整できる機能です。声の高低や抑揚、話すスピードなどいくつかの要素を組み合わせることでこれを実現しています。 

  • イントネーション調整
    イントネーション調整

    イントネーション調整とは、
    単語や文章ごとにイントネーションの強弱を設定できることです。メーカーや製品ごとに強弱できる段階が異なる場合があります。

  • 音高調整
    音高調整

    音高調整は、
    単語や文章ごとに声の高低を設定できます。メーカーや製品ごとに強弱できる段階が異なる場合があります。

▲サポート項目にマウスオンすると説明が表示されます

▲サポート項目をタップすると説明が表示されます

AITalk®の導入事例

音声対話
icon
フライト・空港情報案内アプリ

成田国際空港株式会社からリリースされた音声エージェントアプリ「成田コンシェルNariCo powered by しゃべってコンシェル」にAITalkが採用されました。NTTドコモとの共同開発で、アプリに話しかけるだけでフライト情報や駐車場情報など空港に関する情報がわかります。インフォメーションに問い合わせたり毎回ネットで検索しなくても、このアプリ1つで情報が受け取れるのが魅力です。

参照元:株式会社エーアイ公式HP(https://www.ai-j.jp/topics/1814/)

防災行政無線
icon
J-ALERT

地方自治体では、防災行政無線を放送した際の聞こえにくさが問題視されています。そこで、「AITalk 声の職人」で音声合成を作成して放送したところ、職員の負担が大幅に軽減されました。

参照元:株式会社エーアイ公式HP(https://www.ai-j.jp/client/voice4/)

道路・交通情報
icon
交通情報の電話アナウンス

財団法人日本道路交通情報センターが提供する全国道路交通情報の電話案内に、AITalkが採用されました。お客様からのお問い合わせ内容に応じて自動音声が専用オペレーターに引き継いでくれるので、オペレーター側の負担が大きく軽減されたようです。

参照元:株式会社エーアイ公式HP(https://www.ai-j.jp/topics/1854/)

ナビゲーション・PND
icon
音声の既存機器への連携

株式会社ユピテルの連携・拡張機能型高機能ポータブルナビ「YERAシリーズYPB706si」に、micro AITalkが採用されました。膨大な音声が必要なナビゲーションは、低コストで一定のクオリティが保てる音声合成がおすすめです。また、事前収録や設定ができない情報も、いちいち収録しなくても音声合成で代用できます。

参照元:株式会社エーアイ公式HP(https://www.ai-j.jp/topics/1849/)

スマートフォンアプリケーション
icon
記事読み上げアプリ

シャープビジネスコンピュータソフトウェア株式会社がリリースしたRSS読み上げアプリ「MyTalkStation」にAITalkが採用されました。ネットの様々な情報を好きな時間にお気に入りの音楽をかけながら好みの声で発信してくれるアプリです。登録したRSSフィートから自動的に記事を取り上げ読み上げてくれます。

参照元:株式会社エーアイ公式HP(https://www.ai-j.jp/topics/1841/)

観光案内・館内
・車内各種放送
icon
ケータイ観光案内ガイダンス

株式会社電通が担当した京都嵐山の観光ガイドの音声ガイダンス「おとたび」に、「AITalk International」が採用されています。年々増加する海外からの観光客がもっと嵐山の魅力を知ってもらうことを目的として、ケータイ・スマホから英語・中国語・韓国語の音声ガイダンスが流れるようにしました。このように、低コストで外国語ナレーションの作成が可能です。

参照元:株式会社エーアイ公式HP(https://www.ai-j.jp/topics/1852/)

電話自動応答システム
icon
コールセンター自動応答音声ガイダンス

株式会社朝日ネットの自社コールセンターの自動応答音声ガイダンスに、「AITalk 声の職人」が採用されました。今までは、社内メンバーの収録音声を自動音声にあてていましたが、人員確保の問題やノイズが入ることから音声合成を導入しています。「無声音操作により人間の声に近い音声が作成できて、誰でも簡単にガイダンス作成ができる」と喜ばれているようです。

参照元:株式会社エーアイ公式HP(https://www.ai-j.jp/topics/1731/)

ロボット
icon
ヒト型AIロボットの声

ATR 石黒浩特別研究所で開発されたロボット「ジェミノイド」「コドモロイド」「オトナロイド」の声を「AITalk SDK」と「AITalk Custom Voice 」が採用されました。今までは収録やその他作業に手間がかかっていましたが、即時に生声に近い音声合成ができるので負担が軽くなったようです。また、アンドロイドのモデルとなった人物が不在でも、本人に近い声で対話させることができるようになりました。

参照元:株式会社エーアイ公式HP(https://www.ai-j.jp/client/voice5/)

ゲーム
icon
ゲーム内相互会話機能

バンダイナムコゲームスからニンテンドー3DS・Androidで発売された「クマ・トモ」にAITalkが採用されました。「クマ・トモ」は、クマを可愛がりながらおしゃべりするうちに親友になれるゲームです。わざわざ収録しなくても、臨場感あるゲーム制作ができます。

参照元:株式会社エーアイ公式HP(https://www.ai-j.jp/topics/1790/)

e-Learning・教材
・マニュアル作成
icon
自社サイト内へのナレーション導入

カイゼンベース株式会社が運営する製造業・ものづくり企業向けコンサルサイト「カイゼンベース」のナレーションに、「AITalk 声の職人」が採用されています。今まではコンサルのナレーションの収録・編集に大幅なコストと時間を要していましたが、AITalkの導入で大幅に短縮できてコンテンツのクオリティが上がりました。

参照元:株式会社エーアイ公式HP(https://www.ai-j.jp/client/voice23/)

AITalk®の対応言語一覧

AITalk®の
対応言語
日本(18話者)、英語(24話者)、中国語(9話者)、韓国(4話者)、スペイン語(12話者)、ポルトガル語(6話者)、タイ語(2話者)、ベトナム(1話者)、インドネシア語(1話者)、ヒンディー語(2話者)、カンナダ語(1話者)、タミル語(1話者)、テルグ語(1話者)、ベンガル語(1話者)、ボージュプリー語(1話者)、マラーティー語(1話者)、マレー語(1話者)、アラビア語(4話者)、トルコ語(2話者)、ヘブライ語(1話者)、ペルシャ語(1話者)、イタリア語(4話者)、ウクライナ語(1話者)、オランダ語(2話者)、カタルーニャ語(2話者)、ギリシャ語(2話者)、クロアチア語(1話者)、スロバキア語(1話者)、スウェーデン語(2話者)、チェコ語(2話者)、デンマーク語(2話者)、ドイツ語(5話者)、ノルウェー語(2話者)、ハンガリー語(1話者)、フィンランド語(2話者)、フランス語(6話者)、フラマン語(1話者)、ブルガリア語(1話者)、ポーランド語(3話者)、ルーマニア語(1話者)、ロシア語(3話者)

AITalk®の会社の特徴

AITalkは、2018年に東京証券取引所マザーズ市場への株式上場を果たした、株式会社エーアイという会社が、開発・販売をしています。
導入実績は音声合成に特化した会社で1,200社以上。(※)
音声合成の提案から導入後のサポートまでの、柔軟なワンストップ対応が強みです。また、PCにインストールするだけで使用できるものや、機器に組み込むためのものなど、用途にあったさまざまな音声合成ソフトを取りそろえることで、それぞれが抱える課題の解決に一役買っています。

※参照元:エーアイ公式HP:https://www.ai-j.jp/202011lp/ 2022年3月時点。

エーアイのシリーズ製品紹介

PRODUCT-1

AITalk® Server

AITalk Serverは、電話の自動応答システムやWEBサービスの音声アナウンスに適した音声読み上げソフトです。ネットワークを介して音声合成を作成したい時にもおすすめ。

PRODUCT-2

AITalk® micro

AITalk micro は、スマートフォンやタブレット・ナビゲーションなどAndroid・IOSに対応した組み込み式の小型音声合成ソフトウェア開発キッドです。AIロボットやloT機器を中心に導入されています。

PRODUCT-3

AITalk international®

AITalk international は、41の国の言語の音声合成に対応したソフトです。主に、観光地の案内や館内放送、e-learningの教材に適しています。

PRODUCT-4

AITalk® CustomVoice®

AITalk CustomVoice は、有名人もしくは自分の声を収録して音声合成を作成できるサービスです。おもに、ゲームやVtuberのアテレコに適しています。

PRODUCT-5

AITalk WebAPI

AITalk WebAPI は、AITalkをSaaS型で利用できるサービスです。スマホアプリやWEBサービス等で手軽に音声合成を組み込めます。

PRODUCT-6

AITalk Web読み職人

ホームページの内容を理解できるように、内容を読み上げてくれるサービスです。ホームページのバリアフリー化を目的としています。

AITalk®の会社概要

所在地 東京都文京区西片1-15-15 KDX春日ビル10F 設立 2003年
公式URL https://www.ai-j.jp/ 電話番号 03-6801-8461
芸能人の声を使った音声合成をしたい

コエステーション
(コエステ株式会社)

コエステーション(コエステ株式会社)HP

引用元:コエステ株式会社公式HP(https://coestation.jp/)

コエステーションの特徴

多様性に富んだ
有名人や一般人の
魅力的な声の数

コエステーションでは、テレビやラジオで活躍しているタレントや俳優など人気著名人の声を40以上用意。音楽事業をメインとする企業(avex)が開発に携わっている事から、幅広いジャンルの有名人の声を取り扱っています。
一般ユーザーの声の取り扱いも豊富で、約9万以上のデータが蓄積されています。声の種類の多さで選ぶならおすすめできる音声合成ソフトです。

気軽にさくさく音声合成可能な
スマホアプリ版

コエステーションは手軽に使えるスマホアプリ版もリリースしています。場所や時間を問わず手軽に、抑揚やトーンといった声の自由自在な編集や、作成した声を付けてのSNS投稿も、スマホ1つで可能です。
また、第三者に自分の作成した声をシェアすることもできるので、声を確認してもらう必要がある場合に便利です。

わかりやすい
シンプルかつ明朗な
追加料金プラン

コエステーションは明朗会計で、日本語1声追加ごとと、外国語1声追加ごととで各追加料金が設定されています。さらに有名人・一般ユーザーの声の使用を希望する場合には見積もりが必要です。 
法人向け以外にもスマホアプリ版の展開もあり、こちらは無料でダウンロードできます。
法人向けプランとの併用でがっつり音声合成ソフトを使いたい方には、ぴったりです。

コエステーションの主な機能一覧

  • 自由文音声
    自由文音声

    自由文音声とは、
    テキスト記入欄に入力した文章を音声化したものです。このため、テキスト入力できる文言であればどんなものでも音声化が可能です。

  • 単語登録
    単語登録

    単語登録とは、
    専門用語や難しい単語もしくは定型文を登録して、音声合成を作成しやすくすることです。

  • 話速変換
    話速変換

    話速変換は、
    発声のスピードを変えることで、単語と単語や文節と文節の間に空白を作ったり、間を詰めたりできます。話速変換によって、より聞き手に伝わりやすい音声の生成が可能です。

  • 感情表現
    感情表現

    感情表現は、
    喜怒哀楽を調整できる機能です。声の高低や抑揚、話すスピードなどいくつかの要素を組み合わせることでこれを実現しています。

  • イントネーション調整
    イントネーション調整

    イントネーション調整とは、
    単語や文章ごとにイントネーションの強弱を設定できることです。メーカーや製品ごとに強弱できる段階が異なる場合があります。

  • 音高調整
    音高調整

    音高調整は、
    単語や文章ごとに声の高低を設定できます。メーカーや製品ごとに強弱できる段階が異なる場合があります。

▲サポート項目にマウスオンすると説明が表示されます

▲サポート項目をタップすると説明が表示されます

コエステーション導入事例

音声対話
icon
美術館や博物館の音声ガイド

株式会社The Chain Museumがリリースしたアート・コミュニケーションプラットフォーム「ArtSticker」の音声ガイドを、コエステーションが担当しています。スマホアプリで美術館や博物館の様子を音声ガイドで聴けるコンテンツです。

参照元:コエステ株式会社公式HP(https://coestation.jp/news/detail.php?id=1084930)

防災行政無線
icon
家庭用ガス警報機一体型の音声アナウンス

大阪ガス株式会社の家庭用ガス警報器「スマぴこ」は、インターネット接続機能付きなので、地域の災害情報や防犯情報をコエステの音声でお知らせしてくれます。ただガス漏れを検知するだけではない、ワンランク上の警報器が誕生しました。

参照元:コエステ株式会社公式HP(https://coestation.jp/business/case/)

スマートフォンアプリケーション
icon
ラジオアプリ

朝日新聞社とコエステが連携し、複数の有名人の声で朝日新聞のニュースを読み上げる実証実験を、音声コンテンツアプリ「ラジオクラウド」朝日新聞チャンネル内やYouTubeチャンネル内で実施しました。

参照元:コエステ株式会社公式HP(https://coestation.jp/business/case/)

観光案内・館内
・車内各種放送
icon
大型パチンコ店店内アナウンス

株式会社マルハンの店内アナウンスがコエステーションで作成された音声に変更しています。今まではスタッフがマイクを使ってアナウンスをおこなっていましたが、音声合成に変えたことで業務効率が上がり、さらに接客業務に注力できるようになりました。

参照元:コエステ株式会社公式HP(https://coestation.jp/business/case/)

電話自動応答システム
icon
IVRまでスムーズな電話応答の音声

モビルス株式会社がリリースしたAI電話自動応答システム「MOBI VOICE」にコエステーションが採用されました。一次受付からIVRの自動音声対応まで簡単に実施できます。わずか5分で公開可能なので、手軽にすぐ始められるのが特徴です。

参照元:コエステ株式会社公式HP(https://coestation.jp/business/case/)

e-Learning・教材
・マニュアル作成
icon
社内・パートナー企業向けe-learning

JCOM株式会社の社内・関連会社への教育コンテンツでコエステーションが採用されています。多彩な音声を使用したことで、より充実したコンテンツができあがりました。

参照元:コエステ株式会社公式HP(https://coestation.jp/business/case/)

コエステーションの
対応言語一覧

コエステーションの対応言語 日本語(10話者)、アメリカ英語(8話者)、イギリス英語(2話者)、スペイン語(2話者)、フランス語(2話者)、北京語(3話者)、広東語(1話者)、韓国語(2話者)

コエステーションの会社の特徴

コエステーションの運営会社「コエステ株式会社」は、avex(エイベックス)と東芝デジタルソリューションズが共同で設立した音声合成専門の会社です。
テレビやラジオで活躍する女優やお笑い芸人など、一度でも耳にしたことがあるような有名人の声を利用できるという特徴があります。
また、avex所属アーティストたちも利用するスタジオで、品質の良い音源の収録に特化した、個人向けサービスがあるのも特徴です。成長や持病などでどうしても移り変わりを避けられないこともある「声」を、当時の記憶とともにそのまま保存し、「コエ」として再現することができます。

コエステのシリーズ製品紹介

PRODUCT-1

コエステーション エディター

コエステーションエディターは、 WEBブラウザでテキスト入力しただけで、感情表現の割合や声色の調整まで細かく音声合成が作成できます。初月は無料でお試しが可能です。

PRODUCT-2

Web API

WebAPIは、チャットポットや天気予報の読み上げなど、あらかじめ音声の使いまわしができない場合におすすめです。あらかじめ設定しておけば、自動音声処理されリアルタイムに作成されます。

コエステーションの会社概要

所在地 東京都港区三田1-4-1 住友不動産麻布十番ビル 設立 2020年
公式URL https://coestation.jp/ 電話番号 公式サイトに記載なし
外国語をメインに音声合成をしたい

ReadSpeaker(HOYA株式会社)

ReadSpeaker(HOYA株式会社)HP

引用元:ReadSpeaker公式HP(https://readspeaker.jp/)

ReadSpeakerの特徴

初めての利用でも
シンプルでわかりやすい
快適な操作性

ReadSpeakerは、新式の機械学習技術「ディープラーニング」の導入により、さらに人間らしい感情表現が再現できるようになるとともに、複雑すぎない快適な操作性を実現させました。そのため、スマホやロボットなど、さまざまな用途の複数の機器への音声合成を検討されている方にはおすすめです。

アクセントや語尾の上げ下げも可能な
外国語話者の豊富さ

ReadSpeakerでは、20以上の言語に対応しているので、外国語メインの音声合成を検討している人にもおすすめです。
日本で10話者・英語で9話者、スペイン語とポルトガル語で4話者ずついます。アジアやオセアニア・北米や中南米、さらには欧州まで幅広い言語を取り扱っているのが特徴です。公式HPから全話者のサンプルボイスが視聴できます。

既存の話者以外で
差別化が図れる
オリジナルボイス

ReadSpeakerは、既存の話者以外の声で音声合成を作成したい人向けには、オリジナルボイスの案内をおこなっています。自分で選んだナレーターを1・2回程度の短い収録時間で、声の特徴を活かした音声合成が作れるのが特徴です。
既存話者との差別化を図れるだけでなく、毎回ナレーターを呼ぶ必要がなくなり、人件費や作業量を大幅に削減できます。

ReadSpeakerの主な機能一覧

  • 自由文音声
    自由文音声

    自由文音声とは、
    テキスト記入欄に入力した文章を音声化したものです。このため、テキスト入力できる文言であればどんなものでも音声化が可能です。

  • 単語登録
    単語登録

    単語登録とは、
    専門用語や難しい単語もしくは定型文を登録して、音声合成を作成しやすくすることです。

  • 話速変換
    話速変換

    話速変換は、
    発声のスピードを変えることで、単語と単語や文節と文節の間に空白を作ったり、間を詰めたりできます。話速変換によって、より聞き手に伝わりやすい音声の生成が可能です。 

  • 感情表現
    感情表現

    感情表現は、
    喜怒哀楽を調整できる機能です。声の高低や抑揚、話すスピードなどいくつかの要素を組み合わせることでこれを実現しています。 

  • イントネーション調整
    イントネーション調整

    イントネーション調整とは、
    単語や文章ごとにイントネーションの強弱を設定できることです。メーカーや製品ごとに強弱できる段階が異なる場合があります。

  • 音高調整
    音高調整

    音高調整は、
    単語や文章ごとに声の高低を設定できます。メーカーや製品ごとに強弱できる段階が異なる場合があります。

▲サポート項目にマウスオンすると説明が表示されます

▲サポート項目をタップすると説明が表示されます

ReadSpeaker導入事例

音声対話
icon
車載向けスマートスピーカーの声

Spotifyがアメリカ限定でリリースしている車載向けスマートスピーカー「Car Thing」にオリジナルボイスを用いたReadSpeakerが採用されました。Car Thingの使用で運転しながら簡単にお気に入りの音楽を流せます。

参照元:ReadSpeaker公式HP(https://readspeaker.jp/news/articles/casestudy_20210921-01_Spotify.html)

防災行政無線
icon
地方自治体災害情報システム

宮城県色麻町が提供する災害情報システム「色麻町地域 WiMAX ネットワーク」にReadSpeakerが連携されたことで、お年寄りや目が不自由な方にも正確な情報がすばやく提供できるようになりました。高品質な音色へ導くReadSpeakerの音声合成は、聞き取りやすさがアップします。

参照元:ReadSpeaker公式HP(https://readspeaker.jp/news/articles/casestudy20150312_shikamachou.html)

道路・交通情報
icon
列車内アナウンス

JR九州では、ReadSpeakerを搭載した列車内自動放送アプリが筑肥線の一部列車で使用されています。今まで、ワンマン電車では車両内に設置された専用機器を手動で操作しながら自動放送をおこなっていましたが、更なるサービス向上と内容変更によるコストの軽減のために開発されました。

参照元:ReadSpeaker公式HP(https://readspeaker.jp/news/articles/casestudy20210311_JR-Kyushu.html)

ナビゲーション・PND
icon
サイト内ナビゲーション音声

東京観光財団「GO TOKYO」の公式ホームページでは、トップページの音量ボタンをクリックするだけで、webReader機能を使った音声ナビゲーションが流れます。WEBサイトのバリアフリー化を目的として、年々音声の読み上げ機能を取り入れるサイトが増えていますよ。

参照元:ReadSpeaker公式HP(https://readspeaker.jp/case/web-reading/tourism.html)

スマートフォンアプリケーション
icon
APIマーケットプレイス内多言語読み上げ

KDDI株式会社がリリースした「KDDI IoTクラウド API Market」で、ReadSpeakerを提供しました。「KDDI IoTクラウド API Market」は、新しいサービスを開発したい企業と提供したい企業をマッチングさせるマーケットプライスで、4言語21話者の音声合成(一部感情表現機能あり)を提供しています。

参照元:ReadSpeaker公式HP(https://readspeaker.jp/news/articles/casestudy20180201_kddi.html)

ロボット
icon
教育機関開発ロボットの声

香川高専 機械システム研究部では、毎年開催される高専ロボコンで披露したロボットにWebAPIを導入しました。数行のプログラムコードを書き込むだけですぐ音声合成機能を追加できるので、今回のようにロボットを制作しながら自分たちで音声合成を作成できます。

参照元:ReadSpeaker公式HP(https://readspeaker.jp/news/articles/casestudy_20211025_NIT-Kagawa.html)

e-Learning・教材
・マニュアル作成
icon
テレビCM音声

株式会社ヤナセのTVCMにspeechMaker Desktopの音声合成が流れました。音声合成を利用することで、録音時のリテイクや雑音を気にすることなく、クオリティが高い音声を誰でも簡単に作成できます。

参照元:ReadSpeaker公式HP(https://readspeaker.jp/news/articles/casestudy20210628_Yanase.html)

ReadSpeakerの対応言語一覧

ReadSpeaker
の対応言語
日本語(10話者)、中国語(3話者)、広東語(2話者)、韓国語(2話者)、タイ語(2話者)、英語(9話者)、インドネシア語(2話者)、フランス語(2話者)、スペイン語(4話者)、ポルトガル語(4話者)、ドイツ語(2話者)、イタリア語(2話者)、フランス語(2話者)、スウェーデン語(2話者)、オランダ語(2話者)、ロシア語(2話者)、ノルウェー語(1話者)、ルーマニア語(2話者)、スロバキア語(2話者)

ReadSpeakerの会社の特徴

ReadSpeakerは、元々スウェーデンで設立された音声提供ASPサービス企業の代理店で、2017年にHOYA株式会社が買収した「リードスピーカー・ジャパン株式会社」が運営しています。現在は、HOYA株式会社MD部門 ReadSpeakerを併設しています。
グローバルな音声合成を強みとしており、外国語話者において、アクセントや語尾の上げ下げまでをも調整できるのが特徴です。
福祉先進国生まれであることから、身心機能に制約のある人でも利用しやすい情報機器社会を目指し、音声合成ソフトの普及に力を入れているようです。

HOYAのシリーズ製品紹介

PRODUCT-1

speechMaker Desktop

speechMaker Desktopは、テキスト入力するだけで音声合成が作成できるPC用のソフトウェアです。基本的な音声合成はこの製品1つですべて賄えます。

PRODUCT-2

speechEngine SDK

speechEngine SDK は、ReadSpeakerをネットワークから切り離された状態で使用できる音声合成ソフトウェア開発キッドです。20言語以上に対応した話者が揃っています。

PRODUCT-3

speechServer

speechServer は、ReadSpeakerをサーバーシステム上で利用できるソフトウェア開発キットです。主に、電話応答システムもしくはプラットフォームの構築に適した製品です。

PRODUCT-4

オリジナルボイス

オリジナルボイスは、お客様自身でナレーターを選定後、収録した声をベースに音声合成を作成します。既成の声以外でどうしても音声合成を作りたい人におすすめです。

PRODUCT-5

WebAPI

WebAPI は、アプロやWEBサービスの開発時にプログラムコードを追加するだけで、音声合成機能が搭載できる開発者向けのWEBサービスです。わざわざ別口で作らなくても、開発者自身ですぐ音声合成が作成できます。

PRODUCT-6

webReader

webReader は、ワンクリックで表示ページのテキストを読み上げてくれるサービスです。ソフト等のインストールは不要で、数行のコードを打ち込むだけでプログラミングできます。

PRODUCT-7

docReader

docReaderとは、WEB上に表示されたドキュメントを読み上げるサービスのことです。PDFやWordなど文字が小さく読みづらさを感じた時に使えます。

PRODUCT-8

SpeechPanel

SpeechPanel は、TOPページにリンクを貼るだけでWEBサイトやPDFの文字を自動的に読み上げてくれるサービスです。サイト全体のバリアフリー化を意識したい時に適しています。

PRODUCT-9

Globalvoiceシリーズ

Globalvoiceシリーズは、英語の文章を読み上げる「GlobalvoiceEnglish3」と英語の発音を矯正する「GlobalvoiceCALL」の2種類展開しています。アメリカ英語(3話者)とオプション販売でイギリス英語(1話者)も追加可能です。

ReadSpeakerの会社概要

所在地 東京都新宿区西新宿3-7-1 新宿パークタワー35 階 設立 2006年
公式URL https://readspeaker.jp/ 電話番号 03-6479-7182

音声合成ソフトとは?

音声合成ソフトとは、入力されたテキストや任意のテキストファイルを元に、人工的に音声を生成するソフトのことです。合成音声をつくる技術としてはさまざまな技法が存在します。あらかじめ収録された音声データから入力された文字を呼び出し、それらを繋げて音声を作成する方法が代表的でしたが、人工知能を活用し、より自然でなめらかな音声を短時間で生成する方法も一般化しつつあります。
音声合成ソフトや音声読み上げソフト導入で、業務効率改善に繋がった例もあります。

音声合成ソフトを導入するメリット

人件費削減

人件費削減のイメージ

音声合成ソフトの導入をすることで、ナレーターの手配や収録スタジオの手配などに係る人件費などのコストを削減できます。また、最少人数で音声データの作成や発信まで行うことが可能になります。

業務効率化

業務効率化のイメージ

音声合成ソフトを導入することで、これまでナレーターや収録スタジオの日程調整にかかっていた負担を削減できるだけでなく、都度、人の生身の声で対応していたところをまるっと音声データが取って代わることもできます。また、収録データの不備などによる再収録などの戻り作業もなくなることで、業務の効率化が可能です。

品質の向上

品質の向上のイメージ

音声合成ソフトの導入によって、読み間違い・アクセント・文脈のつながりなどを簡単に調整することができ、聞き取りやすい音声を作成できます。自社製品や社内向け研修資料といった、音声合成を組み込んだものの品質の向上が期待できるでしょう。

事業の幅が広がる

事業の幅が広がるのイメージ

音声合成技術を活用すれば、展示会などのイベントや製品のPR動画、YouTubeや動画アプリの広告、eラーニング、コールセンター、美術館や駅の施設案内など、さまざまな業種・業界で活用できます。

音声合成・音声認識・音声読み上げの違いは?

音声合成

音声合成とは、テキストに対応する音声を自動で生成する技術のことです。
録音編集方式と規則合成方式(TTS…Text to Speech)という方式の2種類が普及していますが、録音編集方式は生成できる音声に制限が多いという特徴があります。
文章を音声化し、情報提供・発信したい場合に利用できます。

音声認識

音声認識とは、音声からテキストデータに変換する技術のことです。コンピューターが音声を解析し、テキスト化していきます。
人と会話ができるロボットに組み込まれるなど、音声認識は、音声合成技術と併せて利用されるシーンが多いです。

音声読み上げ

テキスト読み上げとは、音声合成技術を使い、テキストを音声で出力する技術のことです。
そのためテキスト読み上げも、音声合成技術と併せて利用されるシーンが多いです。
保存した音素から単語を作成して音声出力を行いますが、出力する音声の質を高めるために、単語やフレーズ全体を保存しておくこともあります。

【PR】※音声あり※
音声合成ソフトの品質を
確かめてみた

音声合成ソフトPRイメージ
音声合成ソフトの「声」は
機械的で不自然?

近年需要が高まり、多くの製品が登場している「音声合成ソフト」。その品質は日々刻々と進化しています。「機械っぽい」「違和感がある」など、人工的な不自然さが残るイメージも未だあるようですが、現在における音声合成の仕上がりは、人が本当に話しているかのような水準に近付きつつあります。
この記事では、ディープラーニングの活用で、従来より自然で滑らかな音声を可能にした音声合成ソフトを実際に利用し、その特徴や使い方についてまとめています。設立以降改良を重ねたソフトの導入実績が1,200社以上※を誇る会社を取り上げておりますので、興味がある人はぜひチェックしてみてください。

参照元:エーアイ公式HP:https://www.ai-j.jp/202011lp/ 2022年3月時点。

【無料版あり】製品一覧

Voice Track Maker
(東芝デジタルソリューションズ)

Voice Track Maker は、韻律射影機能搭載で演技表現も可能になりました。Vtuberのような動くキャラクターのアテレコにおすすめです。

会社名
東芝デジタルソリューションズ
所在地
神奈川県川崎市幸区堀川町72-34
電話番号
044-331-1000
公式URL
https://voicetrackmaker.bp.recaius.jp/

音読さん(COMOMO)

音読さんは、WEBの専用エディターから会員登録なしで音声合成が作成できるサービスです。

会社名
COMOMO(販売者名)
所在地
東京都港区南青山2-2-15
電話番号
公式サイトに記載なし
公式URL
https://ondoku3.com/ja/

VOICEVOX(ヒホ)

現役エンジニアが個人で運営するVOICEVOXは、無料で音声合成が作成できます。商用利用もOKです。

会社名
ヒホ(開発者)
所在地
公式サイトに記載なし
電話番号
公式サイトに記載なし
公式URL
https://voicevox.hiroshiba.jp/

棒読みちゃん
(フリーウェア開発者 みちあき氏)

棒読みちゃんはパソコン上に表示されたテキストを取り込み、合成音声で読み上げるフリーソフトです。8種類の声質を標準搭載しており、自由に切り替えられます。無料ながらも対応プラグインが豊富なのが大きな特徴です。

会社名
公式ホームページに記載なし
所在地
公式HPに記載がありませんでした。
電話番号
公式HPに記載がありませんでした。
公式URL
http://chi.usamimi.info/

テキストーク
(Wity有限会社)

テキストークは、Wity有限会社が提供している音声合成ソフト。男性・女性の2通りの声質を自由に切り替えて、文章を読み上げられます。現在読み上げている個所をすぐに見つけられる「読み上げ箇所強調表示機能」が標準搭載されているのがポイントです。

会社名
Wity有限会社
所在地
公式HPに記載がありませんでした。
電話番号
公式HPに記載がありませんでした。
公式URL
https://www.wity.jp/

CoeFont
(株式会社CoeFont)

CoeFontは、月額500円から音声合成が作成できるサービスで、3000種類以上の声から自由に選択できます。

会社名
株式会社CoeFont
所在地
東京都港区赤坂1-12-32 アーク森ビル36階
電話番号
公式サイトに記載なし
公式URL
https://coefont.cloud/
もっと見る

【有料版】製品一覧

AITalk®(エーアイ)

AITalkは、先端技術の深層学習(ディープラーニング)を導入したDNN音声合成方式によって、自然な喜怒哀楽が再現できます。

会社名
株式会社エーアイ
所在地
東京都文京区西片1-15-15 KDX春日ビル10階
電話番号
03-6801-8461
公式URL
https://www.ai-j.jp/company/

ReadSpeaker
(HOYA株式会社)

ReadSpeaker は、20以上の言語に対応しているので、外国語の音声合成を検討している人におすすめです。

会社名
HOYA株式会社
所在地
東京都新宿区西新宿3-7-1 新宿パークタワー35階
電話番号
03-6368-5254
公式URL
https://readspeaker.jp/

コエステーション
(コエステ株式会社)

コエステーションは、40以上の有名人と9万以上の一般人の声を自由に音声合成できるのが特徴です。

会社名
コエステ株式会社
所在地
東京都港区南⻘山3-1-30 エイベックスビル
電話番号
公式サイトに記載なし
公式URL
https://coestation.jp/

美音工房® 奏®
(日立産業制御ソリューションズ)

美音工房 奏は、日立製作所中央研究所が開発した「セレクティブ重畳型音声合成方式」によって、アナウンサーが話しているかのようなリアルな音声が再現できます。

会社名
日立産業制御ソリューションズ
所在地
東京都台東区秋葉原6-1 秋葉原大栄ビル
電話番号
03-3251-7200(東京本社)
公式URL
https://www.hitachi-ics.co.jp/

FutureVoice Crayon
(NTTテクノクロス)

FutureVoice Crayon は、NTTが蓄積した音パターンを活用しているので、人間らしい滑らかな音声が提供できます。

会社名
NTTテクノクロス
所在地
東京都港区芝浦3-4-1 グランパークタワー 15階
電話番号
03-5860-2900
公式URL
https://www.ntt-tx.co.jp/

音声合成 mimi® TTS
(Fairy Devices)

音声合成 mimi TTSは、NICT(国立研究開発法人情報通信研究機構)の音声合成エンジンを使用した音声合成ソフトです。

会社名
Fairy Devices株式会社
所在地
東京都文京区湯島2-31-22 湯島アーバンビル 7階
電話番号
公式サイトに記載なし
公式URL
https://fairydevices.jp/

VoiceOperator音声合成(NEC)

VoiceOperator音声合成は、NEC中央研究所が研究した「自然言語処理技術」で、日本語の誤読を最小限に抑えてくれるのがポイントです。

会社名
NEC Corporation
所在地
東京都港区芝5-7-1
電話番号
03-3454-1111
公式URL
https://jpn.nec.com/

SpeeCAN®(Arcadia)

SpeeCANは、自社で開発した複数の音声ツールを1つにまとめた音声合成ソフトです。声を使ったアプリが開発できるツールから簡易包装ができるツールまで、便利な機能が揃っています。

会社名
株式会社アルカディア
所在地
大阪府箕面市箕面6-3-1 みのおサンプラザ1号館7F
電話番号
050-5830-0750
公式URL
https://www.arcadia.co.jp/

ボイスソムリエネオ
(日立ソリューションズ・クリエイト)

大手電機メーカー日立が開発したイスソムリエネオは、肉声に近い滑らかな音声を演出します。

会社名
日立ソリューションズ・クリエイト
所在地
東京都品川区東品川4-12-6(品川シーサイドキャナルタワー)
電話番号
(03)5780-6111
公式URL
https://www.hitachi-solutions-create.co.jp/

テクノスピーチ
(株式会社テクノスピーチ)

テクノスピーチは、名古屋工業大学を中心に開発された音声合成ソフトです。統計的パラメトリック音声合成の採用で、従来の音声合成より自然な音色を演出します。

会社名
株式会社テクノスピーチ
所在地
愛知県名古屋市千種区千種2-22-8 名古屋医工連携インキュベータ オフィス313
電話番号
052-439-6911
公式URL
https://www.techno-speech.com/

AquesTalk
(株式会社アクエスト)

AquesTalkは小型・軽量・組み込みが容易という3つにこだわって研究・開発されました。明瞭な音声合成が可能です。

会社名
株式会社アクエスト
所在地
横浜市青葉区たちばな台 2-18-60
電話番号
記載なし
公式URL
https://www.a-quest.com/index.html

VOICEPEAKk
(株式会社AHS)

VOICEPEAKは、株式会社AHSが販売している入力文字読み上げソフトです。商用可能で6ナレーター+幼い女の子も声も収録されています。感情表現や辞書登録、イントネーション調整や音声保存なども可能です。

会社名
株式会社AHS
所在地
東京都台東区上野3-16-3 上野鈴木ビル5F
電話番号
記載なし
公式URL
https://www.ah-soft.com/

FineSpeech
(株式会社アニモ)

FineSpeechは株式会社アニモが提供している音声合成システムです。品質の高さはもちろん、聞き取りやすさにもこだわっているのが特徴です。幅広い用途に合わせたプログラム・豊富なオプションライブラリがあり、多くの場面で活用されています。

会社名
株式会社アニモ
所在地
神奈川県横浜市中区尾上町2-27大洋建設関内ビル 4F
電話番号
045-663-8640
公式URL
https://www.animo.co.jp

AI suite
(NTTレゾナント株式会社)

AI suiteは、AIに関連する実に多くの機能が用意されています。目的に合わせて必要なシステムを組み合わせることにより、スピーディーにAIサービスを構築できるのが特徴です。急ぎ導入したいような場合でも適しています。

会社名
NTTレゾナント株式会社
所在地
東京都千代田区大手町1-5-1 大手町ファーストスクエア イーストタワー
電話番号
公式HPに記載がありませんでした。
公式URL
https://www.nttr.co.jp/

ドキュメントトーカ Plus
(クリエートシステム開発株式会社)

ドキュメントトーカ Plusはシンプルでわかりやすく、操作性に優れています。C言語で作成されたアプリケーションであることから非常に軽いので、重いシステムを導入できないケースにもおすすめです。制限はありますが、フリーソフト版も利用可能です。

会社名
クリエートシステム開発株式会社
所在地
東京都立川市曙町2-4-4 昭和ビル7F
電話番号
042-527-5772
公式URL
https://www.createsystem.co.jp/main/index.html

音声合成SDK
(株式会社日立ケーイーシステムズ)

音声合成SDKでは、漢字かな混じりのテキストデータを音声に変換できます。滑らかで肉厚感が高い音声が特徴的です。抑揚も自然で、読み上げ機能に優れています。同表記異読文字の読み分け機能も精度が高く、利用しやすいです。

会社名
株式会社日立ケーイーシステムズ
所在地
千葉県習志野市東習志野7-1-1
電話番号
047-477-3111
公式URL
https://www.hitachi.co.jp/

Amazon Polly
(AWSジャパン株式会社)

Amazon Pollyは、通販サービスで有名なAmazonにより提供されている音声合成ソフトです。何十種類ものリアルな音声を多数の言語でサポートしており、より自然で人間的な声で文章を読み上げられます。

会社名
AWSジャパン株式会社
所在地
東京都品川区上大崎3丁目1-1 目黒セントラルスクエア
電話番号
公式HPに記載がありませんでした。
公式URL
https://aws.amazon.com/jp/?nc2=h_lg

Ruby Talk
(日立ソリューションズ・テクノロジー)

LINE AiCallは女性・男性・子どもそれぞれの音声で読み上げを行う音声合成ミドルウェアです。DNNを導入し、安定的な韻律の読み上げが可能。カーナビゲーション専用音声やアナウンスなど用途に応じた読み上げに対応しています。

会社名
株式会社日立ソリューションズ・テクノロジー
所在地
東京都立川市緑町7番地1 アーバス立川高松駅前ビル4F
電話番号
042-512-0888
公式URL
https://www.hitachi-solutions-tech.co.jp/

LINE AiCall
(LINE CLOVA)

LINE AiCallはLINE株式会社が開発したAIアシスタント・LINE CLOVAが搭載されたボイスボットです。シニア顧客にも聞き取りやすい音声合成で、コールセンターの業務負荷を軽減。有人対応とのハイブリッド化も可能になります。

会社名
LINE株式会社
所在地
東京都新宿区四谷一丁目6番1号 四谷タワー23階
電話番号
公式HPに記載がありませんでした。
公式URL
https://clova.line.me/line-aicall/

音読のプロ

音読のプロは、テキストを入力するだけで読み上げを行ってくれるソフトです。男性声と女性声が用意されており、wav形式で音声が保存できる機能も搭載。扱いやすい、シンプルな使い勝手が特徴です。

会社名
ソースネクスト株式会社
所在地
東京都港区東新橋1-5-2 汐留シティセンター33階
電話番号
公式HPに記載がありませんでした。
公式URL
https://www.sourcenext.com/product/pc/use/pc_use_002052/

WorldVoice 日中英韓2(高電社)

WorldVoice 日中英韓2(高電社)はまるでネイティブが話しているかのような自然な発音で、音声合成を行うソフトです。日本語・英語・中国語・韓国語の4か国語に対応しています。

会社名
株式会社高電社
所在地
東京都千代田区隼町2-13プライムビル3階
電話番号
03-6705-5720
公式URL
https://www.kodensha.jp/index/

COEIROINK

COEIROINKはオリジナル二次元キャラクターに、6種類のキャラクターの声を与えられる音声合成ソフトです。二次創作にも無償で利用でき、コードを利用したオリジナルの音声開発にも対応しています。

会社名
公式ホームページに記載なし
所在地
公式HPに記載がありませんでした。
電話番号
公式HPに記載がありませんでした。
公式URL
https://coeiroink.com

Narakeet

Narakeetはブラウザ上からテキストを入力して音声合成ができるソフトです。PowerPointのファイルをアップロードすれば、スライドをナレーション付きのビデオにすることもできます。

会社名
Video Puppet Limited
所在地
62 Goldsworth Road, Woking, GU21 6LQ, United Kingdom
電話番号
公式HPに記載がありませんでした。
公式URL
https://www.narakeet.com

ToSpeak(東芝デジタルソリューションズ)

ToSpeakはゲームやアプリケーションに組み入れることができる多言語対応型の音声合成ミドルウェアです。スタンドアロンで滑らかに発話し、自社の商品に「発話をする機能」を付加できます。

会社名
東芝デジタルソリューションズ
所在地
神奈川県川崎市幸区堀川町72番地34
電話番号
公式サイトに記載なし
公式URL
https://www.global.toshiba/jp/company/digitalsolution.html

A.I.VOICE GUMI(株式会社インターネット)

A.I.VOICE GUMIは株式会社インターネットが提供する音声作成ソフトです。声優の中島 愛さんの声をベースにしており、ボイスフュージョン機能や管理機能が加わり、さらに使いやすくスムーズな音声合成が可能になりました。

会社名
株式会社インターネット
所在地
大阪市淀川区西中島7丁目1番5号
電話番号
公式サイトに記載なし 公式URL:https://www.ssw.co.jp/

Dojo(株式会社テンダ)

Dojoは株式会社テンダが提供する自動マニュアル作成ツールです。マニュアルの作成に特化しているため、テキスト入力後の音声変換や操作説明文の自動作成など、一定品質のマニュアルが作成できる機能が豊富に搭載されています。

会社名
株式会社テンダ
所在地
東京都渋谷区渋谷2-24-12 WeWork 渋谷スクランブルスクエア内
電話番号
03-3590-4110
公式URL
https://www.tenda.co.jp/

Watson Text to Speech(IBM)

IBMによって提供されているWatson Text to Speechは、テキストをさまざまな言語の自然な響きの音声に変換してくれるAPIクラウド・サービスで、海外の顧客にも母国語で対応することができ、カスタマーサービスの状況改善に役立てることができます。

会社名
IBM(International Business Machines Corporation)
所在地
(日本IBM株式会社)東京都中央区日本橋箱崎町19-21
電話番号
(日本IBM株式会社)03-6667-1111
公式URL
https://www.ibm.com/

Inspirium 音声合成ライブラリ V3.0(富士通株式会社)

Inspirium 音声合成ライブラリ V3.0は富士通株式会社が開発した音声合成ライブラリで、日本語特有の漢字かな混じり文を自然な音声で読み上げてくれます。さまざまな機器に搭載可能で、日常のいろいろな場面で活用することができます。

会社名
富士通株式会社
所在地
東京都港区東新橋1-5-2 汐留シティセンター
電話番号
03-6252-2220
公式URL
https://www.fujitsu.com/jp/

音声対話

音声対話イメージ

音声対話システムに、音声合成ソフト・エンジンを採用している企業が増えています。ここでは、音声対話システムに音声合成ソフト・エンジンを活用している企業の事例を紹介しています。

防災行政無線

防災行政無線イメージ

防災行政無声を活用し、市民すべての住民へ防災情報を伝達している自治体では、音声合成ソフトを活用して、スピードやイントネーションを再現し、聞き取りやすい音声を作成し正確な情報を発信しています。

道路・交通情報

道路・交通情報イメージ

道路・交通情報のサービスを提供している財団法人日本道路交通センターでは、音声合成ソフトを活用して、電話による全国の交通情報をリアルタイムに提供をしています。そのほか船の運航状況や観光案内に音声合成ソフトを活用している企業を紹介しています。

ナビゲーション・PND

ナビゲーション・PNDイメージ

カーナビの音声データに、音声合成ソフトやエンジンを活用して、自然な聞き取りやすい音声でドライバーのナビゲーションの向上に実現している企業は少なくありません。また、ドライバーとの対話を通し、駐車場や充電ステーションなど施設の利用状況などリアルタイムに提供している企業の活用事例を紹介しています。

スマートフォン
アプリケーション

スマートフォンアプリケーションイメージ

スマートフォンアプリケーションの開発や実証実験に、音声合成ソフト・エンジンを採用することで、音声の聞き取りやすさなどのブラッシュアップに成功している企業をまとめて紹介しています。

観光案内・
館内・
車内各種放送

観光案内・館内・車内各種放送イメージ

観光案内・館内・社内各種放送に、音声合成ソフト・エンジンを活用して、日本語、英語、中国語、韓国語など多国後で案内放送を提供している企業や博物館なの活用事例をまとめて紹介しています。

電話自動応答
システム

電話自動応答システムイメージ

さまざまな業種・業界でコールセンターやバックオフィスの受託事業を展開している企業で採用している音声合成ソフト・エンジンの活用事例をまとめて紹介しています。

ロボット

ロボットイメージ

ロボットの音声データに、音声合成ソフト・エンジンを活用して、より人間的で、自然でなめらかな音声で、対話をすることが可能になります。また、ロボットのほかに、バーチャルユーチューバーの音声にも利用ができます。

WEBキャンペーン・
WEBサービス

WEBキャンペーン・WEBサービスイメージ

WEBキャンペーンやWEBサービスで、音声合成ソフト・エンジンを利用する企業が増えてきています。WEBページから、自分の名前や嫌いなこと入力すると、自分だけの映画予告ムービーを作成できるWEBサービスなどを提供している企業の事例をまとめて紹介しています。

ゲーム

ゲームイメージ

ゲームの制作に、音声合成ソフト・エンジンを活用することで、臨場感あふれるゲームの制作が可能になります。そのほか、コンビニのプリントサービスの音声機能付きブロマイドなどサービスを提供している事例をまとめて紹介しています。

e-Learning・
教材・
マニュアル作成

e-Learning・教材・マニュアル作成イメージ

e-Learning・教材・マニュアル作成に、音声合成ソフト・エンジンを採用し、教材やマニュアルに音声データを組み込んでいる企業のなど紹介をまとめて紹介しています。

ニュース
読み上げ

ニュース読み上げイメージ

ニュースの呼び上げに、音声合成ソフト・エンジンを採用し、「24時間多種多様なニュースの対応」、「コストの削減」に活用しているテレビ局の、音声合成ソフト・エンジンの活用事例などをまとめて紹介しています。

音声合成技術はAI(人工知能)の発達も相まって、滑らかな発音や感情表現を実現しています。人工的な声の印象がある施設の館内放送や電話自動応対のみならず、今や研修資料やゲーム機器など、多種多様な用途・業界にて活用されています。
ここでは、「音声合成」を活用した業界別の事例や、課題ごとに「音声合成」を活用した事例をまとめています。

ゲーム業界イメージ

ゲーム業界

ヤマハが開発した音声合成技術「ボーカロイド」、NTTドコモが提供する「ひつじのしつじくん」サービスなど、ゲームの世界で進む音声合成技術。音声対話型AIの開発が進むゲーム業界での音声合成技術についてご紹介します。

コールセンター業界イメージ

コールセンター業界

さまざまな業種が導入しているコールセンター。オペレーターの負担軽減とコスト削減のために音声合成が活用されています。どのような方法で活用されているのでしょうか。具体的な事例をピックアップして比較しています。

自動車業界イメージ

自動車業界

自動車業界で進んでいる「自動運転技術」の研究。このページでは「オートモーティブ・アシスタント」をピックアップ。自動車に搭載されているAIが利用者を助ける分野で、音声認識や音声合成の技術についてレポートしています。

教育業界イメージ

教育業界

新型コロナウイルス感染予防措置として、教育業界で急速に普及するパソコンやタブレットを使った「デジタル教材」による教育。動画やアニメのナレーションや教科書の音声読み上げ機能で活躍する、音声合成技術の活用事例をまとめました。

金融業界イメージ

金融業界

現金・クレジットカード・スマホ・Pey払いなどの多様な決済対応や、ネット上のリアルタイム取引、顧客への金融商品の提案など、金融業界のサービス向上はAI技術の発展に支えられています。ここでは金融業界での音声合成活用事例を集めました。

自治体イメージ

自治体

少子高齢化が進む日本。全国の自治体が、住民サービスの向上や、職員の業務効率化などのために、音声合成AIを活用する動きが目立ってきました。ここでは「サイト読み上げサービス」「防災無線」「電話応対AI」などへの取り組みをご紹介します。

フリーの音声合成ソフト

フリーの音声合成ソフトは種類が豊富です。各社からさまざまなタイプのソフトが提供されています。ただし、高品質な音声をつくりたい場合は有料ソフトがおすすめです。有料ソフトは音声ライブラリの種類が豊富で、喜怒哀楽など感情のある音声もつくれます。

音声合成の仕組み

音声合成の仕組み(方式)には、代表的な録音編集方式・テキスト音声合成方式をはじめ、規則合成方式、コーパスベース合成方式、波形接続型音声合成方式、統計モデル型音声合成方式とさまざまな種類があります。こちらでは、各方式の概要を解説しています。

音声合成ソフトのイントネーション

音声合成ソフトではイントネーションの調整ができます。これによりソフトの不自然さを軽減することができ、感情のある声にすることもできます。より高いレベルの感情表現が必要な場合は、人に読んでもらう方法が良いですが、コストや時間を抑えたいならソフトがおすすめです。

音声合成の今後

年々技術が進歩している音声合成は、今後も利用の拡大や普及が進むとされています。一方で悪用される懸念が残っており、海外では詐欺事件に使われたケースも。また、声優など声の職業に影響するとも考えられています。

自分の声も合成音声に利用できるのか?

音声合成ソフトの中には、自分の声を利用して音声ファイルを作成できるサービスもあります。費用はかかるものの、自分の声を使ったオリジナル音声を作成できるのが特徴です。利用方法はさまざまですが、ビジネスならプレゼンや講演会での利用に適しています。

動画作成で音声合成を使うメリットは?

動画作成にも音声合成ソフトが適しています。音声合成ソフトを利用すれば外注の必要がなくなり、コストを削減できます。動画の内容も伝えやすくなるでしょう。ただし、音声合成ソフトは読み上げできない文字もあるため、事前に確認する必要があります。

子供の声を利用できる音声合成

音声合成ソフトによっては、子供の声でテキストや単語を読み上げさせることが可能です。子供向けコンテンツなどで、子供の音声が必要な時に適しています。ただ、ソフトによって機能は異なりますので、しっかり確認して選びましょう。

音声合成で起こりうる不具合

音声合成ソフトを利用していると、音が出なかったり、フレーズが再生されなかったりと、不具合が起きる場合もあります。もし不具合が出た時は、音声合成ソフトの修正版がリリースされていないか確認しましょう。また、OSを最新版にアップデートするのも解決方法の1つです。

オンラインで活用できる音声合成ソフト

音声合成ソフトを利用するには、PCへインストールしなくてはいけません。しかし、オンラインの音声合成ソフトなら、ダウンロード不要ですぐに利用できます。機能は限られますが、音声合成ソフトを試してみたい方は使ってみましょう。

音声合成ソフトの費用とプロへ依頼する費用の比較

動画を制作する際には、視聴者が分かりやすいようにナレーションを入れることもありますが、プロのナレーターに依頼するか音声合成ソフトを利用するか迷った際には、それぞれにかかる費用で比較してみてはいかがでしょうか。

音声合成ソフトの英語対応

音声合成ソフトの中には、英語に対応しているものがあります。主なメリットは、流暢な英語でテキストを読みあげてくれることです。ここでは英語に対応している音声合成ソフトのメリット、製品の例を紹介しています。

音声合成ソフトの方言対応

一部の音声合成ソフトは方言に対応しています。活用するメリットは、地域向けコンテンツに活用できるナレーションなどを作成できることです。詳しいメリットと方言対応の音声合成ソフトを紹介しています。

音声合成ソフトとChatGPTの連携

音声合成ソフトとChatGPTを連携させると音声による対話が可能になります。文字情報による対話の負担を軽減できるでしょう。ここでは、連携で生まれるメリット、両者を連携させた事例を紹介しています。

音声合成ソフトの人気キャラクター

音声合成ソフトが展開しているキャラクターはたくさんあります。それぞれのビジュアルに個性があるほか、声の特徴もさまざまです。利用用途や好みに合ったソフトを選ぶことで、理想とする作品を作ることができます。

音声合成ソフトのAPI連携

音声合成ソフトのAPI連携とは、すでに展開されている音声合成ソフトをAPI連携することでコストを削減しながら音声合成ソフトを利用することができます。用途に応じてさまざまなAPI連携の音声合成ソフトが展開されています。

音声合成ソフトのマークアップ言語

音声認識ソフトで音声を作成する際には、SSMLの「マークアップ言語」を使用することで音声をさまざまな形にカスタマイズできます。コードを入力することで音声のコントロールが可能で、コードはたくさんあるため、音声を細かくコントロールすることが可能です。

音声合成ソフトと著作権の関係性

音声合成ソフトで音声データを作成するにあたり、音声データ自体は著作権法に抵触しませんが、使用した原稿が著作権で保護された制作物の場合は、著作権法違反となり得ます。著作権違反をしないためにも、著作権についての理解を深めておくことが重要です。

音声合成ソフトを活用した音声配信

自社の商品やサービスをPRする際に、音声配信を活用している企業が増えています。SNSで無料の音声配信ができるものも多く、手軽に配信できる点は大きなメリットです。音声配信において合成音声ソフトで作成した音声データを活用している企業もあります。

音声合成ソフトを活用した音声広告

音声広告では、その名の通り音声で商品の宣伝を行うことができます。音声合成ソフトを使用することで、商品やサービスに合った音声広告を制作することができるほか、コストや工数を押さえられるというメリットもあります。

音声合成ソフトによるナレーションの精度

音声合成ソフトの音声精度は発展を続けており、現在ではさまざまなメディアに活用されています。テレビ番組で採用されていることも多く、バラエティ番組をはじめドラマに採用されるなど、活用用途は実に幅広いです。

音声合成ソフトによるブランディング

企業のブランディングを行うにあたり、特にオンラインでのブランディングにAIキャラクターを制作するケースが増えています。AIキャラクターの声に音声合成ソフトを使用されることが多く、さまざまな企業のブランディングに活用されています。

音声合成ソフトのセミナー・イベント

音声合成ソフトを提供している会社では、さまざまなセミナーやイベントを開催しています。参加することでサービスについての理解を深めることができるほか、実際に体験して導入を検討することができるなどのメリットを得られます。

音声合成ソフトの中国語対応

中国語対応の音声合成ソフトを使用することは、中国語の勉強に役立ちます。英語のように文字を見て発音をイメージすることができないため、実際の音声を聞いて勉強することが上達の近道です。また、塾や学校の教材づくりにも中国語対応の音声合成ソフトが活躍します。

音声合成ソフトの韓国語対応

韓国語に対応した音声合成ソフトには、さまざまな活用方法があります。文章を韓国語で音声化してリスニングの勉強をすれば、効率的な韓国語の習得が期待できます。また自然な声でネイティブ並みの発音を生成できる音声合成ソフトもあるため、商用利用にも活用できます。

音声合成ソフトのドイツ語対応

音声合成ソフトにはさまざまな種類があり、それぞれの機能に応じていろいろな場面で活用できます。ドイツ語での合成音声を生成できる製品も多く、大量のテキストをまとめて音声化できるサービスもあるので、用途に応じた製品を見つけられます。

音声合成ソフトのフランス語対応

音声合成ソフトにはフランス語に対応しているものが多数あります。テキストを入力するとAI音声を生成するなど、簡単に使用できるものも多いです。実際にフランス語対応の合成音声ソフトは、駅の構内放送など幅広い場面で活用されています。

音声合成ソフトのスペイン語対応

音声合成ソフトは多言語に対応しているものが多数展開されており、スペイン語に対応しているものも多いです。観光案内やサービスの使用方法など、さまざまな場面でスペイン語の音声を制作する機会がありますが、そんなとき音声合成ソフトを活用すると手軽に作成できます。

音声合成ソフトのイタリア語対応

音声合成ソフトで外国語に対応しているソフトは多数ありますが、イタリア語に対応しているものも多いです。複数の音声を用意しているソフトもあるので、用途に応じて音声を使い分けられる点がメリットだといえます。

音声合成ソフトのアラビア語対応

音声合成ソフトの翻訳機能は英語や中国語などが主流のイメージがありますが、アラビア語に対応している製品もたくさんあります。アラビア語圏の外国人に向けた観光地のガイドや勉強など、さまざまな用途で活用可能です。

音声合成ソフトのヒンディー語対応

外国語のガイドや研修資料などを作成するにあたり、ヒンディー語を扱うことは難易度が高いイメージがあります。音声合成ソフトを活用することで、手軽に元の言語からヒンディー語の音声やテキストを作成することが可能です。

音声合成ソフトのインドネシア語対応

観光スポットや駅などで導入されている外国語のガイダンスは、言語の数が増えました。英語や中国語、韓国語のほか、インドネシア語を導入することが望ましいエリアもあると思われます。音声合成ソフトを使用すれば、簡単にガイドを作ることができます。

音声合成ソフトのポルトガル語対応

音声合成ソフトの対応言語は、英語や韓国語だけでなくポルトガル語に対応しているソフトも増えています。日本に居住しているポルトガル語圏の外国人は多く、さまざまな場所でアナウンスを導入することで、ポルトガル語ができないスタッフがコミュニケーションに苦労することなく対応できます。

音声合成ソフトのベンガル語対応

音声合成ソフトでベンガル語の音声を生成したい人に向けたサービスは複数あります。テキストを入力するとベンガル語の音声に変換してくれるものが多く、操作性がシンプルなので手軽にアナウンスを作成できる点が魅力です。

音声合成ソフトのベトナム語対応

音声合成ソフトはベトナム語のアナウンス制作のほか、リスニングの学習など語学にも活用できます。またベトナム人居住者の多い自治体では、自治体のホームページに音声合成ソフトを掲載しているなど活用の幅はとても広いです。

音声合成ソフトのタイ語対応

音声合成ソフトは、日本に技能実習や就労で滞在するタイ人への教育・研修に活用できます。タイ語によるコンテンツがあれば意図を伝えやすく、観光地や人気のスポットではタイ人旅行者へのアピールにも利用できます。

音声合成ソフトのウクライナ語対応

世界の言語に対応している音声合成ソフトの中には、近年需要が高まっているウクライナ語にも対応しているものがあります。ロシア語や英語でのコミュニケーションが難しいウクライナ人との意思疎通や言語教育に役立ちます。

音声合成ソフトのオランダ語対応

オランダは400年以上にわたって日本と交流を続けてきた国です。現在では日本企業がオランダに300社以上進出し、オランダでの交流も頻繁に行われています。音声合成ソフトを活用すれば、日蘭翻訳や相互理解に役立てられるでしょう。