AI合成・読み上げが可能な
音声合成ソフトおすすめ3選

自治体の防災無線や館内放送、電話の自動応対、ナレーションなど、さまざまなシーンで利用される音声合成ソフト。
本サイトでは無料版と有料版を比較し、高品質な音声を商用利用できる有料版の音声合成ソフトおすすめの3選をご紹介します。

おすすめの3選を見てみる

音声合成ソフトとは?

音声合成ソフトは、入力したテキストを人間の声で読み上げるツールです。
かつては、事前に録音された音声を組み合わせていましたが、近年はAI技術の発展により、驚くほど自然なイントネーションや抑揚を再現できるようになりました。
この技術は、無料版と有料版があり、学習用途からプロの動画ナレーションまで、さまざまなシーンで活用されています。

有料版?無料版?あなたにぴったりの音声合成ソフトは?

音声合成ソフトの利用を考えている方は、「無料版と有料版、どちらを選べばいいの?」と悩むことが多いでしょう。この2つには、音声の品質や機能、利用できる範囲において大きな違いがあります。
あなたの目的や用途に合わせて最適なソフトを見つけられるよう、簡単な4つの質問で診断してみましょう。

Q.作成した音声で収益化したいですか?

有料or無料をチェック

A.有料版がおすすめです

無料版は商用利用が禁止されているものが多く、収益化には使えません。
有料版なら、著作権や利用規約を気にすることなく、YouTubeやeラーニングなどでビジネス活用できます。

Q.自然で感情のこもった声が必要ですか?

有料or無料をチェック

A.有料版がおすすめです

無料版は機械的な音声になりがちで、抑揚や感情表現ができません。
有料版は、人間のような自然な声や喜怒哀楽を表現できるので、動画ナレーションなど聴き手を惹きつけたい場合に効果的です。

Q.英語や中国語など、日本語以外の
音声が必要ですか?

有料or無料をチェック

A.有料版がおすすめです

無料版は日本語に特化しているものがほとんどです。
有料版なら、複数の言語に対応しており、音声のスタイルや感情を調整しながら多言語コンテンツを制作でき、海外の視聴者にもアプローチできます。

Q.個人の趣味や学習目的で、
基本的な読み上げができれば十分ですか?

有料or無料をチェック

A.無料版がおすすめです

無料版は高品質な声や細かな調整はできませんが、基本的な読み上げは十分に備えています。
お試し利用や個人的な用途であれば、無料版で満足できるでしょう。

目的に合ったものはどれ?
ニーズ別音声合成ソフトの
おすすめ3選

調整が簡単で質の高い
音声合成をしたい

AITalk®
(株式会社エーアイ)

特徴
先端ディープラーニングを導入した独自の技術で、
音質・肉質感の向上、多様な発話表現を実現。
利用シーン
日本語・英語・中国語をメインに、
品質重視のカーナビや館内放送、
ニュース読み上げなど

芸能人の声を使った
音声合成をしたい

コエステーション
(コエステ株式会社)

特徴
9万以上の一般ユーザーだけでなく、
40以上に
のぼる有名人などの
豊富な「コエ」を収録。
利用シーン
世界観重視の
ゲームやYouTube動画など
(エンタメ系)

外国語をメインに
音声合成をしたい

ReadSpeaker
(HOYA株式会社)

特徴
中国語と区別して広東語も。
日本語、英語(アメリカ・イギリス)、
韓国語をはじめ、24言語に対応。
利用シーン
観光案内や美術館の音声ガイダンスと
いった、
外国籍の方の利用が多い場所など

【選定基準】Googleで「音声合成ソフト」と検索して出てきた、14社の中から、以下の条件に当てはまる企業を3社選出しました。(2022年2月調査時点)
・AITalk®
日本語話者が最多。ディープラーニングを用いた先端技術であるDNN音声合成を使った独自エンジン
・コエステーション
声優や芸能人などプロの声数が最多
・ReadSpeker
外国語の種類が豊富で、唯一外国語におけるイントネーション調整が可能。

【音声合成ソフト】ニーズ別
おすすめ3製品の詳細

調整が簡単で質の高い音声合成をしたい

AITalk®(株式会社エーアイ)

株式会社エーアイの公式HPキャプチャ

引用元:エーアイ公式HP https://www.ai-j.jp/company/

AITalk®のおすすめポイント

自然で滑らかな
感情表現を得意とする
品質の良さ

AITalkは、省力でのデータ処理が高速化されることで、従来の音声合成ソフトより自然な感情表現を可能にしたソフトです。
この技術によってAITalkでは、「平静」「喜び」「怒り」「悲しみ」を簡単に表現することが可能になりました。
また特にAITalkは、日本語解析の強化により、正確性の高い漢字の読みやアクセントを得意としています。

老若男女、方言など
選べる日本語・外国語話者の
豊富さ

大人から子どもまで総勢18名の日本語話者の声があり、豊富な声から好みの音声を探せます。方言は関西弁が備わっているので、関西向けのコンテンツ制作にもおすすめです。
外国語は、英語や中国語・スペイン語やポルトガル語など全部で41言語が搭載されています。日本語だけでなく外国語の種類も豊富なので、外国語の音声合成を検討している人におすすめです。

「音」を必要とする
さまざまなシーンで
使える活用幅の広さ

AITalkは、PCへの文字入力でナレーション作成ができる「AITalk 声の職人」やPowerPointの文章をそのまま音声化できる「AITalk 声プラス」、小型でAndroid・iOS対応した「AITalk micro」といった、複数の製品を展開しています。 PCインストール型や機器組み込み型など充実しているため、音声を使いたい場面にぴったりなソフトが見つかるでしょう。
どんな音声合成ソフトが自分や会社にマッチするのかわからない場合でも、利用目的や利用場面の相談から受け付けています。

AITalk®の主な機能一覧

  • 自由文音声
    自由文音声

    自由文音声とは、
    テキスト記入欄に入力した文章を音声化したものです。このため、テキスト入力できる文言であればどんなものでも音声化が可能です。

  • 単語登録
    単語登録

    単語登録とは、
    専門用語や難しい単語もしくは定型文を登録して、音声合成を作成しやすくすることです。

  • 話速変換
    話速変換

    話速変換は、
    発声のスピードを変えることで、単語と単語や文節と文節の間に空白を作ったり、間を詰めたりできます。話速変換によって、より聞き手に伝わりやすい音声の生成が可能です。 

  • 感情表現
    感情表現

    感情表現は、
    喜怒哀楽を調整できる機能です。声の高低や抑揚、話すスピードなどいくつかの要素を組み合わせることでこれを実現しています。 

  • イントネーション調整
    イントネーション調整

    イントネーション調整とは、
    単語や文章ごとにイントネーションの強弱を設定できることです。メーカーや製品ごとに強弱できる段階が異なる場合があります。

  • 音高調整
    音高調整

    音高調整は、
    単語や文章ごとに声の高低を設定できます。メーカーや製品ごとに強弱できる段階が異なる場合があります。

▲サポート項目にマウスオンすると説明が表示されます

▲サポート項目をタップすると説明が表示されます

AITalk®の製品一覧

AI Talk

PCにソフトをインストールする必要がなく、ウェブブラウザ上で手軽にAITalk 声の職人の機能を使えます。テキストをブラウザに入力することでナレーションやガイダンス音声が作成可能です。

月額プランの契約によって低予算で導入できるので、小規模での音声ファイル作成をしたい時に適しています。

項目 単月プラン 年間契約プラン
基本料金 ¥55,000 ¥6,600,000
追加料金 ¥11,000 / 10,000文字 ¥11,000 / 10,000文字
ユーザー辞書再登録オプション ¥16,500 / 回 ¥16,500 / 回
SoundUD対応音響通信オプション ¥11,000 / 月 ¥110,000 / 年
音声ファイル作成サービス

音声ファイル作成サービスは、収録文章を送ることで、エーアイの音声合成によってナレーションやガイダンス音声を作成し、音声ファイルを出力します。

5000文字ほどの大規模音声収録に対応しているため、株主総会や各種ガイダンス音声等に適しています。

5000文字まで110,000円
  • 修正回数は2度まで
  • 以降500文字単位で加算 追加500文字 11,000円
  • 最大10,000文字まで(220,000円)
  • 10,000文字を超える場合は別途相談
  • 修正・追加オプション 500文字 11,000円(最後の委託から半年間のみ有効)
AITalk 声プラス
イメージ
引用元HP:株式会社エーアイ
https://www.ai-j.jp/products/voiceplus/

このソフトは、PowerPoint®のスライドに音声を挿入する作業を効率化するツールとして使えます。豊富な話者のラインナップや用途に合わせた感情調整が可能で、人間的で自然かつ高品質な音声を表現できます。

PowerPoint®上で音声の作成から挿入までを手軽に行えます。

1年利用ライセンス(話者2名) 555,000円/1ライセンス
5年利用ライセンス(話者2名) 880,000円/1ライセンス
※1話者追加 165,000円/1話者
AITalk Custom Voice

AITalk Custom Voiceは、有名人や自分の声を収録して音声合成を作成できるサービスです。最新のAITalk6に対応し、感情表現も可能になりました。

より人間らしく再現性の高い音声のため、主にゲームやVtuberのアテレコにおすすめです。

※料金については直接お問い合わせください。
AITalk International

41の国の言語の音声合成に対応したソフトです。作成したい言語の文章を用意し手入力することで希望の言語での音声を作成することができます。

このサービスの魅力は、文章を修正するだけで多言語の音声を簡単に差し替えられる点です。そのため、観光地の案内、館内放送、e-learning教材など、幅広い用途で活用できます。

永年利用ライセンス
(1言語・1話者)
1,100,000円/1ライセンス
言語追加 550,000円/1言語
話者追加 220,000円/1言語
AITalk 声の職人
イメージ
引用元HP:株式会社エーアイ
https://www.ai-j.jp/products/voice/

パソコンに文章を入力することで、簡単に高品質な音声ファイルを作れるナレーション生成ソフトです。最新のDNN音声合成方式を採用しており、自然で滑らかな音声が特徴です。

また、プロジェクトファイルを保存できるので、作業をいつでも中断・再開したり、複数人で分担したりすることで、業務効率を高められます。

1年利用ライセンス(話者2名:えみり/ひでと) 528,000円/1ライセンス
無期限ライセンス(話者2名:えみり/ひでと) 880,000円/1ライセンス
話者追加 200,000円/1話者
AITalk Web読み職人
イメージ
引用元HP:株式会社エーアイ
https://www.ai-j.jp/products/cloud_reader/

AITalk Web読み職人は、ホームページのバリアフリー化を目的とし、ホームページの内容を理解できるように、内容を読み上げてくれるサービスです。

タグをウェブサイトに埋め込むだけで使えるクラウド型のサービスなので、運用に手間がかからず、手軽に導入できます。

※料金については直接お問い合わせください。

AITalk®の導入事例

音声対話
icon
フライト・空港情報案内アプリ

成田国際空港株式会社からリリースされた音声エージェントアプリ「成田コンシェルNariCo powered by しゃべってコンシェル」にAITalkが採用されました。NTTドコモとの共同開発で、アプリに話しかけるだけでフライト情報や駐車場情報など空港に関する情報がわかります。インフォメーションに問い合わせたり毎回ネットで検索しなくても、このアプリ1つで情報が受け取れるのが魅力です。

参照元:株式会社エーアイ公式HP(https://www.ai-j.jp/topics/1814/)

防災行政無線
icon
J-ALERT

地方自治体では、防災行政無線を放送した際の聞こえにくさが問題視されています。そこで、「AITalk 声の職人」で音声合成を作成して放送したところ、職員の負担が大幅に軽減されました。

参照元:株式会社エーアイ公式HP(https://www.ai-j.jp/client/voice4/)

道路・交通情報
icon
交通情報の電話アナウンス

財団法人日本道路交通情報センターが提供する全国道路交通情報の電話案内に、AITalkが採用されました。お客様からのお問い合わせ内容に応じて自動音声が専用オペレーターに引き継いでくれるので、オペレーター側の負担が大きく軽減されたようです。

参照元:株式会社エーアイ公式HP(https://www.ai-j.jp/topics/1854/)

ナビゲーション・PND
icon
音声の既存機器への連携

株式会社ユピテルの連携・拡張機能型高機能ポータブルナビ「YERAシリーズYPB706si」に、micro AITalkが採用されました。膨大な音声が必要なナビゲーションは、低コストで一定のクオリティが保てる音声合成がおすすめです。また、事前収録や設定ができない情報も、いちいち収録しなくても音声合成で代用できます。

参照元:株式会社エーアイ公式HP(https://www.ai-j.jp/topics/1849/)

スマートフォンアプリケーション
icon
記事読み上げアプリ

シャープビジネスコンピュータソフトウェア株式会社がリリースしたRSS読み上げアプリ「MyTalkStation」にAITalkが採用されました。ネットの様々な情報を好きな時間にお気に入りの音楽をかけながら好みの声で発信してくれるアプリです。登録したRSSフィートから自動的に記事を取り上げ読み上げてくれます。

参照元:株式会社エーアイ公式HP(https://www.ai-j.jp/topics/1841/)

観光案内・館内
・車内各種放送
icon
ケータイ観光案内ガイダンス

株式会社電通が担当した京都嵐山の観光ガイドの音声ガイダンス「おとたび」に、「AITalk International」が採用されています。年々増加する海外からの観光客がもっと嵐山の魅力を知ってもらうことを目的として、ケータイ・スマホから英語・中国語・韓国語の音声ガイダンスが流れるようにしました。このように、低コストで外国語ナレーションの作成が可能です。

参照元:株式会社エーアイ公式HP(https://www.ai-j.jp/topics/1852/)

電話自動応答システム
icon
コールセンター自動応答音声ガイダンス

株式会社朝日ネットの自社コールセンターの自動応答音声ガイダンスに、「AITalk 声の職人」が採用されました。今までは、社内メンバーの収録音声を自動音声にあてていましたが、人員確保の問題やノイズが入ることから音声合成を導入しています。「無声音操作により人間の声に近い音声が作成できて、誰でも簡単にガイダンス作成ができる」と喜ばれているようです。

参照元:株式会社エーアイ公式HP(https://www.ai-j.jp/topics/1731/)

ロボット
icon
ヒト型AIロボットの声

ATR 石黒浩特別研究所で開発されたロボット「ジェミノイド」「コドモロイド」「オトナロイド」の声を「AITalk SDK」と「AITalk Custom Voice 」が採用されました。今までは収録やその他作業に手間がかかっていましたが、即時に生声に近い音声合成ができるので負担が軽くなったようです。また、アンドロイドのモデルとなった人物が不在でも、本人に近い声で対話させることができるようになりました。

参照元:株式会社エーアイ公式HP(https://www.ai-j.jp/client/voice5/)

ゲーム
icon
ゲーム内相互会話機能

バンダイナムコゲームスからニンテンドー3DS・Androidで発売された「クマ・トモ」にAITalkが採用されました。「クマ・トモ」は、クマを可愛がりながらおしゃべりするうちに親友になれるゲームです。わざわざ収録しなくても、臨場感あるゲーム制作ができます。

参照元:株式会社エーアイ公式HP(https://www.ai-j.jp/topics/1790/)

e-Learning・教材
・マニュアル作成
icon
自社サイト内へのナレーション導入

カイゼンベース株式会社が運営する製造業・ものづくり企業向けコンサルサイト「カイゼンベース」のナレーションに、「AITalk 声の職人」が採用されています。今まではコンサルのナレーションの収録・編集に大幅なコストと時間を要していましたが、AITalkの導入で大幅に短縮できてコンテンツのクオリティが上がりました。

参照元:株式会社エーアイ公式HP(https://www.ai-j.jp/client/voice23/)

AITalk®の対応言語一覧

AITalk®の
対応言語
日本(18話者)、英語(24話者)、中国語(9話者)、韓国(4話者)、スペイン語(12話者)、ポルトガル語(6話者)、タイ語(2話者)、ベトナム(1話者)、インドネシア語(1話者)、ヒンディー語(2話者)、カンナダ語(1話者)、タミル語(1話者)、テルグ語(1話者)、ベンガル語(1話者)、ボージュプリー語(1話者)、マラーティー語(1話者)、マレー語(1話者)、アラビア語(4話者)、トルコ語(2話者)、ヘブライ語(1話者)、ペルシャ語(1話者)、イタリア語(4話者)、ウクライナ語(1話者)、オランダ語(2話者)、カタルーニャ語(2話者)、ギリシャ語(2話者)、クロアチア語(1話者)、スロバキア語(1話者)、スウェーデン語(2話者)、チェコ語(2話者)、デンマーク語(2話者)、ドイツ語(5話者)、ノルウェー語(2話者)、ハンガリー語(1話者)、フィンランド語(2話者)、フランス語(6話者)、フラマン語(1話者)、ブルガリア語(1話者)、ポーランド語(3話者)、ルーマニア語(1話者)、ロシア語(3話者)

AITalk®の会社の特徴

AITalkは、2018年に東京証券取引所マザーズ市場への株式上場を果たした、株式会社エーアイという会社が、開発・販売をしています。
導入実績は音声合成に特化した会社で1,200社以上。(※)
音声合成の提案から導入後のサポートまでの、柔軟なワンストップ対応が強みです。また、PCにインストールするだけで使用できるものや、機器に組み込むためのものなど、用途にあったさまざまな音声合成ソフトを取りそろえることで、それぞれが抱える課題の解決に一役買っています。

※参照元:エーアイ公式HP:https://www.ai-j.jp/202011lp/ 2022年3月時点。

エーアイのシリーズ製品紹介

PRODUCT-1

AITalk® Server

AITalk Serverは、電話の自動応答システムやWEBサービスの音声アナウンスに適した音声読み上げソフトです。ネットワークを介して音声合成を作成したい時にもおすすめ。

PRODUCT-2

AITalk® micro

AITalk micro は、スマートフォンやタブレット・ナビゲーションなどAndroid・IOSに対応した組み込み式の小型音声合成ソフトウェア開発キッドです。AIロボットやloT機器を中心に導入されています。

PRODUCT-3

AITalk international®

AITalk international は、41の国の言語の音声合成に対応したソフトです。主に、観光地の案内や館内放送、e-learningの教材に適しています。

PRODUCT-4

AITalk® CustomVoice®

AITalk CustomVoice は、有名人もしくは自分の声を収録して音声合成を作成できるサービスです。おもに、ゲームやVtuberのアテレコに適しています。

PRODUCT-5

AITalk WebAPI

AITalk WebAPI は、AITalkをSaaS型で利用できるサービスです。スマホアプリやWEBサービス等で手軽に音声合成を組み込めます。

PRODUCT-6

AITalk Web読み職人

ホームページの内容を理解できるように、内容を読み上げてくれるサービスです。ホームページのバリアフリー化を目的としています。

AITalk®の会社概要

所在地 東京都文京区西片1-15-15 KDX春日ビル10F 設立 2003年
公式URL https://www.ai-j.jp/ 電話番号 03-6801-8461
芸能人の声を使った音声合成をしたい

コエステーション
(コエステ株式会社)

コエステーション(コエステ株式会社)HP

引用元:コエステ株式会社公式HP(https://coestation.jp/)

コエステーションのおすすめポイント

多様性に富んだ
有名人や一般人の
魅力的な声の数

コエステーションでは、テレビやラジオで活躍しているタレントや俳優など人気著名人の声を40以上用意。音楽事業をメインとする企業(avex)が開発に携わっている事から、幅広いジャンルの有名人の声を取り扱っています。
一般ユーザーの声の取り扱いも豊富で、約9万以上のデータが蓄積されています。声の種類の多さで選ぶならおすすめできる音声合成ソフトです。

気軽にさくさく音声合成可能な
スマホアプリ版

コエステーションは手軽に使えるスマホアプリ版もリリースしています。場所や時間を問わず手軽に、抑揚やトーンといった声の自由自在な編集や、作成した声を付けてのSNS投稿も、スマホ1つで可能です。
また、第三者に自分の作成した声をシェアすることもできるので、声を確認してもらう必要がある場合に便利です。

わかりやすい
シンプルかつ明朗な
追加料金プラン

コエステーションは明朗会計で、日本語1声追加ごとと、外国語1声追加ごととで各追加料金が設定されています。さらに有名人・一般ユーザーの声の使用を希望する場合には見積もりが必要です。 
法人向け以外にもスマホアプリ版の展開もあり、こちらは無料でダウンロードできます。
法人向けプランとの併用でがっつり音声合成ソフトを使いたい方には、ぴったりです。

コエステーションの主な機能一覧

  • 自由文音声
    自由文音声

    自由文音声とは、
    テキスト記入欄に入力した文章を音声化したものです。このため、テキスト入力できる文言であればどんなものでも音声化が可能です。

  • 単語登録
    単語登録

    単語登録とは、
    専門用語や難しい単語もしくは定型文を登録して、音声合成を作成しやすくすることです。

  • 話速変換
    話速変換

    話速変換は、
    発声のスピードを変えることで、単語と単語や文節と文節の間に空白を作ったり、間を詰めたりできます。話速変換によって、より聞き手に伝わりやすい音声の生成が可能です。

  • 感情表現
    感情表現

    感情表現は、
    喜怒哀楽を調整できる機能です。声の高低や抑揚、話すスピードなどいくつかの要素を組み合わせることでこれを実現しています。

  • イントネーション調整
    イントネーション調整

    イントネーション調整とは、
    単語や文章ごとにイントネーションの強弱を設定できることです。メーカーや製品ごとに強弱できる段階が異なる場合があります。

  • 音高調整
    音高調整

    音高調整は、
    単語や文章ごとに声の高低を設定できます。メーカーや製品ごとに強弱できる段階が異なる場合があります。

▲サポート項目にマウスオンすると説明が表示されます

▲サポート項目をタップすると説明が表示されます

コエステーションの製品一覧

コエステーション エディター(法人向け)
イメージ
引用元HP:コエステーション
https://coestation.jp/business/editor/

WEBブラウザ上でテキストを入力するだけで、感情表現の割合や声色の調整など細かく調整をすることができます。

文字数制限もなく、日本語・英語・北京語・韓国語から選ぶことができ、プランに加えて用途に応じたオプションも検討できます。初月は無料でお試しが可能です。

スタンダードプラン 日本語男女各1コエ(ツトム、アサギ)付き 55,000円/月(税込)
オールインプラン 日本語全14コエ付き 165,000円/月(税込)
オプション:コエ追加 日本語標準コエ
外国語標準コエ
33,000円/コエ/月(税込)
55,000円/コエ/月(税込)
スマホアプリコエステーション(個人向け)
イメージ
引用元HP:コエステーション
https://coestation.jp/consumer/coestationapp/

スマホアプリを使い、自分の声の分身「コエ」を生成し、テキスト入力するとその「コエ」で音声合成を出力することができます。事前に自分の声を録音すればするほど、より本人に近い「コエ」を生成することが可能です。

自分の声をデジタル化することで、SNSへの音声投稿や動画制作など、これまでになかった新しいコミュニケーションを楽しめます。

※無料で利用できます。
CoeAvatar(コエアバター)(個人向け)

CoeAvatarは入力したテキストをキャラクターの合成音声で読み上げます。ユーザー言語辞書を用いてアクセントや語句の読みを登録することで、音声合成で懸念される固有名詞や専門用語などの特殊な単語の読み間違いを防げます。

声色の調整も細かく調整でき、イメージの話し方により近づけることも可能です。

5,980円(税込み)/2年
  • ※2025/09/10現在、販売休止中です

コエステーションの導入事例

音声対話
icon
美術館や博物館の音声ガイド

株式会社The Chain Museumがリリースしたアート・コミュニケーションプラットフォーム「ArtSticker」の音声ガイドを、コエステーションが担当しています。スマホアプリで美術館や博物館の様子を音声ガイドで聴けるコンテンツです。

参照元:コエステ株式会社公式HP(https://coestation.jp/news/detail.php?id=1084930)

防災行政無線
icon
家庭用ガス警報機一体型の音声アナウンス

大阪ガス株式会社の家庭用ガス警報器「スマぴこ」は、インターネット接続機能付きなので、地域の災害情報や防犯情報をコエステの音声でお知らせしてくれます。ただガス漏れを検知するだけではない、ワンランク上の警報器が誕生しました。

参照元:コエステ株式会社公式HP(https://coestation.jp/business/case/)

スマートフォンアプリケーション
icon
ラジオアプリ

朝日新聞社とコエステが連携し、複数の有名人の声で朝日新聞のニュースを読み上げる実証実験を、音声コンテンツアプリ「ラジオクラウド」朝日新聞チャンネル内やYouTubeチャンネル内で実施しました。

参照元:コエステ株式会社公式HP(https://coestation.jp/business/case/)

観光案内・館内
・車内各種放送
icon
大型パチンコ店店内アナウンス

株式会社マルハンの店内アナウンスがコエステーションで作成された音声に変更しています。今まではスタッフがマイクを使ってアナウンスをおこなっていましたが、音声合成に変えたことで業務効率が上がり、さらに接客業務に注力できるようになりました。

参照元:コエステ株式会社公式HP(https://coestation.jp/business/case/)

電話自動応答システム
icon
IVRまでスムーズな電話応答の音声

モビルス株式会社がリリースしたAI電話自動応答システム「MOBI VOICE」にコエステーションが採用されました。一次受付からIVRの自動音声対応まで簡単に実施できます。わずか5分で公開可能なので、手軽にすぐ始められるのが特徴です。

参照元:コエステ株式会社公式HP(https://coestation.jp/business/case/)

e-Learning・教材
・マニュアル作成
icon
社内・パートナー企業向けe-learning

JCOM株式会社の社内・関連会社への教育コンテンツでコエステーションが採用されています。多彩な音声を使用したことで、より充実したコンテンツができあがりました。

参照元:コエステ株式会社公式HP(https://coestation.jp/business/case/)

コエステーションの
対応言語一覧

コエステーションの対応言語 日本語(10話者)、アメリカ英語(8話者)、イギリス英語(2話者)、スペイン語(2話者)、フランス語(2話者)、北京語(3話者)、広東語(1話者)、韓国語(2話者)

コエステーションの会社の特徴

コエステーションの運営会社「コエステ株式会社」は、avex(エイベックス)と東芝デジタルソリューションズが共同で設立した音声合成専門の会社です。
テレビやラジオで活躍する女優やお笑い芸人など、一度でも耳にしたことがあるような有名人の声を利用できるという特徴があります。
また、avex所属アーティストたちも利用するスタジオで、品質の良い音源の収録に特化した、個人向けサービスがあるのも特徴です。成長や持病などでどうしても移り変わりを避けられないこともある「声」を、当時の記憶とともにそのまま保存し、「コエ」として再現することができます。

コエステのシリーズ製品紹介

PRODUCT-1

コエステーション エディター

コエステーションエディターは、 WEBブラウザでテキスト入力しただけで、感情表現の割合や声色の調整まで細かく音声合成が作成できます。初月は無料でお試しが可能です。

PRODUCT-2

Web API

WebAPIは、チャットポットや天気予報の読み上げなど、あらかじめ音声の使いまわしができない場合におすすめです。あらかじめ設定しておけば、自動音声処理されリアルタイムに作成されます。

コエステーションの会社概要

所在地 東京都港区三田1-4-1 住友不動産麻布十番ビル 設立 2020年
公式URL https://coestation.jp/ 電話番号 公式サイトに記載なし
外国語をメインに音声合成をしたい

ReadSpeaker(HOYA株式会社)

ReadSpeaker(HOYA株式会社)HP

引用元:ReadSpeaker公式HP(https://readspeaker.jp/)

ReadSpeakerのおすすめポイント

初めての利用でも
シンプルでわかりやすい
快適な操作性

ReadSpeakerは、新式の機械学習技術「ディープラーニング」の導入により、さらに人間らしい感情表現が再現できるようになるとともに、複雑すぎない快適な操作性を実現させました。そのため、スマホやロボットなど、さまざまな用途の複数の機器への音声合成を検討されている方にはおすすめです。

アクセントや語尾の上げ下げも可能な
外国語話者の豊富さ

ReadSpeakerでは、20以上の言語に対応しているので、外国語メインの音声合成を検討している人にもおすすめです。
日本で10話者・英語で9話者、スペイン語とポルトガル語で4話者ずついます。アジアやオセアニア・北米や中南米、さらには欧州まで幅広い言語を取り扱っているのが特徴です。公式HPから全話者のサンプルボイスが視聴できます。

既存の話者以外で
差別化が図れる
オリジナルボイス

ReadSpeakerは、既存の話者以外の声で音声合成を作成したい人向けには、オリジナルボイスの案内をおこなっています。自分で選んだナレーターを1・2回程度の短い収録時間で、声の特徴を活かした音声合成が作れるのが特徴です。
既存話者との差別化を図れるだけでなく、毎回ナレーターを呼ぶ必要がなくなり、人件費や作業量を大幅に削減できます。

ReadSpeakerの主な機能一覧

  • 自由文音声
    自由文音声

    自由文音声とは、
    テキスト記入欄に入力した文章を音声化したものです。このため、テキスト入力できる文言であればどんなものでも音声化が可能です。

  • 単語登録
    単語登録

    単語登録とは、
    専門用語や難しい単語もしくは定型文を登録して、音声合成を作成しやすくすることです。

  • 話速変換
    話速変換

    話速変換は、
    発声のスピードを変えることで、単語と単語や文節と文節の間に空白を作ったり、間を詰めたりできます。話速変換によって、より聞き手に伝わりやすい音声の生成が可能です。 

  • 感情表現
    感情表現

    感情表現は、
    喜怒哀楽を調整できる機能です。声の高低や抑揚、話すスピードなどいくつかの要素を組み合わせることでこれを実現しています。 

  • イントネーション調整
    イントネーション調整

    イントネーション調整とは、
    単語や文章ごとにイントネーションの強弱を設定できることです。メーカーや製品ごとに強弱できる段階が異なる場合があります。

  • 音高調整
    音高調整

    音高調整は、
    単語や文章ごとに声の高低を設定できます。メーカーや製品ごとに強弱できる段階が異なる場合があります。

▲サポート項目にマウスオンすると説明が表示されます

▲サポート項目をタップすると説明が表示されます

ReadSpeakerの製品一覧

speechMaker Desktop
イメージ
引用元HP:ReadSpeaker
https://readspeaker.jp/products/speechmaker/

テキスト入力するだけで音声合成が作成できるPC用のソフトウェアです。様々な感情を44言語で表現できます。

この製品一つで基本的な音声合成をすべて賄えるので、新しい音声ソリューションの導入や、品質向上・コスト削減のためのナレーターからの切り替えを検討している方に適しています。

※料金については直接お問い合わせください。
webReader

webReaderは、インストール不要のクラウド型音声ソリューションです。サイトに設置された読み上げボタンをクリックするだけで、ページ内のテキストを音声で再生できます。

主要なブラウザやOSに幅広く対応しているため、利用環境を選びません。また、クラウドで提供されるため、面倒な保守や運用作業も一切不要です。

※料金については直接お問い合わせください。
ORIGINAL VOICE

ORIGINAL VOICEは、ユーザーが選んだナレーターの声を録音し、その音声をベースにしたオリジナルの音声合成データを作成するサービスです。

ヒアリングから声優の選定、収録まで、お客様の理想とする声を実現するためのサポート体制も充実しています。既存の音声に満足できない方や、独自性のある音声合成を求めている方に適切なサービスです。

※料金については直接お問い合わせください。
GlobalvoiceEnglish5
イメージ
引用元HP:ReadSpeaker
https://readspeaker.jp/wp_cms/wp-content/themes/readspeaker-theme_250917/files/pdf/GVE5.pdf

英文テキストを入力するだけでネイティブに近い英語音声を生成します。アメリカ英語に加え、和訳やガイダンス用の日本語を搭載。

さらに、オプションでイギリス英語も追加可能です。文書・対話モードの切り替えや、読み上げスピードの設定もできるため、英語学習者のスキルや用途に応じて活用いただけます。

BASIC 標準版(米国語3+日本語3)
※オプション(イギリスBridget)付
¥77,000
¥101,750
PRO 標準版(米国語3+日本語3)
※オプション(イギリスBridget)付
¥132,000
¥162,250

ReadSpeakerの導入事例

音声対話
icon
車載向けスマートスピーカーの声

Spotifyがアメリカ限定でリリースしている車載向けスマートスピーカー「Car Thing」にオリジナルボイスを用いたReadSpeakerが採用されました。Car Thingの使用で運転しながら簡単にお気に入りの音楽を流せます。

参照元:ReadSpeaker公式HP(https://readspeaker.jp/news/articles/casestudy_20210921-01_Spotify.html)

防災行政無線
icon
地方自治体災害情報システム

宮城県色麻町が提供する災害情報システム「色麻町地域 WiMAX ネットワーク」にReadSpeakerが連携されたことで、お年寄りや目が不自由な方にも正確な情報がすばやく提供できるようになりました。高品質な音色へ導くReadSpeakerの音声合成は、聞き取りやすさがアップします。

参照元:ReadSpeaker公式HP(https://readspeaker.jp/news/articles/casestudy20150312_shikamachou.html)

道路・交通情報
icon
列車内アナウンス

JR九州では、ReadSpeakerを搭載した列車内自動放送アプリが筑肥線の一部列車で使用されています。今まで、ワンマン電車では車両内に設置された専用機器を手動で操作しながら自動放送をおこなっていましたが、更なるサービス向上と内容変更によるコストの軽減のために開発されました。

参照元:ReadSpeaker公式HP(https://readspeaker.jp/news/articles/casestudy20210311_JR-Kyushu.html)

ナビゲーション・PND
icon
サイト内ナビゲーション音声

東京観光財団「GO TOKYO」の公式ホームページでは、トップページの音量ボタンをクリックするだけで、webReader機能を使った音声ナビゲーションが流れます。WEBサイトのバリアフリー化を目的として、年々音声の読み上げ機能を取り入れるサイトが増えていますよ。

参照元:ReadSpeaker公式HP(https://readspeaker.jp/case/web-reading/tourism.html)

スマートフォンアプリケーション
icon
APIマーケットプレイス内多言語読み上げ

KDDI株式会社がリリースした「KDDI IoTクラウド API Market」で、ReadSpeakerを提供しました。「KDDI IoTクラウド API Market」は、新しいサービスを開発したい企業と提供したい企業をマッチングさせるマーケットプライスで、4言語21話者の音声合成(一部感情表現機能あり)を提供しています。

参照元:ReadSpeaker公式HP(https://readspeaker.jp/news/articles/casestudy20180201_kddi.html)

ロボット
icon
教育機関開発ロボットの声

香川高専 機械システム研究部では、毎年開催される高専ロボコンで披露したロボットにWebAPIを導入しました。数行のプログラムコードを書き込むだけですぐ音声合成機能を追加できるので、今回のようにロボットを制作しながら自分たちで音声合成を作成できます。

参照元:ReadSpeaker公式HP(https://readspeaker.jp/news/articles/casestudy_20211025_NIT-Kagawa.html)

e-Learning・教材
・マニュアル作成
icon
テレビCM音声

株式会社ヤナセのTVCMにspeechMaker Desktopの音声合成が流れました。音声合成を利用することで、録音時のリテイクや雑音を気にすることなく、クオリティが高い音声を誰でも簡単に作成できます。

参照元:ReadSpeaker公式HP(https://readspeaker.jp/news/articles/casestudy20210628_Yanase.html)

ReadSpeakerの対応言語一覧

ReadSpeaker
の対応言語
日本語(10話者)、中国語(3話者)、広東語(2話者)、韓国語(2話者)、タイ語(2話者)、英語(9話者)、インドネシア語(2話者)、フランス語(2話者)、スペイン語(4話者)、ポルトガル語(4話者)、ドイツ語(2話者)、イタリア語(2話者)、フランス語(2話者)、スウェーデン語(2話者)、オランダ語(2話者)、ロシア語(2話者)、ノルウェー語(1話者)、ルーマニア語(2話者)、スロバキア語(2話者)

ReadSpeakerの会社の特徴

ReadSpeakerは、元々スウェーデンで設立された音声提供ASPサービス企業の代理店で、2017年にHOYA株式会社が買収した「リードスピーカー・ジャパン株式会社」が運営しています。現在は、HOYA株式会社MD部門 ReadSpeakerを併設しています。
グローバルな音声合成を強みとしており、外国語話者において、アクセントや語尾の上げ下げまでをも調整できるのが特徴です。
福祉先進国生まれであることから、身心機能に制約のある人でも利用しやすい情報機器社会を目指し、音声合成ソフトの普及に力を入れているようです。

HOYAのシリーズ製品紹介

PRODUCT-1

speechMaker Desktop

speechMaker Desktopは、テキスト入力するだけで音声合成が作成できるPC用のソフトウェアです。基本的な音声合成はこの製品1つですべて賄えます。

PRODUCT-2

speechEngine SDK

speechEngine SDK は、ReadSpeakerをネットワークから切り離された状態で使用できる音声合成ソフトウェア開発キッドです。20言語以上に対応した話者が揃っています。

PRODUCT-3

speechServer

speechServer は、ReadSpeakerをサーバーシステム上で利用できるソフトウェア開発キットです。主に、電話応答システムもしくはプラットフォームの構築に適した製品です。

PRODUCT-4

オリジナルボイス

オリジナルボイスは、お客様自身でナレーターを選定後、収録した声をベースに音声合成を作成します。既成の声以外でどうしても音声合成を作りたい人におすすめです。

PRODUCT-5

WebAPI

WebAPI は、アプロやWEBサービスの開発時にプログラムコードを追加するだけで、音声合成機能が搭載できる開発者向けのWEBサービスです。わざわざ別口で作らなくても、開発者自身ですぐ音声合成が作成できます。

PRODUCT-6

webReader

webReader は、ワンクリックで表示ページのテキストを読み上げてくれるサービスです。ソフト等のインストールは不要で、数行のコードを打ち込むだけでプログラミングできます。

PRODUCT-7

docReader

docReaderとは、WEB上に表示されたドキュメントを読み上げるサービスのことです。PDFやWordなど文字が小さく読みづらさを感じた時に使えます。

PRODUCT-8

SpeechPanel

SpeechPanel は、TOPページにリンクを貼るだけでWEBサイトやPDFの文字を自動的に読み上げてくれるサービスです。サイト全体のバリアフリー化を意識したい時に適しています。

PRODUCT-9

Globalvoiceシリーズ

Globalvoiceシリーズは、英語の文章を読み上げる「GlobalvoiceEnglish3」と英語の発音を矯正する「GlobalvoiceCALL」の2種類展開しています。アメリカ英語(3話者)とオプション販売でイギリス英語(1話者)も追加可能です。

ReadSpeakerの会社概要

所在地 東京都新宿区西新宿3-7-1 新宿パークタワー35 階 設立 2006年
公式URL https://readspeaker.jp/ 電話番号 03-6479-7182

【無料版あり】製品一覧

有料版と比較した無料版の特徴

音読さん(COMOMO)

音読さんは、WEBの専用エディターから会員登録なしで音声合成が作成できるサービスです。

文字数
5,000文字まで
日本語対応
保存
公式URL
https://ondoku3.com/ja/

VOICEVOX(ヒホ)

現役エンジニアが個人で運営するVOICEVOXは、無料で音声合成が作成できます。商用利用もOKです。

文字数
なし
日本語対応
保存
公式URL
https://voicevox.hiroshiba.jp/

棒読みちゃん
(フリーウェア開発者 みちあき氏)

棒読みちゃんはパソコン上に表示されたテキストを取り込み、合成音声で読み上げるフリーソフトです。8種類の声質を標準搭載しており、自由に切り替えられます。無料ながらも対応プラグインが豊富なのが大きな特徴です。

文字数
なし
日本語対応
保存
公式URL
http://chi.usamimi.info/

テキストーク
(Wity有限会社)

テキストークは、Wity有限会社が提供している音声合成ソフト。男性・女性の2通りの声質を自由に切り替えて、文章を読み上げられます。現在読み上げている個所をすぐに見つけられる「読み上げ箇所強調表示機能」が標準搭載されているのがポイントです。

文字数
明記なし
日本語対応
保存
公式URL
https://www.wity.jp/

CoeFont
(株式会社CoeFont)

CoeFontは、月額500円から音声合成が作成できるサービスで、3000種類以上の声から自由に選択できます。

文字数
800文字まで
日本語対応
保存
1ファイルまで
公式URL
https://coefont.cloud/
もっと見る

【有料版】製品一覧

無料版と比較した有料版の特徴

AITalk®(エーアイ)

AITalkは、先端技術の深層学習(ディープラーニング)を導入したDNN音声合成方式によって、自然な喜怒哀楽が再現できます。

おすすめプラン
クラウド版 50,000文字プラン:50,000円/月
商用利用
トライアル
公式URL
https://www.ai-j.jp/company/

ReadSpeaker
(HOYA株式会社)

ReadSpeaker は、20以上の言語に対応しているので、外国語の音声合成を検討している人におすすめです。

おすすめプラン
個別見積
商用利用
トライアル
公式URL
https://readspeaker.jp/

コエステーション
(コエステ株式会社)

コエステーションは、40以上の有名人と9万以上の一般人の声を自由に音声合成できるのが特徴です。

おすすめプラン
エディター 標準プラン:55,000円/月
商用利用
トライアル

(商用利用についてのお問い合わせフォームあり)
公式URL
https://coestation.jp/

美音工房® 奏®
(日立産業制御ソリューションズ)

美音工房 奏は、日立製作所中央研究所が開発した「セレクティブ重畳型音声合成方式」によって、アナウンサーが話しているかのようなリアルな音声が再現できます。

おすすめプラン
美音工房 奏:418,000円
商用利用
×
トライアル
不明
公式URL
https://www.hitachi-ics.co.jp/

FutureVoice Crayon
(NTTテクノクロス)

FutureVoice Crayon は、NTTが蓄積した音パターンを活用しているので、人間らしい滑らかな音声が提供できます。

おすすめプラン
個別見積
商用利用
×
トライアル
公式URL
https://www.ntt-tx.co.jp/

音声合成 mimi® TTS
(Fairy Devices)

音声合成 mimi TTSは、NICT(国立研究開発法人情報通信研究機構)の音声合成エンジンを使用した音声合成ソフトです。

おすすめプラン
個別見積
商用利用
トライアル
公式URL
https://fairydevices.jp/

VoiceOperator音声合成(NEC)

VoiceOperator音声合成は、NEC中央研究所が研究した「自然言語処理技術」で、日本語の誤読を最小限に抑えてくれるのがポイントです。

おすすめプラン
個別見積
商用利用
×
トライアル
公式URL
https://jpn.nec.com/

SpeeCAN®(Arcadia)

SpeeCANは、自社で開発した複数の音声ツールを1つにまとめた音声合成ソフトです。声を使ったアプリが開発できるツールから簡易包装ができるツールまで、便利な機能が揃っています。

おすすめプラン
SpeeCAN 6 パッケージ版:550,000円
商用利用
×
トライアル
公式URL
https://www.arcadia.co.jp/

ボイスソムリエネオ
(日立ソリューションズ・クリエイト)

大手電機メーカー日立が開発したイスソムリエネオは、肉声に近い滑らかな音声を演出します。

おすすめプラン
ビジネスユース4モデル:547,800円
商用利用
×
トライアル
公式URL
https://www.hitachi-solutions-create.co.jp/

テクノスピーチ
(株式会社テクノスピーチ)

テクノスピーチは、名古屋工業大学を中心に開発された音声合成ソフトです。統計的パラメトリック音声合成の採用で、従来の音声合成より自然な音色を演出します。

おすすめプラン
要問合せ
商用利用
トライアル
公式URL
https://www.techno-speech.com/

AquesTalk
(株式会社アクエスト)

AquesTalkは小型・軽量・組み込みが容易という3つにこだわって研究・開発されました。明瞭な音声合成が可能です。

おすすめプラン
商用コンテンツ向け:6,380円/年
商用利用
トライアル
公式URL
https://www.a-quest.com/index.html

VOICEPEAKk
(株式会社AHS)

VOICEPEAKは、株式会社AHSが販売している入力文字読み上げソフトです。商用可能で6ナレーター+幼い女の子も声も収録されています。感情表現や辞書登録、イントネーション調整や音声保存なども可能です。

おすすめプラン
Synthesizer V Studio 2 Pro(パッケージ版):16,500円
商用利用
トライアル
公式URL
https://www.ah-soft.com/

FineSpeech
(株式会社アニモ)

FineSpeechは株式会社アニモが提供している音声合成システムです。品質の高さはもちろん、聞き取りやすさにもこだわっているのが特徴です。幅広い用途に合わせたプログラム・豊富なオプションライブラリがあり、多くの場面で活用されています。

おすすめプラン
要問い合わせ
商用利用
×
トライアル
公式URL
https://www.animo.co.jp

AI suite
(NTTレゾナント株式会社)

AI suiteは、AIに関連する実に多くの機能が用意されています。目的に合わせて必要なシステムを組み合わせることにより、スピーディーにAIサービスを構築できるのが特徴です。急ぎ導入したいような場合でも適しています。

おすすめプラン
要問い合わせ
商用利用
×
トライアル
公式URL
https://www.nttr.co.jp/

ドキュメントトーカ Plus
(クリエートシステム開発株式会社)

ドキュメントトーカ Plusはシンプルでわかりやすく、操作性に優れています。C言語で作成されたアプリケーションであることから非常に軽いので、重いシステムを導入できないケースにもおすすめです。制限はありますが、フリーソフト版も利用可能です。

おすすめプラン
日本語音声合成ライブラリ:10,780円
商用利用
トライアル
不明
公式URL
https://www.createsystem.co.jp/main/index.html

音声合成SDK
(株式会社日立ケーイーシステムズ)

音声合成SDKでは、漢字かな混じりのテキストデータを音声に変換できます。滑らかで肉厚感が高い音声が特徴的です。抑揚も自然で、読み上げ機能に優れています。同表記異読文字の読み分け機能も精度が高く、利用しやすいです。

おすすめプラン
要問い合わせ
商用利用
×
トライアル
△(システム開発向け提供されている)
公式URL
https://www.hitachi.co.jp/

Amazon Polly
(AWSジャパン株式会社)

Amazon Pollyは、通販サービスで有名なAmazonにより提供されている音声合成ソフトです。何十種類ものリアルな音声を多数の言語でサポートしており、より自然で人間的な声で文章を読み上げられます。

おすすめプラン
標準音声100万文字あたり:4.00/USD
商用利用
トライアル
公式URL
https://aws.amazon.com/jp/?nc2=h_lg

Ruby Talk
(日立ソリューションズ・テクノロジー)

LINE AiCallは女性・男性・子どもそれぞれの音声で読み上げを行う音声合成ミドルウェアです。DNNを導入し、安定的な韻律の読み上げが可能。カーナビゲーション専用音声やアナウンスなど用途に応じた読み上げに対応しています。

おすすめプラン
要問い合わせ
商用利用
×
トライアル
公式URL
https://www.hitachi-solutions-tech.co.jp/

LINE AiCall
(LINE CLOVA)

LINE AiCallはLINE株式会社が開発したAIアシスタント・LINE CLOVAが搭載されたボイスボットです。シニア顧客にも聞き取りやすい音声合成で、コールセンターの業務負荷を軽減。有人対応とのハイブリッド化も可能になります。

おすすめプラン
要問い合わせ
商用利用
トライアル
公式URL
https://clova.line.me/line-aicall/

音読のプロ

音読のプロは、テキストを入力するだけで読み上げを行ってくれるソフトです。男性声と女性声が用意されており、wav形式で音声が保存できる機能も搭載。扱いやすい、シンプルな使い勝手が特徴です。

おすすめプラン
音読のプロ2,178円
商用利用
×
トライアル
不明
公式URL
https://www.sourcenext.com/product/pc/use/pc_use_002052/

WorldVoice 日中英韓2(高電社)

WorldVoice 日中英韓2(高電社)はまるでネイティブが話しているかのような自然な発音で、音声合成を行うソフトです。日本語・英語・中国語・韓国語の4か国語に対応しています。

おすすめプラン
WorldVoice 日本語2(ダウンロード版)8,800円
商用利用
×
トライアル
不明
公式URL
https://www.kodensha.jp/index/

COEIROINK

COEIROINKはオリジナル二次元キャラクターに、6種類のキャラクターの声を与えられる音声合成ソフトです。二次創作にも無償で利用でき、コードを利用したオリジナルの音声開発にも対応しています。

おすすめプラン
要問い合わせ
商用利用
トライアル
公式URL
https://coeiroink.com

Narakeet

Narakeetはブラウザ上からテキストを入力して音声合成ができるソフトです。PowerPointのファイルをアップロードすれば、スライドをナレーション付きのビデオにすることもできます。

おすすめプラン
30分/6ドル
商用利用
トライアル
公式URL
https://www.narakeet.com

ToSpeak(東芝デジタルソリューションズ)

ToSpeakはゲームやアプリケーションに組み入れることができる多言語対応型の音声合成ミドルウェアです。スタンドアロンで滑らかに発話し、自社の商品に「発話をする機能」を付加できます。

おすすめプラン
要問い合わせ
商用利用
トライアル
公式URL
https://www.global.toshiba/jp/company/digitalsolution.html

A.I.VOICE GUMI(株式会社インターネット)

A.I.VOICE GUMIは株式会社インターネットが提供する音声作成ソフトです。声優の中島 愛さんの声をベースにしており、ボイスフュージョン機能や管理機能が加わり、さらに使いやすくスムーズな音声合成が可能になりました。

おすすめプラン
A.I.VOICE GUMI(パッケージ版):16,280円
商用利用
×
トライアル
公式URL
公式URL:https://www.ssw.co.jp/

Dojo(株式会社テンダ)

Dojoは株式会社テンダが提供する自動マニュアル作成ツールです。マニュアルの作成に特化しているため、テキスト入力後の音声変換や操作説明文の自動作成など、一定品質のマニュアルが作成できる機能が豊富に搭載されています。

おすすめプラン
要問い合わせ
商用利用
トライアル
公式URL
https://www.tenda.co.jp/

Watson Text to Speech(IBM)

IBMによって提供されているWatson Text to Speechは、テキストをさまざまな言語の自然な響きの音声に変換してくれるAPIクラウド・サービスで、海外の顧客にも母国語で対応することができ、カスタマーサービスの状況改善に役立てることができます。

おすすめプラン
Standard1,000文字あたり:0.02 USD〜
商用利用
トライアル
不明
公式URL
https://www.ibm.com/

Inspirium 音声合成ライブラリ V3.0(富士通株式会社)

Inspirium 音声合成ライブラリ V3.0は富士通株式会社が開発した音声合成ライブラリで、日本語特有の漢字かな混じり文を自然な音声で読み上げてくれます。さまざまな機器に搭載可能で、日常のいろいろな場面で活用することができます。

おすすめプラン
要問い合わせ
商用利用
×
トライアル
公式URL
https://www.fujitsu.com/jp/

Voice Track Maker
(東芝デジタルソリューションズ)

Voice Track Maker は、韻律射影機能搭載で演技表現も可能になりました。Vtuberのような動くキャラクターのアテレコにおすすめです。

おすすめプラン
スタンダードプラン:55,000円/月
商用利用
×
トライアル
公式URL
https://voicetrackmaker.bp.recaius.jp/

音声合成ソフトについて

音声合成ソフトとは、入力されたテキストや任意のテキストファイルを元に、人工的に音声を生成するソフトのことです。合成音声をつくる技術としてはさまざまな技法が存在します。あらかじめ収録された音声データから入力された文字を呼び出し、それらを繋げて音声を作成する方法が代表的でしたが、人工知能を活用し、より自然でなめらかな音声を短時間で生成する方法も一般化しつつあります。
音声合成ソフトや音声読み上げソフト導入で、業務効率改善に繋がった例もあります。

音声合成ソフトを導入するメリット

人件費削減

人件費削減のイメージ

音声合成ソフトの導入をすることで、ナレーターの手配や収録スタジオの手配などに係る人件費などのコストを削減できます。また、最少人数で音声データの作成や発信まで行うことが可能になります。

業務効率化

業務効率化のイメージ

音声合成ソフトを導入することで、これまでナレーターや収録スタジオの日程調整にかかっていた負担を削減できるだけでなく、都度、人の生身の声で対応していたところをまるっと音声データが取って代わることもできます。また、収録データの不備などによる再収録などの戻り作業もなくなることで、業務の効率化が可能です。

品質の向上

品質の向上のイメージ

音声合成ソフトの導入によって、読み間違い・アクセント・文脈のつながりなどを簡単に調整することができ、聞き取りやすい音声を作成できます。自社製品や社内向け研修資料といった、音声合成を組み込んだものの品質の向上が期待できるでしょう。

事業の幅が広がる

事業の幅が広がるのイメージ

音声合成技術を活用すれば、展示会などのイベントや製品のPR動画、YouTubeや動画アプリの広告、eラーニング、コールセンター、美術館や駅の施設案内など、さまざまな業種・業界で活用できます。

音声合成・音声認識・音声読み上げの違いは?

音声合成

音声合成とは、テキストに対応する音声を自動で生成する技術のことです。
録音編集方式と規則合成方式(TTS…Text to Speech)という方式の2種類が普及していますが、録音編集方式は生成できる音声に制限が多いという特徴があります。
文章を音声化し、情報提供・発信したい場合に利用できます。

音声認識

音声認識とは、音声からテキストデータに変換する技術のことです。コンピューターが音声を解析し、テキスト化していきます。
人と会話ができるロボットに組み込まれるなど、音声認識は、音声合成技術と併せて利用されるシーンが多いです。

音声読み上げ

テキスト読み上げとは、音声合成技術を使い、テキストを音声で出力する技術のことです。
そのためテキスト読み上げも、音声合成技術と併せて利用されるシーンが多いです。
保存した音素から単語を作成して音声出力を行いますが、出力する音声の質を高めるために、単語やフレーズ全体を保存しておくこともあります。

【PR】※音声あり※
音声合成ソフトの品質を
確かめてみた

音声合成ソフトPRイメージ
音声合成ソフトの「声」は
機械的で不自然?

近年需要が高まり、多くの製品が登場している「音声合成ソフト」。その品質は日々刻々と進化しています。「機械っぽい」「違和感がある」など、人工的な不自然さが残るイメージも未だあるようですが、現在における音声合成の仕上がりは、人が本当に話しているかのような水準に近付きつつあります。
この記事では、ディープラーニングの活用で、従来より自然で滑らかな音声を可能にした音声合成ソフトを実際に利用し、その特徴や使い方についてまとめています。設立以降改良を重ねたソフトの導入実績が1,200社以上※を誇る会社を取り上げておりますので、興味がある人はぜひチェックしてみてください。

参照元:エーアイ公式HP:https://www.ai-j.jp/202011lp/ 2022年3月時点。

音声対話

音声対話イメージ

音声対話システムに、音声合成ソフト・エンジンを採用している企業が増えています。ここでは、音声対話システムに音声合成ソフト・エンジンを活用している企業の事例を紹介しています。

防災行政無線

防災行政無線イメージ

防災行政無声を活用し、市民すべての住民へ防災情報を伝達している自治体では、音声合成ソフトを活用して、スピードやイントネーションを再現し、聞き取りやすい音声を作成し正確な情報を発信しています。

道路・交通情報

道路・交通情報イメージ

道路・交通情報のサービスを提供している財団法人日本道路交通センターでは、音声合成ソフトを活用して、電話による全国の交通情報をリアルタイムに提供をしています。そのほか船の運航状況や観光案内に音声合成ソフトを活用している企業を紹介しています。

ナビゲーション・PND

ナビゲーション・PNDイメージ

カーナビの音声データに、音声合成ソフトやエンジンを活用して、自然な聞き取りやすい音声でドライバーのナビゲーションの向上に実現している企業は少なくありません。また、ドライバーとの対話を通し、駐車場や充電ステーションなど施設の利用状況などリアルタイムに提供している企業の活用事例を紹介しています。

スマートフォン
アプリケーション

スマートフォンアプリケーションイメージ

スマートフォンアプリケーションの開発や実証実験に、音声合成ソフト・エンジンを採用することで、音声の聞き取りやすさなどのブラッシュアップに成功している企業をまとめて紹介しています。

観光案内・
館内・
車内各種放送

観光案内・館内・車内各種放送イメージ

観光案内・館内・社内各種放送に、音声合成ソフト・エンジンを活用して、日本語、英語、中国語、韓国語など多国後で案内放送を提供している企業や博物館なの活用事例をまとめて紹介しています。

電話自動応答
システム

電話自動応答システムイメージ

さまざまな業種・業界でコールセンターやバックオフィスの受託事業を展開している企業で採用している音声合成ソフト・エンジンの活用事例をまとめて紹介しています。

ロボット

ロボットイメージ

ロボットの音声データに、音声合成ソフト・エンジンを活用して、より人間的で、自然でなめらかな音声で、対話をすることが可能になります。また、ロボットのほかに、バーチャルユーチューバーの音声にも利用ができます。

WEBキャンペーン・
WEBサービス

WEBキャンペーン・WEBサービスイメージ

WEBキャンペーンやWEBサービスで、音声合成ソフト・エンジンを利用する企業が増えてきています。WEBページから、自分の名前や嫌いなこと入力すると、自分だけの映画予告ムービーを作成できるWEBサービスなどを提供している企業の事例をまとめて紹介しています。

ゲーム

ゲームイメージ

ゲームの制作に、音声合成ソフト・エンジンを活用することで、臨場感あふれるゲームの制作が可能になります。そのほか、コンビニのプリントサービスの音声機能付きブロマイドなどサービスを提供している事例をまとめて紹介しています。

e-Learning・
教材・
マニュアル作成

e-Learning・教材・マニュアル作成イメージ

e-Learning・教材・マニュアル作成に、音声合成ソフト・エンジンを採用し、教材やマニュアルに音声データを組み込んでいる企業のなど紹介をまとめて紹介しています。

ニュース
読み上げ

ニュース読み上げイメージ

ニュースの呼び上げに、音声合成ソフト・エンジンを採用し、「24時間多種多様なニュースの対応」、「コストの削減」に活用しているテレビ局の、音声合成ソフト・エンジンの活用事例などをまとめて紹介しています。

音声合成技術はAI(人工知能)の発達も相まって、滑らかな発音や感情表現を実現しています。人工的な声の印象がある施設の館内放送や電話自動応対のみならず、今や研修資料やゲーム機器など、多種多様な用途・業界にて活用されています。
ここでは、「音声合成」を活用した業界別の事例や、課題ごとに「音声合成」を活用した事例をまとめています。

ゲーム業界イメージ

ゲーム業界

ヤマハが開発した音声合成技術「ボーカロイド」、NTTドコモが提供する「ひつじのしつじくん」サービスなど、ゲームの世界で進む音声合成技術。音声対話型AIの開発が進むゲーム業界での音声合成技術についてご紹介します。

コールセンター業界イメージ

コールセンター業界

さまざまな業種が導入しているコールセンター。オペレーターの負担軽減とコスト削減のために音声合成が活用されています。どのような方法で活用されているのでしょうか。具体的な事例をピックアップして比較しています。

自動車業界イメージ

自動車業界

自動車業界で進んでいる「自動運転技術」の研究。このページでは「オートモーティブ・アシスタント」をピックアップ。自動車に搭載されているAIが利用者を助ける分野で、音声認識や音声合成の技術についてレポートしています。

教育業界イメージ

教育業界

新型コロナウイルス感染予防措置として、教育業界で急速に普及するパソコンやタブレットを使った「デジタル教材」による教育。動画やアニメのナレーションや教科書の音声読み上げ機能で活躍する、音声合成技術の活用事例をまとめました。

金融業界イメージ

金融業界

現金・クレジットカード・スマホ・Pey払いなどの多様な決済対応や、ネット上のリアルタイム取引、顧客への金融商品の提案など、金融業界のサービス向上はAI技術の発展に支えられています。ここでは金融業界での音声合成活用事例を集めました。

自治体イメージ

自治体

少子高齢化が進む日本。全国の自治体が、住民サービスの向上や、職員の業務効率化などのために、音声合成AIを活用する動きが目立ってきました。ここでは「サイト読み上げサービス」「防災無線」「電話応対AI」などへの取り組みをご紹介します。

外国語に対応した音声合成ソフト 

フリーの音声合成ソフト

フリーの音声合成ソフトは種類が豊富です。各社からさまざまなタイプのソフトが提供されています。ただし、高品質な音声をつくりたい場合は有料ソフトがおすすめです。有料ソフトは音声ライブラリの種類が豊富で、喜怒哀楽など感情のある音声もつくれます。

音声合成の仕組み

音声合成の仕組み(方式)には、代表的な録音編集方式・テキスト音声合成方式をはじめ、規則合成方式、コーパスベース合成方式、波形接続型音声合成方式、統計モデル型音声合成方式とさまざまな種類があります。こちらでは、各方式の概要を解説しています。

音声合成ソフトのイントネーション

音声合成ソフトではイントネーションの調整ができます。これによりソフトの不自然さを軽減することができ、感情のある声にすることもできます。より高いレベルの感情表現が必要な場合は、人に読んでもらう方法が良いですが、コストや時間を抑えたいならソフトがおすすめです。

音声合成の今後

年々技術が進歩している音声合成は、今後も利用の拡大や普及が進むとされています。一方で悪用される懸念が残っており、海外では詐欺事件に使われたケースも。また、声優など声の職業に影響するとも考えられています。

自分の声も合成音声に利用できるのか?

音声合成ソフトの中には、自分の声を利用して音声ファイルを作成できるサービスもあります。費用はかかるものの、自分の声を使ったオリジナル音声を作成できるのが特徴です。利用方法はさまざまですが、ビジネスならプレゼンや講演会での利用に適しています。

動画作成で音声合成を使うメリットは?

動画作成にも音声合成ソフトが適しています。音声合成ソフトを利用すれば外注の必要がなくなり、コストを削減できます。動画の内容も伝えやすくなるでしょう。ただし、音声合成ソフトは読み上げできない文字もあるため、事前に確認する必要があります。

子供の声を利用できる音声合成

音声合成ソフトによっては、子供の声でテキストや単語を読み上げさせることが可能です。子供向けコンテンツなどで、子供の音声が必要な時に適しています。ただ、ソフトによって機能は異なりますので、しっかり確認して選びましょう。

音声合成で起こりうる不具合

音声合成ソフトを利用していると、音が出なかったり、フレーズが再生されなかったりと、不具合が起きる場合もあります。もし不具合が出た時は、音声合成ソフトの修正版がリリースされていないか確認しましょう。また、OSを最新版にアップデートするのも解決方法の1つです。

オンラインで活用できる音声合成ソフト

音声合成ソフトを利用するには、PCへインストールしなくてはいけません。しかし、オンラインの音声合成ソフトなら、ダウンロード不要ですぐに利用できます。機能は限られますが、音声合成ソフトを試してみたい方は使ってみましょう。

音声合成ソフトの費用とプロへ依頼する費用の比較

動画を制作する際には、視聴者が分かりやすいようにナレーションを入れることもありますが、プロのナレーターに依頼するか音声合成ソフトを利用するか迷った際には、それぞれにかかる費用で比較してみてはいかがでしょうか。

音声合成ソフトの英語対応

音声合成ソフトの中には、英語に対応しているものがあります。主なメリットは、流暢な英語でテキストを読みあげてくれることです。ここでは英語に対応している音声合成ソフトのメリット、製品の例を紹介しています。

音声合成ソフトの方言対応

一部の音声合成ソフトは方言に対応しています。活用するメリットは、地域向けコンテンツに活用できるナレーションなどを作成できることです。詳しいメリットと方言対応の音声合成ソフトを紹介しています。

音声合成ソフトとChatGPTの連携

音声合成ソフトとChatGPTを連携させると音声による対話が可能になります。文字情報による対話の負担を軽減できるでしょう。ここでは、連携で生まれるメリット、両者を連携させた事例を紹介しています。

音声合成ソフトの人気キャラクター

音声合成ソフトが展開しているキャラクターはたくさんあります。それぞれのビジュアルに個性があるほか、声の特徴もさまざまです。利用用途や好みに合ったソフトを選ぶことで、理想とする作品を作ることができます。

音声合成ソフトのAPI連携

音声合成ソフトのAPI連携とは、すでに展開されている音声合成ソフトをAPI連携することでコストを削減しながら音声合成ソフトを利用することができます。用途に応じてさまざまなAPI連携の音声合成ソフトが展開されています。

音声合成ソフトのマークアップ言語

音声認識ソフトで音声を作成する際には、SSMLの「マークアップ言語」を使用することで音声をさまざまな形にカスタマイズできます。コードを入力することで音声のコントロールが可能で、コードはたくさんあるため、音声を細かくコントロールすることが可能です。

音声合成ソフトと著作権の関係性

音声合成ソフトで音声データを作成するにあたり、音声データ自体は著作権法に抵触しませんが、使用した原稿が著作権で保護された制作物の場合は、著作権法違反となり得ます。著作権違反をしないためにも、著作権についての理解を深めておくことが重要です。

音声合成ソフトを活用した音声配信

自社の商品やサービスをPRする際に、音声配信を活用している企業が増えています。SNSで無料の音声配信ができるものも多く、手軽に配信できる点は大きなメリットです。音声配信において合成音声ソフトで作成した音声データを活用している企業もあります。

音声合成ソフトを活用した音声広告

音声広告では、その名の通り音声で商品の宣伝を行うことができます。音声合成ソフトを使用することで、商品やサービスに合った音声広告を制作することができるほか、コストや工数を押さえられるというメリットもあります。

音声合成ソフトによるナレーションの精度

音声合成ソフトの音声精度は発展を続けており、現在ではさまざまなメディアに活用されています。テレビ番組で採用されていることも多く、バラエティ番組をはじめドラマに採用されるなど、活用用途は実に幅広いです。

音声合成ソフトによるブランディング

企業のブランディングを行うにあたり、特にオンラインでのブランディングにAIキャラクターを制作するケースが増えています。AIキャラクターの声に音声合成ソフトを使用されることが多く、さまざまな企業のブランディングに活用されています。

音声合成ソフトのセミナー・イベント

音声合成ソフトを提供している会社では、さまざまなセミナーやイベントを開催しています。参加することでサービスについての理解を深めることができるほか、実際に体験して導入を検討することができるなどのメリットを得られます。

自然に読み上げてくれる音声読み上げソフト

AI音声読み上げソフトは、動画ナレーションや多言語対応、リアルタイム変換など多機能化が進んでいます。様々なソフトの特徴や料金プランを比較し、商用利用の可否や導入時の注意点を解説。

辞書登録機能やボイスチェンジ、ノイズ除去など、より自然な音声を作るためのポイントも紹介します。

AITalk®について問い合わせる

コエステーションについて問い合わせる

ReadSpeakerについて問い合わせる