
FineSpeechは、株式会社アニモが運営している音声合成システムです。品質の高さだけでなく、聞き取りやすさを追求しています。ここではFineSpeechの特徴や導入事例、機能などを詳しく紹介します。
FineSpeechは、富士通研究所で研究・開発された要素技術をアニモで継承する形で販売されています。使用するケースに合わせて適したプログラムを提供しているのが特徴です。
嬉しい声・悲しい声・起こった声・冷たい声など、感情表現の音声合成を開発(※)。他にも、個人の声質を再現できる個人音声合成や英語・中国語・韓国語への対応など、常に先進的な音声合成を提供しています。
参照元:株式会社アニモ公式HP:https://www.animo.co.jp/for_biz/fsseries
FineSpeechシリーズは、駅構内、高速道路、空港施設などの公共空間をはじめ、自動音声応答装置(IVR)、防災放送や工場等の社会産業インフラ、各種サービス、組込み機器をはじめ、さまざまな分野でご利用いただいている実績豊富な音声合成ミドルウェアです。
参照元:株式会社アニモ公式HP:https://www.animo.co.jp/for_biz/fsseries
FineSpeechは、幅広い用途に合わせた豊富なオプションライブラリ、プログラムによって使い勝手が良いのがポイントです。さらに英語・中国語・韓国語にも対応しているため、幅広い分野で活用できます。
株式会社アニモは「音や音声をキーテクノロジとしたソリューションカンパニー」です。事業療育は社会・産業インフラ、コンタクトセンター、クラウドサービス、ヘルスケア、研究・技術開発の5つが主です。
個人向け・法人向けにさまざまな製品の開発・販売を行っており、株式会社アニモが提供するサービスは幅広く活用されています。
幅広い用途に合わせた適したプログラムを提供している、音声合成システムです。用途に合わせたオプションライブラリがあり、聞き取りやすさを追求した各種コンサルサービスも提供しています。
複数の音声を合わせて新たな声が作り出せる「ボイスモーフィング機能」を実装しています。指定の声によるボイスモデルを短期間・ローコストで作成可能です。
品質の高い音質で、さまざまな声種が利用可能なナレーション作成ツールです。長文のナレーション音声を簡単に作成することができます。
FineSpeech MRCP serverは、大規模なコールセンターや複合サービスアプリケーションなどで使用できるサーバー型ソリューションです。MRCPに対応しており、品質が高い音声合成ライブラリであるFineSpeechを使用しています。
他にも、次のような製品ラインナップがあります。それぞれの機能や特徴についてまとめました。
幅広い分野に向けたソリューションを提供している製品です。組み込みシステム用です。日本語テキストに対応しています。ロボットとの音声対話や防災ラジオ、スマホの音声コンテンツほか、さまざまなシーンでの利用が可能です。さらに、JEITATT-6004「ITS車載器用音声合成記号」仕様に準拠しているので、道路交通情報提供システムやカーナビなどでも活用できます。
各利用シーンで単語辞書およびプリプロセッサのカスタマイズが提供されるので、使い勝手の良さが高いのも魅力です。
病気で声を失う方の音声をベースにして、テキスト読み上げをする辞書です。音声を収録しておくことで、波形辞書を作成することが可能になります。音声の収録は、耳鼻咽喉科などにある聴覚検査室のような、周りの騒音や空調音などが入ってこない防音室などで行うことをおすすめします。
収録時間は、1時間ほどです。ただし、読み上げる内容によって変動します。なお、収録作業自体が本人の喉に負担を与える可能性があるため、音声収録を行う際には、あらかじめ担当医に相談することをお勧めします。
音声のピッチをキープしつつ、話速を変換できます。早聞きおよび遅聞きが可能になるライブラリです。ホーム法人向けの製品です。
音声のスピードを変化させる際に、品質の劣化が起こりません。そのため、言語教育や高齢者を対象とした端末での音声ガイダンスほか、さまざまなシーンで便利に活用できます。なお、データファイルを読み込んだ上で希望するスピードに変換して出力するコマンドラインのアプリは、サンプルコードとして同梱されます。話速変換プレーヤーも同梱されます。
ホーム法人向けのノイズリダクションです。音声に含まれるノイズを取り除くためのライブラリです。音声アプリに、ノイズ除去効果を手軽に付与することができます。入力音声を学習するシステムなので、ノイズ除去は自動的に行われます。強度の調整も簡単です。
多岐にわたる音響・音声信号の処理が可能になるライブラリです。音響編集と音声処理の2種類から選べます。
音響編集ライブラリは、音響データに対する信号処理である「フィルタ」や「エフェクト」などを扱う関数セットです。一方、音声処理ライブラリは、音声の特徴を分析する際に欠かせない信号処理である「ピッチ抽出」や「分析再合成」などを扱う関数セットです。
クラウドサービスやローカルなどで、情報を音に埋め込んだ上で配信できるようになります。可聴域で伝達するので、特殊なスピーカーなどの専用機材を用意する必要はありません。そのため、設備投資のコストを抑えられます。アプリで情報を検出する際、クーポン・広告・チケットの配信などのアクションを起こします。
また、情報量を抑えることで冗長性を高めており、雑音に強いところも注目ポイントです。
話し言葉におけるイントネーションやアクセント、音質の違いなど、録音した発話内容をさまざまな角度から分析したり可視化したりすることが可能になるソフトウェアです。
日本語/英語の音声言語研究や語学教育、音声医学、心理学など、さまざまな研究・用途・シーンで便利に活用できます。分析結果を単純なマウス操作で一覧表示できるなど、使い勝手の良さも注目ポイントです。録音した音声のスピードを変化させたりポーズを削除したりすることも可能です。他にも便利な機能が多数搭載されています。
発話の長さやイントネーション、リズム、ポーズ、スピード、テンションなど、音声にはさまざまな「パラ言語情報」が含まれています。Animo Paralinguistic Baseは、パラ言語情報を分析し、数値化および可視化することができるソフトウェアライブラリです。この商品の主な用途として、たとえば次のようなものが挙げられます。
語学の教育者向けの製品です。音声の効果的な聞き取りや可視化、数値化などを通じて、学習促進につなげることが目的です。次に挙げるような音声技術により、外国語の発音を効果的に学習するためのサービス提供が可能になります。
音響データの可視化・数値化・分析を通じて、生産性および品質の向上や故障が発生する予兆の検知、そして安全性の改善などにつなげることができるクラウドサービスです。収録した音響データを登録するだけで、音響分析ソリューション「AnimoWaveBase」をベースにしたデータクレンジング・音響分析機能の利用が可能になります。
分析手法や事例が用意されているので、専門的な知識がなくても、スムーズに音響分析を始められます。また、サブスクリプションで利用できるので、複数の設備に役立てたい場合や長期間にわたり使用したい場合も、コストを抑えやすいです。
失語症患者や言語発達遅滞児、聴覚障害児などを対象とした言語リハビリおよびトレーニングに利用できる言語訓練支援システムです。ソフトとハードがセットになっています。
システムの機能を活用して、人間の視覚・聴覚・触覚に統合的な刺激を加えます。この刺激により、疑似体験や追体験を通じて「ことば」や「ことばに結びついている概念」の再構築を促すことが可能になります。
中度および軽度の失語症患者向けの言語リハビリソフトです。ソフトに収録されている「となえうた」を聴き取ったり発声したりするトレーニングを実施することで、ことばの再獲得をサポートします。CDプレーヤーで再生させることも可能なので、パソコンを用意しなくてもトレーニングできます。たっぷり520の訓練文が収録されているため、量的にも充実しています。
上述の製品「花鼓Ⅲ」をお持ちの場合は、連携させることで、より効果的にトレーニングを進めることができます。
インターネットをパソコンやタブレット、スマートフォンなどに接続するだけで、いつでも失語症の言語リハビリやトレーニングを行うことができます。言語発達遅滞児や聴覚障害児も利用しています。「低周波刺激」「不連続刺激」の音声も利用できます。周波数調整器は必要ありません。
※1年間分の料金を設定することで、導入のハードルを下げています。
インターネット接続が可能なパソコンやタブレット、あるいはスマートフォンがあれば、時や場所を問わず、吃音症状の改善を目指すトレーニングをサポートします。病院や学校の専門家の指導の下で、自宅などでフルーエントトークを活用できます。
基礎と吃音克服、計2種類のトレーニングがあり、さらに5段階のステップに分かれています。なお、吃音克服トレーニングは、「遅い」「普通」「速い」から選べます。声を録音できるので、症状の確認にも役立ちます。
コミュニケーション能力の維持や向上を目的とした「リズミカル運動訓練」を行うためのサービスです。認知症の予防や改善に役立てることができます。介護施設で指導を受けたり自宅でじっくりとトレーニングを続けたりすることが大切です。
「リズミカル運動訓練」と「話しことば訓練」の2種類で構成されています。トレーニングの管理・履歴記録機能や認知症評価フォームなどを利用できます。
録音した自分の声を聞くことで、声帯に炎症やポリープ、結節などの異常がないかどうかを確認するためのツールです。より詳細に確認したい場合には、専門医に音声を聴いてもらえる「専門医チェック」の利用をおすすめします。ただし、実際の診断とは異なるため、のどスキャンの結果については、あくまでも一つの目安として参考にしてください。
嚥下障害を予防するために、口唇や舌、喉などを鍛えて滑舌および嚥下を改善したい場合におすすめのアプリです。
1,700語以上の「発話するのが難しい言葉」や「パタカ言葉」をリピートするトレーニングを毎日実施して、発声器官を鍛えます。
※「パタカ言葉」とは、子音を発音する口内の部位をすべて使う必要のある言葉のことです。口唇は主にパ行、舌先は主にタ行、そして後舌は主にカ行を発音する際に使います。
音声合成ソフトは入力した文字情報などを基に、電話の自動応対やe-learning教材、カーナビ、ゲームのキャラクターなど、さまざまな場面で「声」の役割を担ってくれるものです。
本サイトでは、数ある音声合成ソフトの中でも他社に負けない強みを持った3社を、その特徴ごとに紹介しています。
調整が簡単で質の高い
音声合成をしたい
芸能人の声を使った
音声合成をしたい
外国語をメインに
音声合成をしたい
【選定基準】Googleで「音声合成ソフト」と検索して出てきた、14社の中から、以下の条件に当てはまる企業を3社選出しました。(2022年2月調査時点)
・AITalk®
日本語話者が最多。ディープラーニングを用いた先端技術であるDNN音声合成を使った独自エンジン
・コエステーション
声優や芸能人などプロの声数が最多
・ReadSpeker
外国語の種類が豊富で、唯一外国語におけるイントネーション調整が可能。