Ruby Talkは、高品位音声合成ミドルウェアとして、多彩な話者のバリエーションやカーナビ専用の音源を搭載した製品です。ここでは、Ruby Talkの特徴や機能について紹介します。
Ruby Talkには、女性7名・男性3名・子ども2名の話者がそれぞれラインナップされています。アナウンスやエンターテインメント読み上げ、カーナビゲーション専用音源など、多彩な用途をカバーしています。
日本語話者特有の、漢字かな交じり文の正確な読み上げが可能。さらにDNN(Deep Neutral Network)の導入により、安定的な韻律での読み上げを行います。
日本語を含めた46言語への音声合成が可能で、特定分野で頻出するフレーズを音声合成によってシステム内に組み込むことができます。
合成された音声についても、高品位かつ肉声感を保ったまま、いつでも手軽に実際の音声のような合成ができます。
音声合成を簡単に行える機能が搭載されているため、作成にかかる期間やコストの削減が可能です。
カーナビゲーションシステムにおいて、漢字かな交じり文の日本語処理能力や高品位音声が評価されました。
参照元:Ruby Talk公式HP:https://www.hitachi-solutions-tech.co.jp/iot/solution/voice/Ruby_Talk/index.html
男性と女性、大人と子どものそれぞれに対応し、肉声に近い発話が可能な音声合成ミドルウェア。カーナビゲーションやエンターテインメント読み上げにも対応するなど、思いのままの音声を作成できます。
日立ソリューションズ・テクノロジーは、組み込みシステムに係るソフトウェア・デバイスの設計・開発・販売・運用・保守を行う会社です。
自動運転や車載ネットワーク、モバイル通信基地局や鉄道安全監視装置など生活に欠かせない分野へのシステム開発を軸に、要望に適したシステムをワンストップで提案しています。
超低リソースの組み込み向けの音声合成ミドルウェアです。
組み込み向け音声合成ミドルウェアで、WindowsやAndoroid・iOSなどに対応しています。
サーバーやオンプレミス環境に対応した製品で、日本語の音声合成機能は3.0のみ46言語に対応しています。
音声認識とIoT活用を省スペースで実現する、コンパクトなエッジ音声認識デバイスです。小型ながらも高性能なマイクとの連携機能やリアルタイムの音声処理機能を搭載し、オフィス・工場・施設などさまざまな現場で導入が進んでいます。
わずかなスペースに設置可能な筐体でありながら、現場の音声を素早く認識・処理できる高性能を兼ね備えています。
ローカル処理に対応しているため、インターネット接続が難しい現場でも利用可能。セキュリティやレスポンス面でも有利です。
マイクやスピーカー、センサーなど各種周辺機器とスムーズに接続できるため、運用の自由度が高く、カスタマイズ性にも優れています。
音環境の変化を検知し、音声認識だけでなく周囲の「気配」も捉えるスマートセンサーソリューションです。現場の騒音レベルに応じた調整機能や、異常音の検出によるアラートなど、安全・効率性の向上に貢献します。
工場などのノイズが多い現場でも、正確に音声を拾い、適切に処理できます。
転倒音や悲鳴、機械の異常作動音など、特定の音をトリガーとして自動でアラートを発信することが可能です。
時間帯や周囲の音響条件に応じて自動で音声認識設定が変化し、常に認識状態を維持します。
受付・案内・接客などの非対面業務を、AI音声認識によって自動化・省人化する対話型音声ソリューションです。複数言語への対応や、自然な会話インターフェースにより、顧客体験を向上させます。
定型的な質問に限らず、ある程度自由な言い回しにも対応し、自然な会話で顧客を案内します。
日本語だけでなく、英語や中国語などの多言語に対応可能。観光地や国際施設での活用にも適しています。
ディスプレイ付き端末や受付タブレット、サイネージなどと組み合わせて柔軟に運用できます。
高精度な音声文字起こしを可能にする業務支援ツールです。会議や講演、対話記録など、多様なシーンにおいて発話をリアルタイムでテキスト化し、記録の効率化と情報共有をサポートします。
専門用語や複雑な構文にも対応できる認識エンジンを搭載しており、ビジネスや医療現場でも活用されています。
複数人の会話を発話者ごとに識別して記録できるため、議事録作成の精度と効率の向上に期待できます。
記録したテキストを即座にクラウドにアップロード可能。チーム間での共有や管理が容易です。
音声合成ソフトは入力した文字情報などを基に、電話の自動応対やe-learning教材、カーナビ、ゲームのキャラクターなど、さまざまな場面で「声」の役割を担ってくれるものです。
本サイトでは、数ある音声合成ソフトの中でも他社に負けない強みを持った3社を、その特徴ごとに紹介しています。
調整が簡単で質の高い
音声合成をしたい
芸能人の声を使った
音声合成をしたい
外国語をメインに
音声合成をしたい
【選定基準】Googleで「音声合成ソフト」と検索して出てきた、14社の中から、以下の条件に当てはまる企業を3社選出しました。(2022年2月調査時点)
・AITalk®
日本語話者が最多。ディープラーニングを用いた先端技術であるDNN音声合成を使った独自エンジン
・コエステーション
声優や芸能人などプロの声数が最多
・ReadSpeker
外国語の種類が豊富で、唯一外国語におけるイントネーション調整が可能。