Ruby Talk (日立ソリューションズ・テクノロジー)

Ruby Talkは、高品位音声合成ミドルウェアとして、多彩な話者のバリエーションやカーナビ専用の音源を搭載した製品です。ここでは、Ruby Talkの特徴や機能について紹介します。

Ruby Talk (日立ソリューションズ・テクノロジー)とは

肉声感の高い音声を搭載

Ruby Talkには、女性7名・男性3名・子ども2名の話者がそれぞれラインナップされています。アナウンスやエンターテインメント読み上げ、カーナビゲーション専用音源など、多彩な用途をカバーしています。

日本語話者特有の、漢字かな交じり文の正確な読み上げが可能。さらにDNN(Deep Neutral Network)の導入により、安定的な韻律での読み上げを行います。

46言語の音声合成に対応

日本語を含めた46言語への音声合成が可能で、特定分野で頻出するフレーズを音声合成によってシステム内に組み込むことができます。

合成された音声についても、高品位かつ肉声感を保ったまま、いつでも手軽に実際の音声のような合成ができます。

音声合成を簡単に行える機能が搭載されているため、作成にかかる期間やコストの削減が可能です。

Ruby Talk (日立ソリューションズ・テクノロジー)の導入事例

カーナビゲーションシステムのケース

カーナビゲーションシステムにおいて、漢字かな交じり文の日本語処理能力や高品位音声が評価されました。

参照元:Ruby Talk公式HP:https://www.hitachi-solutions-tech.co.jp/iot/solution/voice/Ruby_Talk/index.html

Ruby Talk (日立ソリューションズ・テクノロジー)の機能

Ruby Talk (日立ソリューションズ・テクノロジー)のおすすめポイント

男性と女性、大人と子どものそれぞれに対応し、肉声に近い発話が可能な音声合成ミドルウェア。カーナビゲーションやエンターテインメント読み上げにも対応するなど、思いのままの音声を作成できます。

ニーズ別!業務効率化におすすめな
音声合成ソフトを見る

Ruby Talkを制作している日立ソリューションズ・テクノロジーとは

日立ソリューションズ・テクノロジーは、組み込みシステムに係るソフトウェア・デバイスの設計・開発・販売・運用・保守を行う会社です。

自動運転や車載ネットワーク、モバイル通信基地局や鉄道安全監視装置など生活に欠かせない分野へのシステム開発を軸に、要望に適したシステムをワンストップで提案しています。

扱っているソフト一覧

Micro Ruby Talk

超低リソースの組み込み向けの音声合成ミドルウェアです。

Ruby Talk V6.0

組み込み向け音声合成ミドルウェアで、WindowsやAndoroid・iOSなどに対応しています。

Ruby Talk Server 1.1/2.1/3.0

サーバーやオンプレミス環境に対応した製品で、日本語の音声合成機能は3.0のみ46言語に対応しています。

その他Ruby Talk が取り扱っている製品

Ruby Box2

音声認識とIoT活用を省スペースで実現する、コンパクトなエッジ音声認識デバイスです。小型ながらも高性能なマイクとの連携機能やリアルタイムの音声処理機能を搭載し、オフィス・工場・施設などさまざまな現場で導入が進んでいます。

小型かつ高性能なエッジデバイス

わずかなスペースに設置可能な筐体でありながら、現場の音声を素早く認識・処理できる高性能を兼ね備えています。

クラウド不要でリアルタイム処理

ローカル処理に対応しているため、インターネット接続が難しい現場でも利用可能。セキュリティやレスポンス面でも有利です。

多様な周辺機器と柔軟に連携

マイクやスピーカー、センサーなど各種周辺機器とスムーズに接続できるため、運用の自由度が高く、カスタマイズ性にも優れています。

Ruby Spotter

音環境の変化を検知し、音声認識だけでなく周囲の「気配」も捉えるスマートセンサーソリューションです。現場の騒音レベルに応じた調整機能や、異常音の検出によるアラートなど、安全・効率性の向上に貢献します。

騒音環境にも強い認識性能

工場などのノイズが多い現場でも、正確に音声を拾い、適切に処理できます。

異常音の検出と通知

転倒音や悲鳴、機械の異常作動音など、特定の音をトリガーとして自動でアラートを発信することが可能です。

自動環境適応による精度向上

時間帯や周囲の音響条件に応じて自動で音声認識設定が変化し、常に認識状態を維持します。

Ruby Concierge

受付・案内・接客などの非対面業務を、AI音声認識によって自動化・省人化する対話型音声ソリューションです。複数言語への対応や、自然な会話インターフェースにより、顧客体験を向上させます。

音声対話による自然な対応

定型的な質問に限らず、ある程度自由な言い回しにも対応し、自然な会話で顧客を案内します。

多言語対応でインバウンド対応も可能

日本語だけでなく、英語や中国語などの多言語に対応可能。観光地や国際施設での活用にも適しています。

様々なデバイス・システムとの連携

ディスプレイ付き端末や受付タブレット、サイネージなどと組み合わせて柔軟に運用できます。

Ruby Dictation

高精度な音声文字起こしを可能にする業務支援ツールです。会議や講演、対話記録など、多様なシーンにおいて発話をリアルタイムでテキスト化し、記録の効率化と情報共有をサポートします。

高精度な認識エンジンを搭載

専門用語や複雑な構文にも対応できる認識エンジンを搭載しており、ビジネスや医療現場でも活用されています。

話者分離機能で議事録も簡単

複数人の会話を発話者ごとに識別して記録できるため、議事録作成の精度と効率の向上に期待できます。

クラウド連携によるスムーズな共有

記録したテキストを即座にクラウドにアップロード可能。チーム間での共有や管理が容易です。

会社概要

目的に合ったものはどれ?
ニーズ別音声合成ソフトのおすすめ3選

音声合成ソフトは入力した文字情報などを基に、電話の自動応対やe-learning教材、カーナビ、ゲームのキャラクターなど、さまざまな場面で「声」の役割を担ってくれるものです。
本サイトでは、数ある音声合成ソフトの中でも他社に負けない強みを持った3社を、その特徴ごとに紹介しています。

調整が簡単で質の高い
音声合成をしたい

AITalk®
(株式会社エーアイ)
特徴
先端ディープラーニングを導入した独自の技術で、
音質・肉質感の向上、多様な発話表現を実現。
利用シーン
日本語・英語・中国語をメインに、
品質重視のカーナビや館内放送、ニュース読み上げなど

芸能人の声を使った
音声合成をしたい

コエステーション
(コエステ株式会社)
特徴
9万以上の一般ユーザーだけでなく、
40以上に
のぼる有名人などの
豊富な「コエ」の数。
利用シーン
世界観やPR要素重視の
ゲームやYouTube動画など
(エンタメ系)

外国語をメインに
音声合成をしたい

ReadSpeaker
(HOYA株式会社)
特徴
中国語と区別して広東語も。
日本語、英語(アメリカ・イギリス)、韓国語をはじめ、
24言語に対応。
利用シーン
観光案内や美術館の音声ガイダンスと
いった、
外国籍の方の利用が多い場所など

【選定基準】Googleで「音声合成ソフト」と検索して出てきた、14社の中から、以下の条件に当てはまる企業を3社選出しました。(2022年2月調査時点)
・AITalk®
日本語話者が最多。ディープラーニングを用いた先端技術であるDNN音声合成を使った独自エンジン
・コエステーション
声優や芸能人などプロの声数が最多
・ReadSpeker
外国語の種類が豊富で、唯一外国語におけるイントネーション調整が可能。