
AquesTalk(株式会社アクエスト)は、音声合成技術の研究開発を行っている株式会社アクエストによる、音声合成ミドルウェアです。ここではAquesTalkの特徴や導入例を紹介します。
AquesTalkは、実際に数百万台の製品に実装されています。またPC用の音声合成アプリにも実装されており、Youtubeをはじめとした実況動画でも多く使われてきました。
外部ライブ拉致やファイルシステムを使わず、ANSI C言語準拠のコードで記述されているため、OSを持たない環境であっても移植・実装できるのが特徴です。
参照元:株式会社アクエスト公式HP:https://www.a-quest.com/index.html
AquesTalkには、パッケージ製品とカスタム製品の2種類があります。パッケージ製品は、あらかじめ主要なプラットフォーム向けにビルドしたライブラリなので、検証や開発がすぐに行える点が特徴です。
一方でカスタム製品は特殊なOSもしくはOSを持たない組み込みシステム向けで、使用している環境に合わせて提供しています。
音声合成エンジンとして、AquesTalkは「小型」「軽量」にこだわっている点も特徴です。他に類を見ないほどの小ささを叶えた音声合成エンジンです。
公式HPにて、オンラインデモで合成音を試し聴きすることができます。用意されている固定メッセージを再生する方法のほか、任意のテキストを打ち込み、それを読み上げる音声を試聴する方法もあります。言語処理で行う場合には、漢字を含んだ文にも対応可能です。規則音声合成の場合は、音声記号列をカナで指定してください。
利用する音声合成エンジンや声の種種も選択できるため、自社のニーズに適した製品の導入を検討する際、非常に参考になります。
使用ライセンスは、AquesTalk製品のライブラリを実行する際に必要なライセンスです。AquesTalk製品のライブラリが組み込まれているアプリを外部からダウンロードして実行する際も同様です。AquesTalkPlayerやゆっくりMovieMakerで製作したユーチューブ動画などを広告つきで公開する場合、あるいは社内で利用する場合なども含まれます。
使用ライセンスは、オンラインストアで購入できます。価格はライセンス本数に応じて変動するので、まとめて購入する場合は、ライセンス本数を指定の上、問い合わせください。
ライブラリを使ったアプリやその他製品の開発を行う場合に必要になるライセンスのことを、開発ライセンスといいます。購入すると、製品版の開発キットを入手できます。ライセンス数は法人単位で、製品の種類ごとのライセンスとなります。
また、アプリや製品の開発後、自身でそれを利用する際にも、このライセンスが別途必要です。さらに、アプリや製品を再配布したり販売したりする場合には、頒布ライセンスをあらかじめ契約しておく必要があります。
価格はライブラリ製品やプラットフォームにより変動するので、指定の上、問い合わせください。
ライブラリを含むアプリや製品などの販売やネット公開を行う場合など、開発ライセンスを受けた人以外にそれを配布するために必要になるのが、頒布ライセンスです。一つ一つについて、ライセンス契約を結ぶことが求められます。
価格はライセンス本数に応じて変動します。年間ライセンス本数での契約が基本になりますが、リクエストや相談をすれば、内容によっては別形態にも対応してもらえる可能性があります。
※このあとの流れは、上述のパッケージ製品の場合と同様です。開発が終わったら、使用ライセンスか頒布ライセンスの契約を結び、その後で製品やアプリの販売・公開をする流れになります。
公式サイトに導入事例の記載はありませんでした。
AquesTalkは組み込みシステム向けの音声開発エンジンです。明瞭な合成音声であることや小型・軽量であること、そして組み込みが容易であることの3つにこだわっています。
インターネットが断続的、LPWAなどの低速通信回線など、クラウドが使えないシステムでの音声合成におすすめです。
AquesTalkは、株式会社アクエストが開発・販売している音声合成ソフトです。音声合成技術を中心として、デジタル音声信号処理の技術分野において、独自の視点で探求することを指名として、2005年に設立されました。
代表は30年余年にわたって音声合成技術の開発に取り組み、美しい理想の音声合成を目指して日々努力しているようです。
AquasTalkシリーズの中で一番小さいエンジンです。小さいリソースでリアルタイムの音声合成ができます。リソース制約が厳しい小型の組み込み機器に適しているソフトです。
32bitシステムへの組み込みに適している音声合成エンジンです。AquesTalk,AquesTalk2の後継モデルとして、両エンジンの特徴を残したままでさらにクリアな声質・高い明瞭性・パラメータによる声質の調整可能といった特徴を備えています。
声の種類を規定する16KBほどのデータを差し換えると、14種類の中から声種が切り替えられるという特徴があります。
声の種類は1種類のみ(女声)ですが、別途8種類の中から選択も可能です。
小型IoT機器向け、省リソースの日本語テキスト音声合成ミドルウェアです。外付けRAM不要で小さいコードサイズ、OS不要といった特徴があります。
AquesTalkで漢字を読ませるために使用する言語処理エンジンです。漢字・かな混じりのテキストをAquesTalk用の音声記号列に変換する役目があります。
ここでは主要なものを抜粋して紹介致しました。他にも多くのソフトを取り扱っているので、もっと見たい方は公式HPをご確認ください。
音声合成ソフトは入力した文字情報などを基に、電話の自動応対やe-learning教材、カーナビ、ゲームのキャラクターなど、さまざまな場面で「声」の役割を担ってくれるものです。
本サイトでは、数ある音声合成ソフトの中でも他社に負けない強みを持った3社を、その特徴ごとに紹介しています。
調整が簡単で質の高い
音声合成をしたい
芸能人の声を使った
音声合成をしたい
外国語をメインに
音声合成をしたい
【選定基準】Googleで「音声合成ソフト」と検索して出てきた、14社の中から、以下の条件に当てはまる企業を3社選出しました。(2022年2月調査時点)
・AITalk®
日本語話者が最多。ディープラーニングを用いた先端技術であるDNN音声合成を使った独自エンジン
・コエステーション
声優や芸能人などプロの声数が最多
・ReadSpeker
外国語の種類が豊富で、唯一外国語におけるイントネーション調整が可能。