Mac業界の最新動向はもちろん、読者の皆様にいち早くお伝えしたい重要な情報、
日々の取材活動や編集作業を通して感じた雑感などを読みやすいスタイルで提供します。

Mac Fan メールマガジン

掲載日:

買い切りの音声合成ソフト「VOICEPEAK」。“無気味の谷”を飛び越える、極めて自然な「人の声」の再現性がすごすぎる!

著者: 栗原亮

買い切りの音声合成ソフト「VOICEPEAK」。“無気味の谷”を飛び越える、極めて自然な「人の声」の再現性がすごすぎる!

※本記事は『Mac Fan』2022年7月号に掲載されたものです。

「コンピュータ音声」とは一線を画すリアルな音声合成

人間は、ロボットの様態が人間に近づくと好意的な反応を示す一方で、ある一定のポイントを超えると一転して違和感や嫌悪感を抱きます。これを「不気味の谷現象」と呼びます。音声アシスタントのSiriやAmazonのAlexaなどの声が人間に近づきつつあるものの、未だ完全に「人間ではない」ために、好感とは逆の感情を覚えてしまうことがあるのも、この心理現象によるものかもしれません。

ところが、このような「コンピュータ音声」の不自然さを一挙に覆す音声合成ソフトが登場しました。今年3月に株式会社AHSがリリースした「VOICEPEAK」です。

VOICEPEAK

【開発】
AHS
【価格】
パッケージ版:2万9800円  ダウンロード版:2万3800円

このソフトは最新のAI音声合成技術を搭載し、入力したテキストを読み上げさせることができるものですが、これまでのものと比べて、あたかも人間が話しているかのように自然に喋ることができるのが大きな特徴です。

「VOICEPEAK 商用可能 6ナレーターセット」は、女性3人+男性3人+女の子1人の話者の声を収録した音声合成ソフトです。体験版も用意されています。

アナウンサーのような流暢さ! 「VOICEPEAK」の驚くべき機能

その流暢な読み上げは、一般的な文章であればニュースを読むアナウンサーと遜色ないほど。また、声の大きさやテキストの読み間違い、不自然なアクセントなどの調整も簡単に行えたり、「感情パラメータ」を使って喜怒哀楽を表現できたりするなど、実に画期的な機能も搭載しています。

インターフェイスはテキストの読み上げに特化しているため比較的シンプル。まずはテキストを入力して[再生]ボタンを押して音声を確かめてみましょう。

そのままでもかなり精度の高い読み上げをしてくれますが、左下のツールから[アクセント][イントネーション][長さ]をカーソルのドラッグ操作で簡単に編集できます。

辞書登録機能もあるので、固有名詞なども適切に読み上げられます。

また、話者の声質を速度や高さで変更できるだけでなく、4種類の[感情]でパラメータを調節できるのもユニークです。

「VOICEPEAK」は商用利用可! 法人にもおすすめしたい

VOICEPEAKのすごさはなかなか文字では伝わらないと思いますので、製品のWebページへアクセスして紹介動画を見たり、体験版をインストールしたりして試してほしいと思います。間違いなく、多くの人が驚くはずです。

体験版では機能が制約されていますが、テキストファイルからの一括読み込みや、WAV形式またはFLAC形式の音声ファイル書き出しが可能です。

また、6人のナレーター(男性3名、女性3名)に加えて1人の「女の子」の声が収録されていながら、2万円台というリーズナブルな価格で導入できる点もVOICEPEAKの大きな魅力です。個人や法人を問わず、商用利用も可能なので、商品の紹介映像や店内アナウンス、動画広告などにコンピュータ音声を利用する法人にとっても、価格破壊的なインパクトがあります。YouTubeで粗製濫造される「棒読み」の音声合成ソフトを使った動画がなくなる日も近いかもしれません。

著者プロフィール

栗原亮

栗原亮

1975年東京都日野市生まれ、日本大学大学院文学研究科修士課程修了(哲学)。 出版社勤務を経て、2002年よりフリーランスの編集者兼ライターとして活動を開始。 主にApple社のMac、iPhone、iPadに関する記事を各メディアで執筆。 本誌『Mac Fan』でも「MacBook裏メニュー」「Macの媚薬」などを連載中。

この著者の記事一覧

おすすめの記事