7種類の声でAIが文章を感情を込めて読み上げてくれる商用利用可能な読み上げソフト「VOICEPEAK」レビュー
VOICEROIDシリーズやSynthesizer Vシリーズなどの入力文字読み上げソフトを提供するAH-Softwareが、AI音声合成技術を搭載して手軽に文章を読み上げさせることが可能な入力文字読み上げソフト「VOICEPEAK」をWindows・macOS・Linux向けに、2022年3月11日にリリースすると発表しました。VOICEPEAKにはナレーター6人+女の子1人=合計7種類のボイスが収録されていて、AIによって読み上げボイスの感情を制御することも可能になっているとのこと。一足先に触ってみる機会を得られたので、実際にいろいろとVOICEPEAKにしゃべらせてみました。
VOICEPEAK 商用可能 6ナレーターセット|製品情報|AHS(AH-Software)
https://www.ah-soft.com/voice/6nare/
VOICEPEAKには体験版が存在しますが、今回体験したのはより製品版に近いベータ版です。VOICEPEAKの画面はこんな感じ。
画面をクリックすると、セリフの入力画面が表示されました。
テキストを入力すると、画面下部にほぼ同時に読みとアクセントが表示されました。
入力テキストの冒頭をクリックしてカーソルを合わせ、上部メニューにある再生アイコンをクリックすると、VOCIEPEAKが読み上げてくれます。入力文字読み上げソフトは文字を入力してから音声を生成するまで少し時間がかかったりする場合もありますが、VOICEPEAKは入力したその場で読みとアクセントが判断され、音声もすぐに再生されます。
読み上げ音声は女性3パターン+男性3パターン+女の子1パターンの合計7種類。実際に文章を入力し、それぞれの声で読み上げさせてみたところが以下のムービー。
7種類の声で文章を読み上げてくれるVOICEPEAKにしゃべらせるとこんな感じ - YouTube
入力画面の右には読み上げの速さとピッチ(音程)を調節できるスライドバーがあります。さらに、VOICEPEAKは読み上げ時の感情も調整できるのが大きなポイント。「幸せ」「楽しみ」「怒り」「悲しみ」をスライドバーで調節することで、声の高さや明るさが自動で調整されます。この感情を調節できるシステムによって、同じ文章でもガラリと雰囲気を変えて読み上げてもらうことが可能です。
実際に、「幸せ」「楽しみ」「怒り」「悲しみ」をそれぞれ100%にしてAIに読み上げてもらったところが以下。「幸せ」や「楽しみ」が100%だと声のトーンが明るくなって抑揚もやや大きくなるのに対して、怒りや悲しみは抑揚が抑えられており、子音の強さなど発音にもわずかに違いがある印象を受けます。
AIが文章を読み上げてくれる「VOICEPEAK」は喜怒哀楽を設定することで読み上げ方がガラリと変わる - YouTube
VOICEPEAKには辞書機能も内蔵されており、漢字混じりの文章でもそのまま理解して読みを用意してくれます。ただし、たまにAIが読み方を間違えてしまうことも。例えば以下は「徒歩10分(トホジュップン)」を「トホジュウブン」と読んでしまった場面。
読みは直接入力し直すことで修正が可能。なお、VOICEPEAKにはユーザー辞書機能として、特定の単語の読み方や発音を追加することもできます。
そしてイントネーションも高低を切り替えることで調整できます。
また、以下画像の赤枠部分をクリックすると、イントネーションのピッチを細かく調整できます。
というわけで、実際にVOICEPEAKで「宇宙ヤバイ」を読み上げてもらったところが以下。一部漢字の読み方の修正と感情パラメーターの調整はしていますが、それ以外は入力したそのままを読み上げてもらっています。文章を貼り付けると一瞬で読みとイントネーションが準備され、ほんの数カ所を修正しただけで、なめらかに読み上げてくれます。
文章をAIが自然に読み上げてくれる「VOICEPEAK」に「宇宙ヤバイ」のコピペを読んでもらった - YouTube
生成したナレーションを書き出すには、上部メニューの本アイコンをクリックして、「出力」を選びます。
「Export as single file」を選択して「Export」をクリックすれば、WAV形式でナレーションが書き出されます。
同じAH-SoftwareがリリースするVOICEROIDシリーズは、商用利用する場合は別途商用ライセンスを購入する必要がありました。しかし、VOICEPEAKは最初から商用利用可能。AIが自動で読みとイントネーションを用意してくれる上にナレーション生成も瞬時で、ローディングに時間を奪われることもないので、VOICEPEAKは即戦力が期待できるソフトといえます。ナレーションも非常に高品質で、AIが読み上げてるとは思えないほどなめらかに読み上げてくれます。イントネーションを細かく設定すれば方言にも対応できるのも大きな特徴。また、複雑な操作は一切必要なく、UIもシンプルで見やすく直感的に使えるので、専門家でなくても簡単に使えるというのもうれしいポイントです。
VOICEPEAKは2022年3月11日(金)に発売予定、6種類のナレーター+1ボイスの合計7種類のボイスが同梱して、価格は税込1万9800円です。
VOICEPEAK 商用可能 6ナレーターセット|製品情報|AHS(AH-Software)
https://www.ah-soft.com/voice/6nare/
・関連記事
無料でさまざまな音声合成エンジンや音声ライブラリを扱える汎用合成音声エディタ「ユニコエ」が登場 - GIGAZINE
無料で文章から自動で読み上げ音声を合成してくれるソフト「VOICEVOX」を使ってみた - GIGAZINE
ディープラーニングで誰でも簡単に「結月ゆかり」の声になれる音声変換技術が開発される - GIGAZINE
誰でも100種類の声に変換できるAIボイスチェンジャーを使ってみたらこんな感じ - GIGAZINE
無料でキャラクターボイスを自動で合成してくれるAIトークソフト「COEIROINK」は誰でも超簡単に創作物の「声」を作り出せる - GIGAZINE
人間の声を収集して言語別の音声データセットを作るプロジェクト「Common Voice」に参加してみた - GIGAZINE
無料でビル・ゲイツやアーノルド・シュワルツネッガーなど有名人に好きな台詞をしゃべらせることができる「Vocodes」レビュー - GIGAZINE
・関連コンテンツ