クロスシンセシスが復活!? VOCALOID 6のAI Megpoidを買うと超便利なプラグイン3種が付いてくる!

クロスシンセシスが復活!? VOCALOID 6のAI Megpoidを買うと超便利なWin/Mac対応プラグイン3種が付いてくる!

10月13日に発表&発売され、大きな話題になったVOCALOIDの新バージョンのVOCALOID 6。従来のVOCALOID 5のエンジン、機能はそのままに、AI歌声合成を実現するVOCALOID:AIという新エンジンを搭載したことで、よりリアルな歌い方ができるようになるとともに、UIも一新されより使いやすくなっています。その一方で、読者からのSNSでの反応や当日行ったDTMステーションPlus!の緊急番組でのコメントを見ると、「VOCALOID 4にあったクロスシンセシス機能を復活させてほしかった」という要望を数多く見かけました。

そのニーズをうまく拾い上げて実現したのは、当のヤマハではなく、VOCALOID6 Voicebank AI Megpoidを開発・販売するインターネット社でした。このAI Megpoidを購入するとクロスシンセシスをDAW上で実現させるプラグイン、XSynが無料でもらえるというのです。また、AI MegpoidにはXSynだけでなく、声質変換プラグインであるFormant Shift 2、さらには息成分や口の開き具合をコントロールできるプラグインのAir FXももらえるという、超強力なオマケ付きに進化していました。実際どんなものか試すとともに、なぜこんなプラグインを開発し、付属させることにしたのかなど、インターネットの社長、村上昇さんに話を聞いてみたので、紹介してみたいと思います。

AI Megpoidにバンドルされる形で、クロスシンセシスを実現するXSyn、Air FX、Formant Shift 2がリリースされた


まず、あまりご存じない方もいると思うので、クロスシンセシスとは何なのかを紹介したいと思います。これは2014年に発表されたVOCALOIDの2世代前のバージョン、VOCALOID 4に搭載された機能で、2種類のボイスバンク(歌声ライブラリ)間の声質を滑らかに変化させることができる、というものでした。

VOCALOID 4に搭載されていたクロスシンセシス機能

たとえばVOCALOID 4用のMegpoidには基本的な歌声であるNativeのほかに、太く大人っぽい声のAdult、迫力ある声のPower、子供っぽいあまい声のSweet、優しくささやく声のWhisperの5種類があります。このうちNativeとPower間でクロスシンセシスの設定を行うことで、2つの歌声間をスムーズにモーフィングさせることができたり、中間の声質で歌わせることができるというもので、多くのVOCALOIDユーザーに積極的に利用されていた機能だったのです。

詳細は「VOCALOID4発表!目玉はグロウルと歌声間をモーフィングするクロスシンセシス」といった当時の記事にも書いているので参照いただきたいのですが、このクロスシンセシスはMegpoidのようなシリーズでのボイスバンク同士に限らず、たとえば男性の歌声である、がくっぽいどとMegpoid間で利用するといったこともできるため、かなり変わった声、想定外の声を生み出すことができるのも、多くのユーザーに支持された点でもありました。

そんなクロスシンセシスの機能がなぜかVOCALOID 5になった時点で削除されてしまいました。ユーザーからは復活の要望も多く出ていたようにも思いますが、残念ながら先日リリースされたVOCALOID 6でも搭載されることがなかったのです。

今回公開されたVST3対応のプラグインとしてクロスシンセシスを実現するXSyn

その状況に救いの手を差し伸べたのがインターネット社でした。同社が開発し11月25日にリリースしたXSynというVST3プラグイン(Windows/Mac対応)を使うことで、クロスシンセシスを復活できるようになったのです。「でも、どうやって?」「あれ?VOCALOID 6にプラグインって使えなかったのでは?」という疑問も上がってきそうですよね。その点を解説していきましょう。

まず、これはVST3プラグインなのでVOCALOID 6上で使えるものではなく、Ability ProやCubase、Studio One、Ableton Live…などのDAW上で使うものとなっています。たとえば、先ほどの例でいうとAI MegpoidとHARUKAの間でクロスシンセシスを実現したいとしましょう。このとき、あらかじめVOCALOID 6でAI MegpoidとHARUKAのそれぞれで同じ内容を歌わせたものをWAVで書き出しておくのです。

事前にVOCALOID 6から2つの歌声で同じフレーズを書き出しておく

その2つのWAVをDAWのトラックにそれぞれ読み込んだ上で、AI Megpoidの歌声のトラックにXSynをインサーションの形で挿入するとともに、サイドチェインが効くような設定にします。一方、HARUKAのトラックの出力を、いま設定したXSynのサイドチェインに設定し、オーディオ出力側に行かないようになていることを確認して、準備は完了。あとはXSynのレバーを動かしていくことでクロスシンセシスを実現できるようになるのです。実際その効果をインターネットがビデオで紹介しているので、これを見ると分かると思います。

このビデオではレバーを完全に右にまで持っていってないので、違いが感じにくいかもしれませんが、右に振り切ることでターゲットの声質にほぼ近いところになります。ちなみに、VOCALOID 4のクロスシンセシスでも完全にターゲットの声質になったわけではなく、元の声質をターゲットの声質に似せるという処理をしていましたが、それはXSynでも同様となっています。本来であればVOCALOID 6 Editorに搭載されていれば、よかった機能だし、不可能なものではなかったと思うのですが、そこにない以上、ひと手間かかりますがXSynで同様のことができるので、ユーザーとしては嬉しいところですね。

XSynを使うことで、2つの歌声間の声質をモーフィングできる

ちなみに、このXSynでは1点注意すべきところがあります。それは元の歌声とターゲットの歌声のタイミングがピッタリと一致していること。VOCALOID 6 Editorで書き出した2つのボイスバンク間であれば一致しますが、たとえば片方を自分で歌った歌声にすると、キレイに行かないのです。ある意味、2つの声がミックスされたような妙な音になってしまいます。これは仕組み上仕方がないところなのですが、うまく使えばVOCALOID 6に限らず、他の歌声合成ソフトなどでも活用できるかもしれません。

Ability Pro 4.0だけでなく、Cubase Pro 12でも問題なくXSynを使うことができた

そんなXSynのほかにも2つのプラグインがインターネット社によって公開されています。それぞれ簡単に紹介していきましょう。一つはAir FXというVST2/AU(WindowsおよびMac)のプラグインで息の成分と口の開き具合をコントロールできるというもの。これも紹介動画があるので、これを見るのが分かりやすいと思います。

いかがですか?VOCALOIDでブレス成分を調整するのとはだいぶニュアンスが違い、リアルに息の成分をコントロールできているのが分かると思います。このプラグインも、当然VOCALOID上で使うものではなく、一度WAVで書き出した後にDAW上で使う機能ではありますが、こちらはVOCALOID 6に限ったものではなくCeVIO AIやSynthesizer Vなど、ほかの歌声合成ソフト、さらには人間のレコーディングンぐしたボーカルにも使えるので、かなり幅広く使えるエフェクトだと思います。

歌声の息の成分や口の開き具合を調整できるプラグインAir FX

そして3つ目のFormant Shift 2については、Megpoid AIのリリースタイミングで付属していることが発表されていたので、10月13日の記事「AI歌声合成に対応したVOCALOID 6が発表・発売に。インターネットからはAI Megpoidが同時リリース」の記事の中でも紹介していました。これはまさに名前の通りでフォルマントを調整するプラグインなので、声質を男性っぽくしたり女性っぽくしたりすることが可能となっています。これもVST2/AU(WindowsおよびMac)対応のプラグインとなっていますね。

声質をコントロールできるプラグイン、Formant Shift 2

これらXSyn、Air FX、Formant Shift 2という強力な3つのプラグインがVOCALOID 6 voicevank AI Megpoidに付属してくるのですから、かなり魅力的ですよね。正確には、製品を登録するとプラグインのライセンスが付与されインターネット社のサイトからダウンロード&インストールできるようになる形になっています。

ちょうど11月30日の15時までインターネット社ではブラックフライデーのセールを実施しています。音楽制作ソフト、サウンド編集ソフト、スピーカーシミュレーター、音声出力・入力マルチエフェクトソフト、VSTインストゥルメント、VSTプラグインエフェクトなど、ダウンロード版ソフトが最大50%オフとなっています。

ボイスバンクのAI Megpoid単体やVOCALOID6 Starter Pack AI Megpoid単体は対象外となりますが、ABILITY 4.0 Elementsクロスアップグレード版とのセットやVOCALOID6 Starter Pack AI MegpoidとV4 Megpoid Complete、Megpoid Englishの期間限定セット商品が割安で購入できるのでチャンスだと思います。

 

XSynの開発者、インターネット・村上昇社長インタビュー

オンラインインタビューさせてもらったインターネット社長の村上昇さん

--今回XSynの突然の発表には驚きましたが、これはどういう経緯で開発したのですか?
村上:本来であればヤマハさんにVOCALOID 6の機能として復活させてもらいたかったのですが、残念ながらそうならなかったこと。また実際にVOCALOID 6リリース後に、ユーザーのみなさんから、クロスシンセシス復活を願う声をSNSなどで数多く見たので、なんとかいい方法はないかと開発することにしたのです。

--このXSynは、何と読めばいいのでしょう?クロスシンセシス!?
村上:とくに読み方は決めていません(笑)。クロスシンセと呼んでもらっても、エックスシンと呼んでもらっても何でもいいですよ。

--サイドチェインを使うというちょっと特殊な使い方になっていますが、どんな処理をしているのでしょうか?
村上:やや専門的な話になりますが、元の音声に対し、ターゲットとなる音声のスペクトル包絡を当て込んでいるのです。仕組み的にはVOCALOID 4に搭載されていたクロスシンセシスとほぼ同じ手法を使っているので、近い感じになると思いますよ。

--VOCALOID 6に限らずいろいろ使えそうではありますね。
村上:スペクトル包絡を当て込むという方式であるため、タイミングにシビアで、ズレてしまうとうまく効かなくなってしまいますが、VOCALOID 6である必要はありません。VOCAOID 4同士でももちろん使えます。ほかの音声合成ソフトがどうかは、まだちゃんと検証していませんが、タイミングさえ合わせられれば使えそうではありますね。

--今回XSyn、Air FX、Formant Shift 2をAI Megpoidユーザーに配布というのは、なかなかの太っ腹だと思います。
村上:そうですね、でもVOCALOIDユーザーにとっては非常に有用なプラグインとなるため、全体を活性化させる意味も含め、私自身が開発しました。もっとも、この3つのプラグイン、用途や効果はそれぞれまったく違うけれど内部的なエンジンは同じものを使っているんです。その応用の仕方によって、3つのバリエーションになったという形ですね。

--フォルマントシフトは他社製品でなかったわけではないと思いますが、とくにXSynやAir FXは独自性も高く強力なプラグインなだけに、単体で買いたいという人も多そうです。そこへの対応はいかがですか?
村上:現時点においては、AI Megpoidユーザーへの配布のみと考えており、今後の個別販売の予定もありません。ぜひAI Megpoidとともにご利用いただければと思います。今後も、いろいろな形でユーザーへ還元していければ、と思っております。

--ありがとうございました。

【関連情報】
VOCALOID 6 voicevank AI Megpoid製品情報

インターネット・ブラックフライデーキャンペーン情報

【価格チェック&購入】
◎shop.ssw.jp ⇒ AI Megpoid(ダウンロード版/パッケージ版)
◎shop.ssw.jp ⇒ AI Megpoidスターターパック(ダウンロード版/パッケージ版)
◎DL site ⇒ AI Megpoid(ダウンロード版) , AI Megpoidスターターパック(ダウンロード版)
◎Amazon ⇒ AI Megpoidスターターパック(パッケージ版)