今日は、同人音楽イベントM3で私が買ってきたCDの感想をお送りいたします。
【前置き】
2018年末にテクノスピーチから「新しいAIシンガー技術ができたよ」という感じのリリースがあったんです。
で、この技術を使ったCDが出ると聞いたので、今日買ってきました。
CDの詳細はこちらから
私はCD買いましたが、買ってない皆様はこちらの動画をご覧ください。
【聞いてみた】
曲
良い曲です。MVが勝手に頭の中に流れてきます。
ささらさんの歌
このCDには歌声補正したバージョンと補正してないバージョンと歌声のみバージョンが収録されているのですが、まずは補正バージョンを聞いた感想。
音質
CeVIOをはじめとする学習系の「学習系っぽいカンジ」がかなり緩和された歌声になっています。だからといって波形接続っぽいかというとそんなことはない。たぶん、最も正しく言うなら「"最近のディープラーニング系歌声合成の音" ってこんな感じなのか~」って感じですね。マイクロソフトのりんなと確かに近い。
声質
歌っているキャラとしては「さとうささら」ということになっています。実際のところささらさんっぽいかわいげのある声をしていますが、より中の人=水瀬いのりさんっぽさが強く出ている気がします。水瀬さんの歌聞いたことない方はちょっとわからないかもしれないので、水瀬さんの歌もちょっと貼っておきます。
水瀬さんとささらさんだとどっちに近い声質かというとささらさんですけど、「一緒に並べて聞いたらささらさん寄り、単体で聞いたらささらさんとは言い切れない」くらいのカンジ。
歌い方
CeVIOと比べるとかなり人間です。調声をやっていない状態で比べれば全くの別物です。確実に水瀬さんの癖を拾っています。個人的にはファルセット・低音の歌い方と力が入ったときのノート初めのピッチが中の人っぽいと感じました。
逆に、水瀬さんのビブラートはあんまり反映されてない感じがしました。水瀬さんのビブラートは音量がそこそこ大きく震える(同時にピッチが動く)んですが、今回のささらさんはかなり違うビブラートで歌います。
音素
これは私しか重視してないポイントかもしれないですが、声紋閉鎖がかなりうまいです今回のささらさん。もともと中の人も母音が連続するときに声紋閉鎖を挟みがちですけど、それが綺麗に出せています。そういえばCeVIOのささらさんも母音が連続するときにそこそこ音を切る(閉鎖というほどではない)ので、TMGで滑らかにする作業をよくやりますね。中の人由来だったか。
補正なしバージョン
かなり音を外します。これは、言い方おかしいかもしれないですけど「さすがディープラーニング系」といった感じです。高い音程になると上に外しがちです。あと急に音程が下がる場所で下がり切らないこともある。この辺は最終的に「音楽制作用ツール」になることを考えると邪魔なのでどうにかすると思うんですが、「人間に近づける」という観点で言うと、かなり人間です。「あぁ~確かにそうやって外して歌う人いるわぁ~」ってなる。あるあるネタができるようになるとディープラーニング系の本領発揮って感じです。
【ボーカルを分析してみた】
音程
ちょっと解析してみたところ、音程は上に外しがちですね。WAVES Tuneをただ単にかけっぱにしてれば何となくいいカンジにしてくれます。音程外すのも別に頻度が高いわけじゃないので、自動補正でそこそこ大丈夫なくらいです。
ノートの最初=子音部分で音程が大幅に下がります。
この、ピッチカーブが下向きにとがってるところが大体すべて子音です。これは単なる癖なので、聞き手の好みに合うかどうかだけがポイントですね。
音量
波形を見てみるとかなーり音量のブレはあります。めっちゃ人間っぽい波形。
ちなみにCeVIOはこんな感じ。めっちゃ整っている。
CeVIOはそもそも数ある歌声合成の中でも音量のブレは少ないほう(最も少ないのはUTAU)なのでこの差は顕著です。
試しにコンプレッサーでレシオ8にして、常につぶしてるくらいにすると、波形はCeVIOに近くなり、個人的にはめちゃくちゃ耳になじむ音になりました。確実にボカロ耳になっているのを実感した。
余談ですが、ロングトーンの終わりあたりの波形は「あ、これSinsyっぽい」って思う形をしていました。理由はわかりません。中の人の癖が似てるからかもしれません。
IA English
英語IAのコーラスも入っています。こちらも上手に人間のように歌いますが、ささらさんとくらべて音程を外しにくいです。音程がそんなに変わらないフレーズを歌ってるからかもしれませんが。
【まとめ】
と、このようにAIシンガーの歌は、中の人(人間)や既存技術(CeVIO等)と比べるとその特徴がより鮮明にわかります。CD買ってよかった。
スポンサーサイト