この前、Sharpkeyを作っていたBoxstarさんが「DeepVocal」という歌声合成ソフトを発表しました。一般公開はまだですが、私も先ほど早めに手に入れたのでレビューします。
【DeepVocal】
パターンA Sharpkeyさわったことない人向け DeepVocalは比較的シンプルな作りの歌声合成ソフト。詳しいことはこのSharpkeyの説明ページを見てください。歌声合成ソフト「Sharpkey」大体同じソフトだが、ちょっと重要な機能が減ってたりする。ノートを打ち込んで歌詞を流し込んだら大体歌う。出音は硬め。
音量や息成分のコントロールパラメーターはVOCALOIDやSynthVのパラメーター同様に描ける。ピッチカーブはCeVIOのように直接手描き可能。UTAUのように音素の差し替えができたりもする。
個人的には子音や母音の長さや遷移スピードをグラフィカルにいじれるところがおすすめポイント。CeVIOのTMG機能の荒い版/VOCALOID5の音素引き延ばしみたいな機能。
#HTU_Sharpkey
— くろ州の記事と作品 (@96s_kM4osM) 2018年9月25日
タイミング/Phoneme
子音の長さや母音のアタックリリースをグラフィカルにエディット可能 pic.twitter.com/W4r1lBJZyk
パターンB Sharpkeyユーザー向け
基本的にSharpkeyと同じだが、エディットできる項目は「ボリューム/ピッチ/ブレシネス/タイミング/サンプル」に減っている。パワーとモーフィングが落ちちゃってるのはかなり残念。シーケンスデータの拡張子は「.dv」でSKファイルやVSQXも読み込める。もちろんSharpkeyでDVファイルを読み込むことはできない。
実は一部のSharpkey用音源が利用できる。とりあえず確認できたのは幻晓伊/Kiana/元筱と勇気。稲荷(Inari)と索韻リラはできなかった。
【DeepVocalToolBox】
DeepVocalで使える音声ライブラリを作るツール「DeepVocalToolBox」も試しました。
音声ライブラリの作り方
1.音声を録音します
OREMOで録音すればOK。DeepVocalもおそらくは伸縮範囲(UTAUでいうところの子音固定範囲-右ブランク)が長いほうが好みだと思うので、4モーラくらいのCVVCリストを遅めのBPMのガイドBGMで録音すればいいんだと思われる。この辺はまた触りながらチェックしていく。
2.原音設定します
基本的にはCVVCと似た感じの設定。CVはUTAUでいうところのオーバーラップ/先行発声/子音固定範囲/右ブランクが設定できる。VCはDeepVocalの場合「VX」と表記されるが、オーバーラップと先行発声っぽい何かの2つだけ設定するようになっている。
UTAU音源の自動コンバートはとりあえずできなさそう。エディターはスペクトル表示が綺麗でいいけど、SetParamと比べると、タイミングを耳で聞いて合わせる機能がなかったりしてもろもろ親切ではないので、慣れてもかなり時間かかりそう。波形とスペクトルだけで原音設定できないとちょっと厳しい。
原音設定のメソッドはUTAUと近いような遠いようなという感じ。そもそも設定するポイントの数が違うので何とも言い難い。
「さ(先頭じゃないサ行ア段)」の設定はこう。大体わかる。
「a_s(サ行につながるVX)」の設定はこう。
1.SPはなんとなくわかる。オーバーラップのようだ。2.EPはいったい何をやっているんだ? よくわからないが、とりあえず子音の始まるポイントや子音が終わるポイントに移動させてみたら、合成した時に子音がダブってしまってダメだった。大体CVの1.CPと同じ位置に置いておくのが無難っぽい。
エイリアスは基本ローマ字で命名する。ひらがな命名できた方が何かと便利なので方法を探っているが、今のところ発見できてない。
そんなこんなで原音設定をやっていく。VCVに対応できないのか? という問いに対しては「おそらく不可能ではないが現状正式には対応してないため、すげぇ頭を使って裏技的なことをしないとできない」という答えになる。
3.発音辞書を作る
この音源にはどんな子音があって、どんな母音があるのかを全部記述する。Presamp用の音素設定みたいなもの。余裕があったらそのうちテンプレート作って配布するかも。
4.音源をビルドする
一通り設定が終わったら音源をビルドします。周波数表の作成みたいなことをやってDeepVocalで使えるようにパッケージ化する作業。ボタンを数回ポチポチするだけなので難しくない。
ちなみに、音源制作すると、制作データが入ったDVTBファイルがテキトーに生成される。これがなければ音源編集できないし、これがあれば音源編集できる。つまり、DeepVocal用音源を配布するとき「音源編集を許すならDVTBを同梱する、編集されたくないなら同梱しない」ということができる。一種のプロテクト。
これで完成です。UTAU音源制作技術勢がこの制約のなかでいかに能力を発揮してくれるか楽しみです。
【関連資料】
DeepVocalは大体Sharpkeyと同じなのでSharpkeyの資料が使いまわせたりする。
スポンサーサイト