FC2ブログ

タイトル画像

UTAU式歌うボイスロイドを連続音でやってみたい

2019.03.18(02:26) 363

「UTAU式人力」というジャンルがあります。アニメやゲームやの声優さんの声を録音して、UTAU音源化して歌わせるものですね。

「UTAU式歌うボイスロイド」ならVOICEROIDの音声を録音してきてUTAU音源化すればいいわけですね。

ただ、せっかくほしい音素を的確に録れるんですから、人力よりも都合のいいやり方でやりたい。
単独音音源にしても面白くないので連続音音源にしてしまいましょう。

というわけで、やってみました。

比較的歌ボの民向けの文章です。

【概要】
UTAU式歌うボイスロイド(連続音)に挑戦

【方法】
0.UTAU用の録音リストをVSQXにする
1.それをKotonoSyncでボイロに歌わせる
2.KotonoToneで音声をなだめる
3.UTAU音源として原音設定

UTAUも歌ボも知っている人はなんとなくわかるかもしれませんが、ヒクほど時間がかかります。

【やってみよう】
0.UTAU用の録音リストをVSQXにする
まずは、下準備として録音リストをVSQXにします。

UTAU音源制作では、「録音リスト」を中の人がひたすら読んで録音します。これを今回はVOICEROIDにやってもらいます。

今回の録音リストはくろ州式8モーラ連続音。特に意味はありません。

連続音なので、最終的にできる音声ファイルは150個以上で、文字数は1000以上です。

連続音というのは「あ」とか「か」とかを単体で録って音源にするのではなく、「ああんいあうあ」「かかんきかくか」と、ある程度の文字列にすることで合成結果を滑らかにする手法・音源形式の名前ですね。

これをVOICEROIDが歌えるようにまずVSQXにします。

普通にVOCALOIDでノートを打って、歌詞を流し込みするだけです。コピペとメモ帳の変換機能だけでできるのでここは秒で終わる。

1.KotonoSyncでボイロに歌わせる
出来たVSQXをKotonoSyncに読ませてVOICEROID調整をします。

VSQXは前半と後半に分かれました。あまりに長かったので。それぞれ700近いノートが並んでいます。

これを自動調整したところ、なんと、一つ3分ほどで終わりました。

音程変化は一切なく、ノートの長さもほぼ一定だったのが効いてるのかも?

調整終了したら1文ごとに区切って複数ファイルに書き出します。

いらないファイルを全消しして、リネームソフトでファイル名を「録音リストのラベル」に変えます。

書き出した直後は

temp1.wav
temp2.wav
temp3.wav
……

ということになっていると思いますが、これを

_ああんいあうあい.wav
_いいんういえいう.wav
_ううんえうおうえ.wav
……

に変えます。これは必須。ただ、リストは最初からTXTファイルとして存在するので、リネームソフトを使えばこれも秒で終わる作業です。私は「LiName」というフリーソフトがEXCELと併用すると一番簡単だと思いました。

2.KotonoToneで音声をなだめる
繰り返し感がヤバイ箇所をKotonoToneで綺麗にします。早い段階でやっておかないとUTAUで合成したときに音声が変になるのでまず最初にやります。

なんつってもファイルが150以上あるのでこれがヒクほどかかります。

ほぼすべて(=1000以上)のノートでKotonoToneかけないとだめです。一つのノートの継続時間が0.4秒ほどと長いので。

3.原音設定
UTAU音源を「正しいタイミングで正しく歌わせる」ための作業が原音設定です。

歌ボの場合、音声はほぼ正しいタイミングで保存できているので、あとはツールのほうで自動設定すれば大体大きな破綻はしません。

とはいえ秒では終わらないので、しばらく作業します。

これでUTAU式歌うボイスロイドの連続音音源が完成しました。1音階だけ。

音域を広げようと思うならこれをあと2セット以上やる必要があります。
感情別に音源を作り分けるならその4倍かかりますね!

歌わせるのはもう簡単。ピッチもタイミングもUTAUのほうで自由自在です。

連続音であれば滑らかさも普通に担保できますが、歌うボイスロイドの超いいポイントである「無声化」がほぼ使えません。

用意すればもちろん使えますが、量が本当にえぐいのでマジでやりたくない。しかも、これに関してはたぶんVOICEROIDのエディターのほうがよっぽど得意だと思うので、必要ならその都度作るのがいいのかもしれない。

ヒクほど長いのは確かだけど、私が想像していたほどは長くなかった。
スポンサーサイト





くろ州の合成音声備忘録


その他歌声合成 トラックバック(-) | コメント(0) | [EDIT]
<<大学4年間を歌声合成基準で振り返ってみる | ホームへ | 超雑にパソコンの性能を調べる>>
コメント
コメントの投稿













管理者にだけ表示を許可する