FC2ブログ

タイトル画像

私式DeepVocal音源制作まとめ1

2019.07.20(01:42) 397

 今週初めにDeepVocalの音源制作ツール「DeepVocalToolBox」が公開されて、UTAU各所で話題になったりならなかったりしていますが、マニュアル読んでも音源制作に必要な情報はそろわないので一回まとめてみましょう。

 この記事では「私式」の音源制作を解説します。たまに公式情報とは違う部分も含まれるので、「絶対に公式じゃないと嫌」という人はブラウザバック推奨です。

【用意するモノ】
 DeepVocal音源を作るのに必要なモノは以下の通り

・DeepVocal:作るのに入らないがチェックに必要
・DeepVocalToolBox:音源作るソフト
・OREMO:UTAU用録音ソフト
・録音リスト:後で解説
・ガイドBGM:後で解説
・マイクとかとか:用意して

 これらに加えて、ノイズ除去ソフトとか波形編集ソフトを用意しといてもよいと思う。

【音源制作の流れ】
録音:声を録ります
→発音辞書作成:どんな音素が使える音源なのか教えます
→原音設定:頑張れ
→音声モデルの生成:周波数表みたいなものを作ります
→音源ビルド:配布できる形にします
→ファイル整備:READMEとか歌詞辞書とかを詰めてZIP

【録音】
 UTAU音源制作の経験があればまず問題なくできるでしょう。ただ、マニュアルにはどんなリストを使えばいいとか細かいことは書いてないのでここで示しておきましょう。

・リスト
 CVVCリストを使います。CVVCリストなら大体なんでも大丈夫。肺活量と相談して何モーラリストにするか決めてください。

 個人的には「_あR」「_いR」……みたいな母音単体のセクションがあったほうがいい気がする。なくてもかけらも問題ないけど。あと、DeepVocalは頑張ればCVVCでハ行の子音の打ち分けが完璧にできるので、ハ行が連続音になっているリストを使うのも一つの手だと思う。

 結果、私のおススメは「くろ州式4モーラあは連CVVC」「くろ州式8モーラあは連CVVC」です。「くろ州式8モーラあは連CVVC」に関しては、DeepVocalと大体同じエンジンを積んでいる「Sharpkey」唯一の日本語音源でも使われた実績があるので安心。唯一の日本語音源主導して作ったの私だけど。

 ちなみに私はこんなリストで収録した。

_a
_aR
_i
_iR
……
_k
_-k
_s
_-s
……

「_a」と書いて「ああんいあうあ」と読み、「_k」と書いて「きかくけこかんか」と読む。リストが完全に頭に入ってる人向け。こっちを使うと後々ちょっと楽になる。

・ガイドBGM
 テンポは100~120程度がよさげ。原音が長ければいいというわけでもないので、これ以上遅くする必要はない。速くしてもいいが、推奨はしない。

・収録
 録音はUTAUをとるときと一緒。ただし、音声モデル生成のときに失敗しやすくなるので、しゃくりやビブラートをつけたりするのはNG。安定した綺麗な波形になるように歌ってください。波形を見て「何このきれーな波形? うち天才か?」って思えるくらいを目指そう。

【発音辞書】
 DeepVocal用の原音がそろったら、いよいよDeepVocalToolBoxを立ち上げる。メニューの「function」から「Phonetic Dictionary」を選ぶと「発音辞書ウィンドウ」が出てくる。

 ここではひたすら「音源が歌える対応音素」を書き連ねていく。

 1番のタブは発音記号リスト。例えば「ka,k,a」という風に書き込むと、「この音源では『ka』と歌詞入力すると、子音=k、母音=aを発音するよ」という意味になる。これを全発音分指定していきます。

a,a,a
i,i,i
u,u,u
e,e,e
o,o,o
N,N,N
ka,k,a
ki,ky,i
ku,k,u
ke,k,e
ko,k,o
……

 ぶっちゃけめんどいので私のほうでテンプレート用意しておきました。使ってやってください。

 これ「歌詞,子音,母音」という並びになっているという理解で別にいいんですが、正確には「歌詞,直前のVCの子音,直後のVCの母音」だという風に考えると応用が利かせやすくなります。

 例えば「ki,ky,i」歌詞は「ki」なので、子音は「k」だと思うかもしれないですが、「ky」が正しいです。

 仮に「あきた」と歌わせたいとしましょう。このとき、UTAUのCVVCなら[- a][a ky][ki][i t][ta]という風に音素を繋ぐでしょう。この[- a][a ky][ki][i t][ta]太字部分。これを発音記号リストに連ねているのです。

 実質的に「ky」は子音だし「i」は母音だけど「kiと歌わせるときは直前に『x_ky』が来て直後には『i_x』が来るよ」ということを規定していると考えるといろいろ応用できるようになります。

 「あした」と歌わせたいとしましょう。しかもただ「あした」と歌わせるのではなくて「a sh ta」と無声化を起こした歌い方にしたいとしましょう。これを「a」「shta」という2音節だととらえてやると、発音辞書は「shta,sh,a」になります。なぜでしょう。

 [- a][a sh][shta]とつなぐからです。あとは頭の使いよう。

 2番目のタブは母音リスト。これは特にめんどくさくないし難しいところもないので解説はスルー。
 3番目は無声子音リスト。無声子音を書くだけです。これもスルー。
 4番目は有声子音リスト。もちろんスルー。

 無声音有声音はわかるよね? と思っているが、わからなかったらググってください。

 ここまでが基本の4リストです。音源制作するときには絶対に書き込まないといけないところ。

 5番目は独立発音リスト。ブレスやセリフといった小ネタを仕込むのに使います。独立撥音リストに登録した音素は、実際に使うときにピッチシフトをしないで再生されます。

br1
br2
br3
br4
br5

という風に書き込んで、それぞれにブレスを1個ずつあてはめれば、ブレスをノートとして打ち込めるようになります。

 6番目は語尾記号リスト。語尾息や喉切りを作るのに使います。

H
T

という風に書き込むと、[a][H]とノートを打てば語尾息に、[a][T]と打ち込めば喉切りにすることもできます。

 5,6番目のリストはオプションなので作らなくてもOK。

 辞書を作り終わったら画面下の「Check Dictionary」を押すこと。エラーが出たら適宜修正。

 長くなってきたので次回に続く!
スポンサーサイト





くろ州の合成音声備忘録


制作 トラックバック(-) | コメント(0) | [EDIT]
<<私式DeepVocal音源制作まとめ2 | ホームへ | DeepVocalの音源制作>>
コメント
コメントの投稿













管理者にだけ表示を許可する