fc2ブログ

タイトル画像

私式DeepVocal音源制作まとめ2

2019.07.20(02:44) 398

 前回に引き続いてお送りします。

【原音設定】
 発音辞書ができたら次は原音設定です。この作業「簡単だがかなりめんどい」ので覚悟するように。

 メニューの「function」から「Build Voice Config」を選ぶと原音設定画面が出る。ここで

1.原音があるフォルダを指定
2.原音設定したいWAVEファイルの名前を書き込む
3.エイリアスと音階名を書き込む
4.「New markers」ボタンを押すと音声表示ウィンドウが出る
5.原音設定
6.確定ボタンを押す
7.次へ

の繰り返し。特にめんどいのが2番。「ああんいあうあ.wav」の設定が一通り終わったら次は「いいんういえい.wav」という風に、いちいちファイル名を書かないといけない。手書きするにしてもコピペするにしてもまぁめんどい。

 そこで、私が使ってるこのリスト。

_k
_-k
_s
_-s
……

 これなら打ち込みの手間がかなり省略される。全然違うぞ。

・作るべきエイリアス
 基本的にはUTAUのCVVCと同じように作っていけばOK。CVVCとはいっても「母音単独音切り出し済みCVVC」です。

 「_きかくけこかんか.wav」からは[-ki][i_k][ka][a_k][ku][u_k][ke][e_k][ko][o_k][N_k]が切り出せます。

「あ」のエイリアスは

[-a]
[a]
[a_x]
[x_a]

が必要。[a]エイリアスは[-a]と全く同じ設定でいいのでコピペで。単独音を切り出さないと絶対に母音が鳴らない音源になります。

・実際の設定「持続性の有声音」
 DeepVocalの原音設定には主に「持続性の有声音」か「それ以外」の2種類のメソッドしかない。

・実際の設定「その他」


・実際の設定「母音連続音」
前の母音の安定終わりに1番
後ろの母音の安定始まりに2番

・実際の設定「語尾息」
前の母音の安定終わりに1番
息を吐き切ったあたりに2番

・実際の設定「ブレス」
ブレスが始まる少し前に1番
ブレスが終わる少し後に2番

・「ん」
 「ん」のエイリアスは「N」が基本。「n」でも動くが、ナ行の子音と混同する恐れがあるので私は「N」を使う。「ん」は母音と同じ扱いなので、切り出すエイリアスは

[-N]
[N]
[N_x]
[x_N]

 となる。

 「ん」にこだわる人には、ナ・タ行につながる「Nn」、マ・バ行につながる「Nm」、カ・ガ行につながる「Ng」などを設定することをおすすめする。こうすると「じゃーんけーんぽーん」と歌わせようと思ったときに[ja][Ng][ke][Nm][po][N]という風に「ん」の打ち分けが可能となる。

 発音記号リストには「Nn,Nn,N」「Nm,Nm,N」「Ng,Ng,N」を追加。母音リストには「Nn,Nn」「Nm,Nm」「Ng,Ng」を追加。

 [N_x]系のエイリアスは「Nn_x」「Nm_x」とする必要はない。発音リストに「Nn,Nn,N」と登録するので実際に接続するときは[x_Nn][Nn][N_x]とつながることになる。「N_x」系エイリアスはたいてい自然と「Nn」や「Nm」になってるので特に問題が発生しない。というか、これをやってしまうと、正しく「ん」の発音を選ばないと鳴らない音素クイズ音源になってしまう。

・他音階音源での原音設定の使いまわし
 UTAUでいうところの「oto.ini」にあたるのは「voice.dvcfg」ファイルです。本体には原音設定の使いまわし機能がないので絶望する他音階勢もいるようですが、メモ帳を使えば何とかなる。

【音声モデルの生成】
 原音設定が終わったら、UTAUでいうところの周波数表にあたる「音声モデル」の生成を行う。
 メニューの「function」から「Build Voice Bank」で出てくるウィンドウで操作する。

 原音が入っているフォルダを指定して、とりあえず「All setted......」のほうにチェックを入れておく。音声モデルを保存する場所を指定したら「Build Voice Model Files」ボタンを押す。ログファイルを保存するように言われるので「Log1」とかテキトーに名前を付けて実行。

 しばらく待てば出来上がり。エラーが出たら原音設定か、音階名を確認する。原音設定のときに音階名を間違って入力していると、音声モデル生成で盛大にエラーを吐くことになるので注意。

 原音設定の修正でエラーが消えることもなくはないが、たいていの場合は原音がしゃくってるとか発音がおかしいとかの問題なので、おとなしく再収録するのがいい。

 修正したら、もう一度音声モデルを生成する。今度は「Please input......」のほうにチェックを入れて、修正した=エラーが出てたエイリアスを書き込む。「Overwrite......」にチェックを入れて同じく実行。

 実はエラーが出てても歌えたりする。

【音源のビルド】
 同じ画面で音源のビルドもできる。「A3,D4,G4,C5」という風に音階名を書いて、音源の名前を書いて、書き出す場所を指定して「Build Voice Bank」ボタンを押す。ログファイルの保存先をテキトーに指定すればビルドが始まる。こっちはマジで一瞬なのでほぼ待ち時間はない。

 こちらも結構エラーが出るが、無視して問題ない。

 出来上がった「SKC」「SKI」「voice.sksd」の3つが音源ファイル。これだけ配布すればとりあえず歌ってもらえる。原音や音声モデルを配布する必要はない。

【配布ファイル】
・SKC
・SKI
・voice.sksd

だけ入れてZIPにすれば最低限OKだが、このほかに

・キャラ画像.png
・README.txt

とか、UTAUでもよく入れるやつを入れておくとよい。

加えて、入れておくと便利なのが「歌詞辞書」ファイルだ。

 「キャラ名.dict.txt」というただのテキストファイルだが、これを入れておくと、DeepVocalで歌詞入力をするときにひらがなが使えるようになる。もちろん、辞書に書き加えればカタカナも行ける。VSQX読み込みのときに便利な機能なんかを付け加えることもできる。

 ここまで触れていなかったが、基本的にDeepVocalはひらがなでの歌詞入力に対応していない。発音辞書のほうで「か,k,a」のようにひらがなを指定することでひらがな入力に対応させることもできるが、これをやってしまうと、MIDIやVSQXを読み込むときに「全歌詞を手作業で打ち直さないといけない」事態になるのでおすすめしない。ひらがな対応は歌詞辞書で。

 この歌詞辞書も作るのはちょっとめんどいのでテンプレートを借りてくるのが手っ取り早い。

 これはSharpkey用音源ですが、この中に「キャラ名.dict.txt」がいくつか入っているので、参考にするなりコピペして使うなりしましょう。稲荷(Inari)を使ってくれてもいいのよ。

 とまぁ、こんな感じでDeepVocal用音源は作れます。噂ではそのうちUTAU2DeepVocal音源コンバーター的なものも登場するかもしれないので、めんどいわーという方はそれを待ってみてもよいのでは。
スポンサーサイト





くろ州の合成音声備忘録


制作 トラックバック(-) | コメント(0) | [EDIT]
<<「歌声合成ソフト名 -くろ州」で検索してみた | ホームへ | 私式DeepVocal音源制作まとめ1>>
コメント
コメントの投稿













管理者にだけ表示を許可する