FC2ブログ

タイトル画像

熟練者の思う各UTAU録音形式のメリットデメリット

2019.06.06(09:22) 387

 UTAUに限らず、長いことやっているとガチの初心者だったころの記憶って思い出せないもので、私も初心者の気持ちはわからなくなってしまいました。なので、たまに実験としてガチ初心者捕まえて説明なしに音源収録させる生体実験をやってみたりするマッドサイエンティストみたいなことをやったりもします。

 UTAU界隈ではよく、単独音/CVVC/連続音のメリットデメリットみたいな話が出ます。TLに流れてるので、確かにねーそうだねーと思いながら見てるんですが、「初心者にとってのメリットデメリット」と「熟練者にとってのメリットデメリット」って別モノなんですよね。立場によって「良い」が変わるのです。

 なので、熟練者の方々もどうにか初心者目線に立ち返って(もしくは熟練者の目線から)初心者に録音形式の説明をするとすれ違ったりもするんですね。

 私はもう初心者の頃を忘れて「もうあの頃のピュアな私は居なくなったんだ……」って感じにけがれてしまったので(最初からけがれてた説もあるが)、初心者向けに熟練者が考えていることを開設しようと考えた。

【単独音】
 単独音といえば、「_あ」から始まるリストが特徴的。実にシンプル。そう簡単に読み間違えないし、読み間違えてもすぐ治せる。原音設定も少ないし、パッと歌わせようと思うと簡単で便利。

 正直なことを言うと、超絶単独音大好きじゃなければ、長らくUTAUやってる多くの人はもうしばらく単独音を録音してないと思う。私も実験でしか使わない。基本的に連続音形式で録音して、特殊な発音を追加したい場合に単独音音源を作るというパターンならたまに見る。

 多分、熟練者の思う単独音のいいところは「短時間で収録できる」ところにある。これがどう良いかというと「無茶な発音ができる」ということなんだと思う。無茶な発音を長時間続けるのは難しいが単独音なら耐えきれる。ということで癖のある表現をしたいときに有効だったりする。

 音源ごとに違うし、好みもあるから全員がそうとは言いにくいが、単独音での調声は案外むずい。私が思うのは「この音源のいいところを十分に引き出す力が私にはない」という感じ。

 初心者にとっては最も「見やすい」形式だと思う。

【連続音】
 連続音といえば、「_あんああいあうあ」から始まるリスト。収録時間はかかるが、滑らかに歌わせるのが簡単だ。物量で殴るタイプなので初心者には優しくなく、熟練者も最初から初心者に連続音を勧めることはそんなにない。私は鬼畜なのでやるけど。

 今の時代、連続音が正義みたいな風潮は普通にある。なぜかというと「使うとき簡単だから」なんだな。「初心者向けの録音形式」って言って説明するときは大体「録音/原音設定」の話になりがちなんだけど、連続音はこの点ではメリットがない。読みにくくて時間がかかって原音設定量が多い。

 重要なのは「目線がどこなのか」だと思う。「作る人目線」なのか「使う人目線」なのか。

 連続音は「プラグインが使える」「UTAU上で作曲しない」という条件の中で非常に「簡単」に「使える」音源形式だ。素の状態でもそこそこ人間っぽく聞こえる。

 ただまぁ作るときのことを考えると、連続音は本当にむずい。「_てぃてぃんとぅてぃててぃとぅ」を初見でスラスラ読める人なんて見たことないし、「_あんああいあうあ」を正しく読み上げられる人もそうそういない。

 原音設定量は多いけど、熟練者からすると「最も簡単」だと思う。シビアに設定しないといけないポイントが特にないので、何となく設定してもちゃんと使えるものが出来上がる。ほかの形式は案外そうもいかない。初心者からすると原音設定は等しくすべてわけわからんので、量が少ないのが正義なのだ。

【CVVC】
 CVVCは単独音張りに収録時間が短くて、連続音に近い滑らかさを実現する音源形式だ。熟練者が音源制作初心者にお勧めしたい録音形式の一つでもある。

 初心者だとCVVCわからないという人も多いと熟練者は考えている。実際に多いのかは統計を取ってないのでわからないが、まぁ多分多いんだろう。「初心者に嫌厭されがち」「作る労力は単独音+α」「単独音と比べて拡張性がある」みたいなところからお勧めしたくなる心理が働くんだと思う。

 CVVC音源は熟練者にとって「単独音と同じくらいの労力で録音できる」形式だといえる。場合によっては「単独音より楽かも」という人もいる。私も収録時間という点では同じ意見だ。慣れてくると、「CVVCって5分アニメ見ながら録音してたらなんかできてた」ばりに楽。

 ただ、初心者がそうとは限らない。初心者に易しくないCVVCリストを見てみよう。

「_てぃたとぅてとたんた」

 「連続音やんけ!」ってなる。連続音ではないんだけど。実は「収録時間」だけが簡単さの指標というわけではないんだな。次に比較的初心者に易しいCVVCリストを見てみよう。

「_たた」

 「これは読めるわ」ってなる。熟練者からするとわざわざこのリストを使うメリットはあんまり感じないけど、これなら全然読める。ちなみに「2モーラCVVC」リストだ。

 CVVCリストで収録した音源って単独音音源にすることもできる。そのうえ、しばらくたってから「音源をパワーアップさせたいなー」とか思ったら、録音しなおさなくてもCVVCにアプデできるので、「将来性」を見て熟練者はお勧めしたくなる。中堅以上の人だと「単独音か~CVVCとか連続音だったら使いやすかったんだけどな~」とか思うこともあるので、使われやすさという面でもお勧めしたくなったりもする。

 しかし、当たり前なんだが「単独音も単独音音源作れる」んだな。「_てぃたとぅてとたんた」って読んで単独音作るのと「_た」って読んで単独音作るのだったらどう考えても後者の方が楽じゃん?

 原音設定も割とシビアで、子音がちゃんと発音できてないと熟練者でも原音設定には困ることが多い。

 ただ、拡張性があるのは確かなので、余裕があれば収録してほしい。私もそう思う。

【まとめ】
 初心者は自分の思うメリットにあうものを作ればよい。絶対にCVVCを作れという話でもなければ、単独音がダメという話でもないことだけは押さえておいてほしい。
スポンサーサイト





くろ州の合成音声備忘録


制作 トラックバック(-) | コメント(0) | [EDIT]
<<新歌声合成ソフト「DeepVocal」とSharpkeyの今後 | ホームへ | SynthV中国語音源に日本語を歌わせるプリセット配布>>
コメント
コメントの投稿













管理者にだけ表示を許可する