歌声合成ソフトで「囁き声が作れる」って、VOCALOID5、UTAU、SynthVくらいで、結構特殊技術なんですよね。でも、表現として囁かせたいことありますよね?
Editor側で作るのには限界があるし、こういうのは外部ツールを使うべきポイントなんですよね。どんな歌声合成ソフトでも一回音声書き出してしまえば全部WAVEファイル。実は、音声を読み込んで囁き声に変換できるソフトがあるんです。「ToWhisperTone」って言うんですけど。
ToWhisperTone pic.twitter.com/bHGhDdwdQl
— くろ州=歌声合成好き (@kM4osM_96s) September 27, 2019
これは、音声を読み込んで範囲選択してボタンを押すと囁き声に変換してくれるツール。めっちゃシンプル。私のオススメ設定は↑の画像のとおり。
ポイントは「LPFの強度」です。LPFってローパスフィルターです。数値を小さくすると低音が削れて行きます。数値がでかいとデスボイスっぽくなりやすいので、囁かせたいのであれば小さめに設定するのがいい。
音声→音声なので、歌声合成ソフトの違いには左右されない。音質によって相性はあるけど。なのでV3ボカロもボイロもCeVIOもささやかせられる。幅が広がるね!
スポンサーサイト
くろ州の合成音声備忘録
いま(2019/09/25)、iZotopeのマスタリングプラグイン「Ozone elements」が無償配布されています。便利なので持っておこう。UTAUの人や歌ボの人はDTMツールあんまり持ってなかったりするけど、これを機に沼に足を踏み入れてみようよ。
【Ozone elementsとは】
自動でマスタリングしてくれるエフェクト。当たり前だけど、AviUtlやAudacityでは使う意味がないので素直にDAW使おう。
— くろ州=歌声合成好き (@kM4osM_96s) September 25, 2019
マスタリングって、コンプやイコライザーやリミッターを使って、全体を見ながら音圧やなんやを整える作業です。慣れるとそんなに手間のかかる作業じゃなくなるんですが、慣れないと激ムズ。
Ozoneはマスタリングをほぼ自動化してくれる。「ストリーミング向け?CD向け?」って言う質問に1個2個答えるだけで、何となくいいカンジにしてくれる。
何がいいかというと、簡単なのはそうなんだけど、それ以上に「時間が浮く」ということ。「メッサ時間かけても自分的にいいものができるかどうかわからない」くらいなら、「ボタン1個で無難」のほうがいい。技術が身に就けば「数手でとてもいいもの」ができるんだろうけど。
Ozoneの自動マスタリングは無難というか「普通にいい」くらいの仕上がりになる。ベース結構増やす癖がある感じもするけど、安心して任せられる。気に入らなければ自分で手直しすればいいし。
※ちょっとわかる人向け
「CD・MID(CD向け音圧中)」「CD・HI(CD向け音圧高)」はリミッターで結構つぶす感じになって個人的には好みじゃないので、私は「ストリーミング向け」にしてシーリングを0.1~0.3くらいにしてる。これが正しいかどうかは知らない。
時間が浮けば、もっとUTAUやボイロと触れ合う時間を増やせる。限られた時間の中であなたは調声とMIXどっちにリソースを割きたいの?という話。MIXに割きたいなら全力でMIXすればいいし、調声に割きたいなら全力で調声すればいい。残ったほうは自動化すれば、割きたいことに割ける時間が増える。
制作にかかる時間が短くなるので、作品をたくさん生み出すという方向で考えてもいいかも。
なので、持っとこう。1万円以上のものが無料で手に入るって普通にお得だし。
くろ州の合成音声備忘録
―「『マルチアップローダ体制』とは、UTAU音源を複数のアップローダに上げておく運用体制のことを言う」― kM4osM_96s(1996~)
茶番はここまで。
【マルチアップローダ体制とは】
マルチアップローダ体制(マルチUL)というのは、UTAU音源を配布するときに、1個のアップローダに音源ファイルをアップするんじゃなくて、2個以上のアップローダにアップする運用体制のことを言います。私が一人で勝手に言ってるだけだけど。
例えば、GoogleドライブだけじゃなくてMEGAとかBowlRollとかにもアップするとか。で、配布所に「ダウンロードリンク①」「ダウンロードリンク②(ミラー)」みたいにリンクを張るのだ。
これをやると何がいいかというと、(1)1個アップローダの調子が悪くて音源ダウンロードできないような状態になっても、他が生きてるのでダウンロードが全滅しないとか、(2)将来的にアップローダがサービス終了してもバックアップが残ってるので応急処置がいくらでも取れるとかいうところ。要するに「アップローダがダメになったときのための保険」ですな。
【なんでこんな話をしているのか】
2019年9月7日ごろから約4日間、ファイルアップローダ「AXFC(通称:斧)」がダウンした。この間、AXFCを使っているUTAU音源やボイチェビ立ち絵がダウンロードできない状態にあった。
10日昼現在、SSL証明書の期限切れなのか知らんが表示エラーは出るものの、一応、全くダウンロードできないという状況は解消された。
AXFCが落ちるのは特別珍しくもないが、4日間と長かったため一部では「AXFCが終わるのか!?」みたいな憶測も流れた。この件に関してはとりあえず終わらなかったということで楽観視しよう。
しかし、「何らかのサービスが終了することで界隈資産が消滅する」ことの恐ろしさは計り知れない。
UTAU界隈だと、TmBoxロストが記憶に新しい。音声共有サービス「TmBox」が予定より早く突然閉鎖したため、UTAUカバー曲の類がそこそこ聞けなくなった。しかも、突然のことだったので別のサービスに音声を移行する間もなかったというそこそこの悲劇。
娯楽的な成分が消えるのは精神的に来るものがあるが、実害はそこまで大きくない。対して、無料ホームページサービス「ジオシティーズ」がサービス終了した時には「情報資産がなくなるのでは」という恐怖があった。
MMDの配布所はジオシティーズで作られていた。ジオシティーズがサービス終了をすると、MMD本家ページがなくなるかもという憶測もあったが、実際には本家さんが移転してくれてどうにかなった。
本家の中の人が移転してくれればいいんだけど、そうもいかないことは同人界隈なら当然多い。アップローダサービスだって終わるときには終わるのでこればっかりはどうしようもない。
というわけで、そういう場合に有効なのがマルチUL。万物はいずれ消滅するので、消滅させたくないものは数を増やして保険をかけるのだ。AXFCが消えるかどうかとかはさっぱり知らないが、Gドライブだって消えない保証はない。どっちにしても消えるんなら残機を増やそう。
もしAXFCもGドライブも全部しんだとかなったら、たぶんそれ隕石とか落ちてきてるでしょ。アップローダがどうのこうの言ってる場合じゃないときだと思う。
発想自体は普通だし、やってる人はやっている系テクニックなので、「マルチULという手もあるよー」って情報を広めるにはいいタイミングだったかなーと思う。
くろ州の合成音声備忘録
「UTAU音源の規約、わかりやすいアイコンにして並べたらわかりやすくね?」という話。
【UTAU音源ピクトとは】
日本の画期的発明の一つ「ピクトグラム」。言葉を使わないシンプルなアイコンで人々を導くあれ。UTAU規約を表すピクトをアイコンセットにして配布すれば、UTAU音源配布動画にペッと張り付けて使えるしわかりやすくない?という発想。
高速道路の標識では、「SAにガソリンスタンドあるよ→⛽」「レストランあるよ→🍴」という風に表示してると思うけど、「この音源はg変キャラ作っていいよ」「このキャラでグロい表現はダメ」みたいなことを表現できるUTAU専用ピクトを作りたい。これが「UTAU規約ピクト」
【使い方イメージ】
例えば、配布所で使うならこんな感じ。
#UTAU規約ピクト
— くろ州=歌声合成好き (@kM4osM_96s) August 24, 2019
利用イメージ pic.twitter.com/5UXD52bm3v
【デザイン案募集】
ピクトは結構頭を使わないと作れないので、デザイナーさんの協力が必要になります。みんなで考えようね! ちなみに「JIS規格ピクト」や「地図記号」が参考になる。
#UTAU規約ピクト
#UTAU規約ピクトJPN
というTwitterハッシュタグを使ってもらえると私がありがたい。
・条件1:日本向け
ピクトは国によってデザインが変わるので、グローバル対応しようとすると難易度がMAXになる。とりあえず日本向けで。
・条件2:文字はできるだけ使わない
文字使ったらピクトじゃないけど、「g変」や「R18」のアイコンを文字使わずに作るとかできるだろうか?
・条件3:色と形でわかる
色は赤黄青黒白の5色くらいが望ましい。白黒に変換されてもわかるように工夫してください。道路標識の「禁止」は「赤・リング&スラッシュ」、「許可」は「青・丸」、「注意」は「黄・三角」という風に「色・形」で見分けがつくようになっている。
【規約例】
とはいえ、「規約をアイコンにしてって雑に言われてもな……」となると思うので、この規約を見て作るべきアイコン・作りたいアイコンを探してねって言える規約を集めました。
・UTAU PL Plan
・UTAU音声ライブラリwiki
くろ州の合成音声備忘録
UTAUでカバー曲や音源を作るためには、UTAU向けプラグインや専用ソフトのほかに、UTAUとは関係ないソフトたちも必要になってきます。今回はそういうソフトを紹介しながら、簡単に使いどころも見ていきましょう。
【カバー曲を作る】
・Wavetone
音声解析ツールです。使いどころは耳コピ/テンポ計測。カバーしたい曲をWavetoneに投げてやると、曲のテンポを出してくれる。テンポはどう頑張ったって生身の人間には正確に測定できないので毎度使うことになる。
音声を投げると、音の高さをピアノロールで表示してくれるソフトなので、ピアノロールを見ながら耳コピすることもできる。私はこの機能ほとんど使うことない。
・連続音一括設定
連続音音源を歌わせるためのUTAUプラグイン。必須。
・autoCVVC
CVVC音源を歌わせるためのUTAUプラグイン。必須。
・拡張○○エディタシリーズ
拡張ピッチエディタ、拡張フラグエディタ、拡張エンベロープエディタ。これがあると作業速度が5倍くらいになる。必須。
・すっぴん
USTを借りてきたときに、調声してない状態に戻すプラグイン。必須。
・VocalShifter
音声編集ソフト。ピッチを手描きできたり音量を超細かく手描きできたり、ボーカル編集はだいぶ得意。調声って絶対にUTAU上で全部やらないといけないわけじゃないので、こういう調声ソフトも使えるようになると、時短になったりあたらしい表現ができるようになったりするぞ。
・REAPER
MIXに使う。Audacityはミックス用のソフトじゃない(波形編集ソフトだ)ので、音楽作成ソフトであるREAPERのほうがMIXや作曲には圧倒的に向いている。
・エフェクト
REAPERで使うエフェクト。コンプレッサー、イコライザー、ディエッサー、リバーブ、リミッター等々。「フリーVST エフェクト」「REAPER エフェクト 使い方」とかで検索だ。
・オーディオコンバーター
WAVEファイルをMP3に変換したりするやつ。音声をネットにUPするとき「WAVEじゃなくてMP3でUPせぇや」とか言われたとき用。いろいろあるので好みで選ぼう。
【音源制作】
・OREMO
原音を収録するときに使う。必須。
・SetParam
原音設定するときに使う。必須。
・WavTar
原音を音量調整やノイズ除去する場合の下準備に使う。原音をいちいち開いていじって保存するとかやってたら時間がいくらあっても足りないので、WavTarで1つのファイルにまとめて作業する。
・ノイズ除去ソフト
原音にエアコンの音が入っちゃってるとか残響がひどいとかあったら、ノイズ除去ソフトで消すのが良い。Audition、RXシリーズ、Resample、SpectraLayer、ERAnoiseRemover等々いろいろあるので、体験版とか触ってみて好みのモノを探そう。
・Moresampler
UTAUエンジンだが、原音設定を自動でやってくれる機能もある。持っといて損はない。
・SpeedWagon
周波数表を作りまくるソフト。必須。
・パッケージングソフト
UTAU音源を配布できる形に整えてくれるソフト。NAKAHOSAとかGakuyaとかがある。この作業案外複雑というか失敗しがちなのであったほうが良い。