2019年8月31日、「VOCALOID2 初音ミク」が発売されてから12年経ち、世の小学生のほぼ全員が初音ミクより年下という世界線になりました。
で、そんな今日ですが、クリプトンから「VOCALOIDじゃない初音ミク」の知らせが届いたのです。どうやら、次の初音ミクはVOCALOID5ではなく、クリプトン自家製の歌声合成ソフトの音源になるらしいのです。YAMAHAと仲が悪くなったとかじゃないということなので、純粋に「そっちのほうがいい」ということになったんでしょう。
PiaproStudioをベースに独自エンジン(名称なし)を使って、開発中のエフェクターなんかも組み込みながらいろんな機能が追加されそうです。
新しい初音ミクは「VOCALOIDじゃなくなる」わけですが、初音ミクがVOCALOIDじゃなくなったら何が起きるのか? 過去の「○○じゃなくなったソフトウェアシンガー」のことも思い出しながら考えてみましょう。
【VOCALOIDと呼べなくなる】
VOCALOIDじゃなくなる以上、「VOCALOID初音ミク」とは呼べなくなります。いやまぁ呼んでも怒られないでしょうから呼べることには呼べるけど。
考えてみるとちょっと面白いんですが、VOCALOIDじゃない初音ミクを使ったオリジナル曲のニコニココメントに「これボカロ?」「これはVOCALOIDじゃない。○○」ってコメントがつくかもしれないんですよね!
YAMAHAさんは前から「VOCALOIDはYAMAHAの歌声合成ソフトを指すものであって、ソフトウェアシンガーの総称みたいな使われ方はしないでね」ということをずっと言ってるので、やっぱり次世代ミクは「VOCALOID」とは言いにくい。もちろん「ボカロ(広義)」には余裕で入ってくるので、実質的に「ボカロ」とは呼ばれるんでしょうね。
同時に、新世代ミクしか使わないオリジナル曲作者さんは「ボカロP」とも呼びにくいわけです。
UTAUやCeVIOを使った曲はニコニコで「VOCALOIDタグ」がつくことも多いんですが、UTAUやCeVIOを使うオリジナル曲作者は「ボカロP」ってあんまり呼ばれないんです。それぞれ「UTAUP」「CeVIOP」という風に「ソフト名P」形式で書かれます。これがそのまま踏襲されるのなら、新世代ミクユーザーは「ボカロP」じゃないことになる。
たぶんしっくりくるのは「初音ミクP」なんですけどね。初音ミクを「使いたい」人は、VOCALOIDを使いたいよりも初音ミクを使いたいんだと思うので。それがキャラが好きで使いたいのか、ネームバリューのために使いたいのかはそれぞれあるだろうけど、どっちにしても使いたいのは初音ミク。
最近だと、そもそも「俺はVOCALOIDを使っているが、ボカロキャラをプロデュースしているわけではない」という人も増えているっぽい印象なので、もしかしたら新世代ミクの登場で「ボカロP」という呼び方自体が薄れていくのかも。
【VOCALOIDって知ってます? 初音ミクは? って言いにくくなる】
VOCALOIDを説明するとき、割と多くの人が妥協案として「ハツネミクって知ってます?」っていうところから入ると思うんですが、これ言いにくくなるのでは?
UTAUやCeVIOを説明するにも「歌声合成ソフトって言って、歌詞と楽譜を与えると勝手に歌ってくれるソフトがあるんですよー」ではそんなに反応が良くない。そういうときには「ボカロとか初音ミクとかは聞いたことあります?」って言うといくらか反応が良くなるのでめっちゃ便利。
ソフトウェアシンガー文化論を展開するときも初音ミクはその代表例としてとても便利なのでよく使われる。
VOCALOIDじゃない初音ミクが登場してもVOCALOID初音ミクは取り扱いが続くので、「ボカロとか初音ミクとかは聞いたことあります?」から説明していっても全然間違いじゃないんだが、「でも、初音ミクはVOCALOIDじゃなくなったんですよ……」ってならない?
VOCALOIDの、場合によってはソフトウェアシンガーやバーチャルタレントの代表的存在としての初音ミクがちょっと揺らぐ。少なくとも最新のVOCALOID事情の具体例としては引っ張ってきにくくなる。VOCALOID初音ミクはV4までなので、V5の話をするときの具体例としては使えない。例えば、「音源付属のアタックリリースエフェクト」の話をするのにミクは使いにくい。
【VOCALOIDじゃない初音ミクは受け入れられるか】
初音ミクがVOCALOIDじゃなくなった場合、ユーザーやリスナーには受け入れられるのだろうか。過去に歌声合成を乗り換えたキャラの事例を見てみましょう。
歌声合成乗り換えには主に2種類あって、一つは「乗り換えるが、過去の製品は引き続き取り扱う」場合。もう一つは「乗り換えと同時に過去の製品は取り扱いを終了する」場合。
乗り換えた結果、ウケるかどうかは、キャラの力というか「歌声合成ソフト側の力」な気がする。音が変わらないなら、拒絶反応は起きにくい。
・VOCALOID IA
IAはもともとVOCALOID3のシンガー。IA→IA ROCKS→IA ECという順で音源を出していますが、IA ECはCeVIOで出ました。別にCeVIOに鞍替えするみたいなことを1stPlaceさんが言ってるわけではないので、今後IA V5(日本語)が出る可能性も(低いが)ないではない。
このときの乗り換え軸は、「歌声合成ソフト、言語」の二つ。VOCALOIDとCeVIOは声も操作もだいぶ違うし、日本語人が英語歌声合成を扱うのは普通に難しいので、乗り換えハードルがかなり高いものだった。
キャラには何の変化もないし、VOCALOID3の製品が取り扱い終了になったわけではないので、危機感がめちゃくちゃあったわけではない。よく話題になったのは「CeVIOに鞍替えするのか?」という話。今のところそもそも後続の音源が出てないので、もし、IA Japanese CeVIO(IA JC)が出るとかになったらそこそこのニュースになるかもしれないが、鞍替えするかどうかは不明なまま。
ポイントは声が結構違うというところ。最初のうちに出ていた公式デモを聞いた人の中からは「IAっぽくない」という声もそこそこあった。実際普通に違う。違うながらもある程度受け入れられたのは、ONEがいたからというのと、1stPlaceさんのプロモーションがうまいからというところが要因かと思う。
VOCALOIDの音が好きな人にとって、CeVIOの音は好みとはずれることも多い。波形接続系の音が好きな人と学習系の音が好きな人は結構はっきり分かれる印象がある。でも、IAの場合はすでに妹分ONEがいたので、CeVIOの音に多少慣れている人が多かったんじゃないかとも思う。IA EC動画にはたまに「ONEと似た声だね!」というコメントがつくことがあるが、姉妹感が強まったという解釈もあるのかもしれない。
さらに言えば、IA ECが出る前にCeVIOでIA TALKが出ていたことも影響はあるだろう。ライブや生放送でARIA姉妹は一緒にしゃべるし、IA ECのデモソングはやたらかっこいいので、1stPlaceさんはそういうキャラクターを活用した演出がうまい。IAファンの多くはちゃんと征服されたのでは?
ただ、ユーザー視点では、めっちゃ使われているという気はしない。たぶん英語ソフトウェアシンガーとしては普通に使われているほうだが。一番のハードルは英語だからというところに違いない。普通の人は英語曲そんなにかけないし、カバー専門の人からしても英語カバーの選択肢はそんなに多くない。CeVIOの操作はVOCALOIDと大分違うし、苦手な人も多い印象だが、それ以前に英語な部分でユーザー数は多くないもよう。
ミクの場合PiaproStudioベースで開発が進むなら使い心地がかなり変わるということもなさそう。
・Mac音ナナ
もともとはMacでDTMをする人向けに配布された音声集。UTAU-Synthで使ってもいいし、SugarCapeで使ってもいいし、単純にDAWに貼り付けて加工してもいいので「どの歌声合成出身」とも言いにくいが、最終的にはVOCALOID音源になり、もともと配布されていた音声集はもう手に入らない。
今頑張って「配布停止」の情報を探したけど、不自然なほどヒットしない。でも配布ページも見つからない。とりあえず、過去にはあったMac音家.netの販売ページはとっくの昔に消えているし、販売していたact2のページも404になっている。
元の音声集が配布停止したというのは大きくて、今でも嘆いている人をたまに見るくらい。Mac音ナナをもとから使っていた人はともかく、配布停止後に使いたくなった人はVOCALOID版マクネナナを使うしかなかった。とはいえ、おそらくVOCALOIDのほうがとっつきやすかったとは思う。人気動画の再生数はそんなに変わらない。作品の方向性は「UTAUっぽいMac音ナナとVOCALOIDっぽいマクネナナ」の違いを確かに感じるので、もしかしたらユーザーは結構入れ替わっているのかもしれない。動画投稿数はMac音ナナのほうが多い。
UTAU自体の導入ハードルはVOCALOIDより若干高い気がするし(個人の感想)実質人力ボカロ状態。SugarCapeやDAWでクオリティーを出そうとするのもかなり難しい。VOCALOID版マクネナナはその点、声の芯(密度?)がちょっと弱くなったが、滑らかさは高いし、安定してすっきりと扱える。
私はMac音ナナが生まれたころにはオタクじゃない小学生をやっていたし、VOCALOID移行期にもまだVOCALOIDよく知らなかったので当時の雰囲気は知らないが「滑らかさは向上、元音源は配布停止」ということになるとそれはもう大変なことです。ミクは停止しないようなのでその辺は安心。ツールも機能拡張ということなら、音さえ変な方向に行かなければおそらく全然大丈夫。
ところで、Mac音ナナの乗り換えの特徴として、「VOCALOID版はMac音ナナではなくマクネナナ」というところがある。名前が諸事情で変わっているんだな。
少し検索してみると、Mac音ナナ検索でマクネナナはほとんど引っかからないし、逆もしかりな感じ。初音ミクが「ハツネミク」に名前が変わるとかはたぶんないと思うが(確証ナシ)、その辺の検索分けはできるようにすべきなのか、すべきでないのか、すべきならどう分けるのかもちょっと気になる。
・闇音レンリ
UTAU→SynthVの乗り換えを経験。UTAUの配布停止はないので、今でも両方使える状態にある。↑二つと違い、「ツールは違うが、日本語→日本語で、元音源も続投」という意味では最も新世代ミクと条件が近い。
音の違いは甚だしくない。UTAUで合成エンジン「Moresampler」を使った場合の出音とSynthVでの出音はそこそこ近いので、そこでの反発はあまりなかったように思う。ポイントはツールのとっつきやすさかと思う。
音の違いはそんなにないものの、表現力ではUTAUに軍配が上がるだろう。UTAUのほうが多くの人が慣れているというのはもちろんだが、どうしたって「人間にしか聞こえないUTAUレンリ」の壁はだいぶ高い。いうなれば「アニメ一期がめっちゃヒットしたときの、スタッフ交代アリ二期」くらいのハードル。そう簡単に超えられない。
そういう意味では、今までUTAUレンリを使ってきた人からするとUTAUのほうがいいということにもなるんだろう。SynthV乗り換えで重要なのは「新規ユーザーの獲得」な気がする。
UTAUは快適に使おうとすると導入が結構難しい。UTAU経験者の友人と一緒に導入するが私のおススメだが、情報がいろんなところにあって混乱してしまうし、落とし穴が結構多いので挫折しがち。それに比べるとSynthVは、インストーラーを実行する力さえあればおおむねどうにかなる。
これによって、今までUTAUは難しくて使えなかった層がSynthVレンリを使っているという話はそこそこあるっぽい。「そりゃそうだわな」って感じの結論だが、ユーザーは好みによってツールを使い分けるわけだから、VOCALOIDミクが手になじむ人はそっちを使うし、新世代ミクが手になじむ人はそっちを使うんだろう。
クリプトン自家製歌声合成ソフトはスタンドアローンも用意されるらしい。PiaproStudioはプラグインタイプの歌声合成なので、これまでは「DAWが扱える人」が対象だった。歌わせるためにはDAWが使えて、さらにPSも使える必要があったため、作曲する人には好評な反面、DAWで躓いた人やそもそも作曲をしない人にってはとっつきにくい部分があった。
スタンドアローン化すれば、カバーしたい人やDAWで躓いた人も多少参入しやすくなるのかも。
そして、若干声が違う程度なら受け入れられるということもいえるかも。そもそもミクV2とMikuDarkほどの音の違いが受け入れられるなら、たいていのモノは受け入れられる気もする。結果的に新世代ミクの歌声が魅力的ならなんでもいいのだ。
・各種UTAU
重音テト、波音リツ、和音マコなど、UTAU音源の中にはほかのソフトでも音源を出しているものもいる。テトはHANAUTAUやVOCALOIDに組み込まれたりするし、いろんなソフトのデモで勝手に使われてたりもする。リツはSinsyやv.Connect-STAND等結構学術的な方面とのからみが多い。マコさんに至っては音源が作れる歌声合成ソフトにはたいてい対応している。
じゃあ、UTAUじゃないソフトで使われているかというと「それはない」というのが答え。たいていの人はそもそも↑のソフトを知らないし、UTAUは難しいながらも作れる歌声のクオリティーがだいぶ高いほうなので、私みたいな歌声合成ソフト好きでもなければ普通UTAU使うのだ。
新世代ミクの歌声合成ソフトが知名度が低いとかVOCALOIDより機能が少ないということはまず考えにくいので、使う人は使うんだろう。
【VOCALOIDとかとかの総称が本格的に必要になる】
ミクをVOCALOIDって呼びにくくなる、VOCALOIDタグをつけにくくなるというのはなかなかめんどい。UTAUやCeVIOもVOCALOIDタグをつけるのは割と一般的なので、新世代ミクの曲にVOCALOIDタグをつけるのもおそらく全然アリなんだろうが、「VOCALOIDとかとかをまとめて言う言い方」の必要性が出てきた。
今までもこの議論はずっと続いていて、結局のところ答えは出ていなかった。出たとしても一部の歌声合成議論好きの間でちょっと便利になるかな~くらいのモノだったが、いよいよ本格的に「○○ミク(VOCALOIDと新世代ミクを含む)」を言い表す必要が出てきかけているわけだ。
これについては先日一通り議論したのでこっちを見てください。
「歌声合成ソフトの総称」について、個人的な答えが出た。|くろ州 @96s_kM4osM|note(ノート) https://t.co/UJnKgcZxGR
— くろ州の記事と作品 (@96s_kM4osM) August 28, 2019
結論から言うと、「たぶんやっぱり"ボカロ"なんだろうなー」ですけどね。
【まとめ】
ともかくも、新歌声合成ソフトはウェルカムなので(ミクはV5対応しないよ。以上バイバイ!じゃないのは良いことだ)、これからも楽しく見守っていこう。
スポンサーサイト
くろ州の合成音声備忘録
皆さんの好きな歌声合成ソフトは何ですか? その歌声合成ソフトでピッチを描くとき、どうやって書きます?
ピッチの描き方には結構好みが出るので、ソフトによって好き嫌いが激しく分かれます。個人的には、「歌声合成ソフトの使いやすさ」はほぼピッチで決まると思っている。
好みが出るということは、普段使っているソフトと似た操作方法のソフトは手になじみやすく、似てないソフトはなじみにくい可能性が高いということでもある。今回は大体3系統に分けてみようと思います。ちなみに複数カテゴリーにまたがるソフトもある。
【タイプV】
VOCALOIDのようなMIDIっぽい書き方をするもの。ピッチカーブを直接いじることはできず、ノートごとにピッチベンドをいじって間接的にピッチを描いていく方式。ピッチベンドを使う以外に、複数のノートを組み合わせてピッチをコントロールする「ノート分割」を使うことも多い。
VOCALOID、Alter/Ego、Aquetone、Cadencii、ディレイラマ、NIAONIAO、PiaproStudio、Renoid、SynthVなど
ピッチベンドがなく、ノート分割のみでピッチをコントロールするものもこのカテゴリーの内部グループかも。
EmVoice、SugarCapeなど
【タイプU】
UTAUのような制御点を打ってピッチをコントロールするもの。調声スピードは出しにくいが、最も綺麗なピッチカーブが描ける。基本的にはUTAUとUTAUリスペクトの歌声合成ソフトのみが対応している。
UTAU、OpenUTAU、UTSUなど
【タイプC】
CeVIOのようなピッチカーブを直接手描きするもの。感覚的にピッチが描けて、大分自由度が高いが、タイプUの人は特に苦手意識を持ちやすい。マウス操作との相性が悪い。まずもってノート分割はしない。
CeVIO、MUTA、Nakloid、なめうぇーぶ、NIAONIAO、Sharpkey、・SynthVなど
調声機能を持たないため、ピッチ調声をVocalShifterなどでやる場合、VSがピッチ手描き系なので、このカテゴリーの下位カテゴリーとしよう。すべての歌声合成でVSは使えるので全部入るといえなくもない。
LaLaSong、MikoVoice、Sinsy、歌うボイスロイドなど
くろ州の合成音声備忘録
Twitterで「全部まとめとる奴おらんな?」みたいなトークを見かけたので「おっしゃやったろうこのやろう」と思って書きました。30選とは書いたけど数字はテキトー。
・VOCALOID3、4
めっちゃ普通の歌声合成ソフト。標準的すぎてどう表現すればいいのか悩む。キャラクター歌声合成に限っていえば、ユーザー数と知名度はおそらく世界最多。音源数もだいぶ多い。
・VOCALOID5
最新版VOCALOID。ワンクリックでしゃくりが作れたりするので省エネ調声向き。これまでのVOCALOIDと比べてプロDTMERむけっぽさがすごい。V4慣れしてるとこれじゃない感する。
・VOCALOID SDK for Unity
ゲームとかに組み込む用VOCALOID。使える音源は「ランタイム版Unity-chan!」。しばらく無料配布されていたが、正式にはもう配布されてない。
・Mobile VOCALOID Editor
iOS上で動くVOCALOID。本体も安いし音源も安いのでiPhoneとかiPad持っている場合は結構おすすめ。ただ、iPhoneは画面がちっさすぎるのでiPad推奨。
・UTAU
自分で音声ライブラリを作れる歌声合成筆頭。多様性がすごすぎて一言では言い表せない。一言で言うなら「多様性の塊」。世界で最も音声ライブラリが多いソフト。2位との差は数千個。
・CeVIO
ベタ打ちでもそこそこいいカンジで歌うので初心者向けなソフト。歌声合成ソフトの中でも最も音素の長さを細かくいじれる。音源によってはしゃべれる。
・Alter/Ego
DAW上で動くプラグインタイプの歌声合成。英語音源が多いが、日本語も歌えるし、フランス語音源もある。実は歌声合成ソフトの中でも最も声質パラメーターが多いものだったりする。たぶん。
・Aquestone
プラグインタイプの歌声合成。MIDIキーボードを使ってリアルタイムに歌わせるのに特化している。こういう原始的な歌声合成ソフトを本気でいじり倒して神調教を施すのが最強に楽しい。
・Aquestone2
Aquestoneの2号機。声はだいぶ違うし、よりシンセサイザーらしい機能が増えている。かなり楽器寄りのソフトなので、デチューンが搭載されてたりポリフォニックに対応してたりする。
・Cadencii
汎用歌声合成エディター。これ自体はあくまでエディターなので、エンジンや音源を入れないと何にもならない。Aquestone、Aquestone2、VOCALOID2、UTAU等いろんな歌声合成が使える。
・DeepVocal
したーのほうにあるSharpkeyの後身。機能は減ってしまっているが、音源制作ソフトとセットで放出されているので、アグレッシブUTAU音源制作ピープルの餌食になっている。
・ディレイラマ
プラグインタイプの歌声合成ソフト。母音しか歌えない。使い方によって毒にも薬にもなる。オランダ製。歌わせているとGUIの僧侶が微妙に動く。めっちゃうざい顔する。
・EmVoice
プラグインタイプの歌声合成。英語の発音があまりにも良すぎる。透き通る神秘的な声。声はすごく良いが、操作性が息していない。操作性はアレだが、なんにしても声がいい。
・HANAUTAU
歌声合成? リアルタイム特化型歌声合成ソフト。ピッチ調声は自分の喉で行う。歌声をマイクで拾い、ピッチを抽出。それを音源に適用して歌わせる難しい奴。
・LaLaSong
東芝の古いソフト。世にも珍しい五線譜で入力するタイプ。発音タイミングは若干危ういが、若干なのでマシ。30くらい触ってればかわいいほう。調声はVocalShifterやWAVES TUNEでやる。
・MikoVoice
トークもできる歌声合成ソフト。世にも珍しい文字で入力するタイプ。古も古のMIDIシーケンス手打ち文化圏。その時代のソフトというわけではない。基本アプリに組み込む形で使う。
・MUTA
中国のCeVIOっぽいソフト。ちょっと前まではしゃべる機能付いてた。ピッチカーブがほかのソフトと違う位置に描画されるのでちょっと混乱する。エディターの色がエグイ。
・My MidiVocalist
2000年より前からある歌声合成ソフト。MIDI読み込みでオケを鳴らすこともできるし、音源制作もできる。ただしフォルマントフィルターがないので超多音階音源にしないといけない。
・Nakloid
UTAU音源を読み込める歌声合成。基本はUTAUのようなソフトで、出音が結構硬い。ちなみに「元に戻す」がないので超がんばって。打ち込みは基本UTAUでやってUSTを読み込んだほうがいい。
・なめうぇーぶ
人力用歌声合成ソフト。UTAU音源も読み込めるが、WAVEファイル群から音素を切り出しまくる機能もある。MIDIキーボードを使えば、おそらく世界で最も高速でベタ打ちができるソフト。
・NIAONIAO
中国のUTAUっぽいソフト。GUIが超オレンジ。「人声模倣」というすごい機能があるが、私も含めあまり知られていない。今知ったナニコレやばくね? たぶん録音した音声からピッチ録れる。
・OpenUTAU
UTAU音源が読み込めるソフト。GUIがPOPでカワイイ。複数トラック作れるしオケの同時再生もできる。操作性もいいし音も普通にいいけど、再生ボタンを押すと98%くらいの確率で落ちる。
・PiaproStudio
クリプトン製のVOCALOIDに付属している歌声合成ソフト。プラグインタイプ。VOCALOID Editorと比べるときれいにパラメーターを描けるので気分がいい。
・PiaproStudioStandalone
初音ミクV4Cを買うと付いてくる歌声合成ソフト。PiaproStudioの単独起動版。機能も大体同じ。PiaproStudioは好きだけどDAWを立ち上げるのはめんどい人向けかと思いきやV4Cしか使えない。
・RenoidPlayer
ブラウザで動く珍しい歌声合成。基本的にはUTAU単独音みたいな出音。ブラウザで動くので、PCでもMacでもスマホでも余裕で動く。スマホ普及時代にこういうSaaSっぽいのは期待できる。
・SF2Renoid
オフラインでも動く歌声合成。と思いきや実はSF2Renoidは歌声合成ではなく、RenoidPlayerで使える音源のこと。RenoidPlayerがなくてもDAW+ピッチシフト系エフェクトで歌わせられる。
・Sharpkey
中国の歌声合成ソフト。公式配布はもう終わった。世界で唯一別々の母音間でモーフィングができる。VOCALOIDっぽさとUTAUっぽさとCeVIOっぽさとオリジナル成分でできている。
・Sinsy
ブラウザで動く珍しい歌声合成。CeVIOと同じ技術でできているが無料で使える。ノートの打ち込み機能も調声機能も一切ないけど、VocalShifterやWAVES TUNEが使えるので何も問題ない。
・SugarCape
Mac専用歌声合成ソフト。なんだかんだMac専用アプリってないのでこれも珍しい。UTAU同様に自作音源を読み込んで使える。開発者の解説動画が面白いというどうでもいい情報。
・SaltCase
SugarCapeの後身ソフト。後進だが、割と早い段階で開発が止まっているので、現状SugarCapeのほうが機能が多く安定しているような印象。調声できなくはないが外部ソフト使うと楽。
・SynthV
英語のクオリティーめちゃ高い歌声合成。最近は商業中国語音源が量産されておる。それももうそろそろ出し尽くした感があるので、次はどんな展開になるのか読めない。
・歌うボイスロイド
歌わないVOICEROIDをなんやかんやで無理やり歌わせたものを「歌うボイスロイド」という。手作業で気の遠くなる作業をしないといけないが、支援ソフトで50倍くらい作業が楽になる。
・UTSU
UTAUのようなソフト。基本的な機能はUTAUにほぼ準拠している。単独音形式の歌詞入力でも自動で連続音に対応できたりする。音源制作機能がある。対応言語がやたら多い。
・VOCALINA
韓国の歌声合成ソフト。VOCALOID4をのぞいて唯一外部エフェクトを読み込めるソフト。珍しいサブスクリプション形式の有料音源がある。専用でもないが動画投稿プラットフォームがある。
くろ州の合成音声備忘録
「UTAU音源の規約、わかりやすいアイコンにして並べたらわかりやすくね?」という話。
【UTAU音源ピクトとは】
日本の画期的発明の一つ「ピクトグラム」。言葉を使わないシンプルなアイコンで人々を導くあれ。UTAU規約を表すピクトをアイコンセットにして配布すれば、UTAU音源配布動画にペッと張り付けて使えるしわかりやすくない?という発想。
高速道路の標識では、「SAにガソリンスタンドあるよ→⛽」「レストランあるよ→🍴」という風に表示してると思うけど、「この音源はg変キャラ作っていいよ」「このキャラでグロい表現はダメ」みたいなことを表現できるUTAU専用ピクトを作りたい。これが「UTAU規約ピクト」
【使い方イメージ】
例えば、配布所で使うならこんな感じ。
#UTAU規約ピクト
— くろ州=歌声合成好き (@kM4osM_96s) August 24, 2019
利用イメージ pic.twitter.com/5UXD52bm3v
【デザイン案募集】
ピクトは結構頭を使わないと作れないので、デザイナーさんの協力が必要になります。みんなで考えようね! ちなみに「JIS規格ピクト」や「地図記号」が参考になる。
#UTAU規約ピクト
#UTAU規約ピクトJPN
というTwitterハッシュタグを使ってもらえると私がありがたい。
・条件1:日本向け
ピクトは国によってデザインが変わるので、グローバル対応しようとすると難易度がMAXになる。とりあえず日本向けで。
・条件2:文字はできるだけ使わない
文字使ったらピクトじゃないけど、「g変」や「R18」のアイコンを文字使わずに作るとかできるだろうか?
・条件3:色と形でわかる
色は赤黄青黒白の5色くらいが望ましい。白黒に変換されてもわかるように工夫してください。道路標識の「禁止」は「赤・リング&スラッシュ」、「許可」は「青・丸」、「注意」は「黄・三角」という風に「色・形」で見分けがつくようになっている。
【規約例】
とはいえ、「規約をアイコンにしてって雑に言われてもな……」となると思うので、この規約を見て作るべきアイコン・作りたいアイコンを探してねって言える規約を集めました。
・UTAU PL Plan
・UTAU音声ライブラリwiki
くろ州の合成音声備忘録
DeepVocalは8月4日に、DVTBは12日に更新がかかったっぽいですね。リリースノートとかがないのでよくわかりませんが、ぱっとみ特に機能が追加されたとかでもないっぽいので、おそらくエンジンとか音声モデル作成の精度とかが上がったんでしょう。ちなみにこの記事すべてが憶測です。
【うわさ1 交叉復活か】
そのうち交叉パラメーターが復活するかもという噂があります。交叉パラメーターに関してはこちらの記事で概要をつかんでいただいて、こちらの記事で実際の使いどころを確認してください。こちらの記事を読んでも参考になるかもしれません。実装されればおそらく「モーフィング」という名前のパラメーターになると思います。最強なので、復活してくれれば私が泣いて喜びます。
復活に向けてSharpkeyのモーフィングパラメーターで腕慣らしをしてみるとよいんじゃないですかね! この記事では、Sharpkey稲荷のダウンロードリンクや、実際にモーフィングを使いまくった動画が確認できます。
【うわさ2 パラメーター追加か】
モーフィングとは別にパラメーターが追加されるかもという噂もあります。普通に考えれば、「ブライトネス」「ジェンダー」「パワー」が順次追加されるんじゃないかと思います。この記事を見れば、とりあえずすべてのパラメーターについて復習できます。
復活に向けてSharpkeyの稲荷で腕慣らしをしてみるとよいんじゃないですかね! この記事では、Sharpkey稲荷のダウンロードリンクや、実際に各種パラメーター使いまくった動画が確認できます。
【まとめ】
Sharpkey稲荷、よくできてると思うんだよね。
冗談はさておき、SharpkeyのドキュメントはかなりDeepVocalに使いまわせるので、このブログで記事検索してみるとよい。
くろ州の合成音声備忘録
VOCALOIDオンリーイベントにサークル参加しようと思うとき、参加基準のページを見ますよね。すると、「VOCALOIDを題材とする作品を1つ以上頒布する予定があること」みたいな条件が書かれています。では、SinsyやSynthVオンリーのサークルはVOCALOIDオンリーに参加できるのか? 調べてみました。
あくまで参加基準を読んだだけで、運営に聞いたりしてないので運営に聞いたら違う結果が出るかも。
【ボーパラ】
確実
・VOCALOID・UTAU・CeVIO・VOICEROID・VOCALOID亜種
ほぼ確実
・その他歌声合成
名指しでOKが出ているのは・VOCALOID・UTAU・CeVIO・VOICEROID・VOCALOID亜種だが、基準には「VOCALOID等の歌声合成ソフトウェア」と書いてあるので、その他歌声合成もほぼ確実。
【ボーマス】
確実
・VOCALOID・UTAU・VOCALOID亜種
ほぼ確実
・CeVIO・その他歌声合成
名指しでOKが出ているのは・VOCALOID・UTAU・VOCALOID亜種だが、基準には「ボーカロイド、UTAU等の歌声合成ソフトウェア」と書いてあるので、その他歌声合成もほぼ確実
【ボカスト】
確実
・VOCALOID・UTAU・CeVIO・亜種
不確実
その他歌声合成
名指しでOKが出ているのは・VOCALOID・UTAU・CeVIO・亜種で、基準には「VOCALOID、UTAU、CeVIO、もしくはその亜種キャラクターを題材とした創作物」としか書いてないので、その他の歌声合成ソフトが許容されるかは実は不確実。とはいえ別に文句は言われないと思う。
【CeVIO FeSTA / CeVIO SUMMIT】
確実
・CeVIO
基本ナシ
・その他
当たり前だが、CeVIO関連頒布物がないとダメ。CeVIO+SinsyとかCeVIO+VOICEROIDのようにCeVIOが含まれていればたぶんOK。
【ボイスロイドマーチ】
確実
・VOICEROID
基本ナシ
・その他
こちらも当たり前だが、VOICEROID関連頒布物がないとダメ。その他音声合成ソフトは抱き合わせで。
【うたパラ / うたスク / みんうた】
確実
・UTAU
ほぼ確実
・UTAU亜種
基本ナシ
・その他
UTAU関連頒布物がないとダメ。亜種が名指しでOKされているのはうたパラだけだが、たぶんその他でも行けるとは思う。その他歌声合成ソフトは抱き合わせで。
【回避方法】
全歌声合成ソフトを使えば全オンリーイベントの参加要件を満たせる。
くろ州の合成音声備忘録
DeepVocalはSharpkeyとほぼ同じソフトなので、80%Sharpkeyのドキュメントを流用してぱぱっと作りました。
テキトーにダウンロードして使ってください。
くろ州の合成音声備忘録
UTAUでカバー曲や音源を作るためには、UTAU向けプラグインや専用ソフトのほかに、UTAUとは関係ないソフトたちも必要になってきます。今回はそういうソフトを紹介しながら、簡単に使いどころも見ていきましょう。
【カバー曲を作る】
・Wavetone
音声解析ツールです。使いどころは耳コピ/テンポ計測。カバーしたい曲をWavetoneに投げてやると、曲のテンポを出してくれる。テンポはどう頑張ったって生身の人間には正確に測定できないので毎度使うことになる。
音声を投げると、音の高さをピアノロールで表示してくれるソフトなので、ピアノロールを見ながら耳コピすることもできる。私はこの機能ほとんど使うことない。
・連続音一括設定
連続音音源を歌わせるためのUTAUプラグイン。必須。
・autoCVVC
CVVC音源を歌わせるためのUTAUプラグイン。必須。
・拡張○○エディタシリーズ
拡張ピッチエディタ、拡張フラグエディタ、拡張エンベロープエディタ。これがあると作業速度が5倍くらいになる。必須。
・すっぴん
USTを借りてきたときに、調声してない状態に戻すプラグイン。必須。
・VocalShifter
音声編集ソフト。ピッチを手描きできたり音量を超細かく手描きできたり、ボーカル編集はだいぶ得意。調声って絶対にUTAU上で全部やらないといけないわけじゃないので、こういう調声ソフトも使えるようになると、時短になったりあたらしい表現ができるようになったりするぞ。
・REAPER
MIXに使う。Audacityはミックス用のソフトじゃない(波形編集ソフトだ)ので、音楽作成ソフトであるREAPERのほうがMIXや作曲には圧倒的に向いている。
・エフェクト
REAPERで使うエフェクト。コンプレッサー、イコライザー、ディエッサー、リバーブ、リミッター等々。「フリーVST エフェクト」「REAPER エフェクト 使い方」とかで検索だ。
・オーディオコンバーター
WAVEファイルをMP3に変換したりするやつ。音声をネットにUPするとき「WAVEじゃなくてMP3でUPせぇや」とか言われたとき用。いろいろあるので好みで選ぼう。
【音源制作】
・OREMO
原音を収録するときに使う。必須。
・SetParam
原音設定するときに使う。必須。
・WavTar
原音を音量調整やノイズ除去する場合の下準備に使う。原音をいちいち開いていじって保存するとかやってたら時間がいくらあっても足りないので、WavTarで1つのファイルにまとめて作業する。
・ノイズ除去ソフト
原音にエアコンの音が入っちゃってるとか残響がひどいとかあったら、ノイズ除去ソフトで消すのが良い。Audition、RXシリーズ、Resample、SpectraLayer、ERAnoiseRemover等々いろいろあるので、体験版とか触ってみて好みのモノを探そう。
・Moresampler
UTAUエンジンだが、原音設定を自動でやってくれる機能もある。持っといて損はない。
・SpeedWagon
周波数表を作りまくるソフト。必須。
・パッケージングソフト
UTAU音源を配布できる形に整えてくれるソフト。NAKAHOSAとかGakuyaとかがある。この作業案外複雑というか失敗しがちなのであったほうが良い。