このところ、ボイスチェンジャーが増えてきているわけですが、この前出てきたのが『バ美声β版』です。
早速使ってみました。
【概要】
バ美声β版は今のところ無料でも手に入るボイスチェンジャーです。
ボイスチェンジャーとしては、いじれるところが1つしかないので
超簡単←→大雑把
なソフトです。ただ、このソフトの特徴はそこよりも音質の良さです。
【使い方】
1.入出力デバイスを指定します
2.Start
3.声の高さフェーダーで声を調整する
以上。
【ポイント】
恋声なら細かくいじれる半面初心者には優しくないことになっていますが、バ美声β版は逆に「声の高さ」フェーダー以外にいじりどころがないため超簡単です。
逆にこのフェーダーでいいカンジの声になれなければ適正なしです。私はなかった。
適正はボイスチェンジャーには常にあるのでそこはもうしょうがない。
このソフトのほかに比べて優れているところは「ノイズと誤判定が非常に少なく音質が良い」ところです。
ボイスチェンジャーは元の声との相性の問題で誤判定が多くガビガビな声になりやすいです。子音の合成では高音域が非常にノイジーになることも多い。
でも、このバ美声β版はそれがほぼゼロでした。試しに「S子音単体」「無声音」「ボーカルフライ」「デスボイス」あたりを通してチェックしてみましたが、私の基準では全部クリアですね。とても良い。
いじるところが増えたり変換できる音域が広がったらそう簡単に勝てなくなるクオリティー。
【配信に載せる】
ループバックにチェックを入れて、デバイスを適用すればたぶん配信に載ります。デバイスが適切に指定できるかどうかがカギなので、そこらへんは各自頑張ってください。
スポンサーサイト
くろ州の合成音声備忘録
リアチェンvoiceについてはいつかこのブログでも取り上げました。
この記事の中でガイドラインは詳しく確認してないといったことを言ってるんですが、今確認してきましたのでまとめます。
【ポイント】
個人の非商用利用可
ポイントも何も、このアプリガイドラインめっさシンプルなんですね。
ここを見ると、『くりむ蔵』『キューティ・エイリアン ペロロ』『声乃ツバサ』『東北ずん子』の
・ボイス変換モデル
・クリムゾンテクノロジーから出された販促物の画像
・キャラデザ
・キャラ名
が、個人の非商用の範囲内で二次創作物を公開・頒布してよいということらしい。割と太っ腹では?
というわけでいろいろやっていいんですけど、個人的にはここが気になります。
・音声利用もキャラ利用も同じ規約?
・他のキャラは?
これまでのボイスチェンジャーではあまり考えなくてよかったんですが、リアチェンvoiceは「特定のキャラになれる」ボイチェンなので、特定のキャラを扱う歌声合成的には「音声の利用ガイドライン」と「キャラクターの利用ガイドライン」があるほうが自然だと思うのです。
その理解からいくと、上に示した規約は変換モデル/販促物の画像/キャラデザ・キャラ名が許可されているということで、少なくとも「キャラクター利用」ははっきりしています。
販促物等の画像を使ってもいいっていうのはあんまり見ないですけど、利用者からしたらHPの画像使っていいんだーって思えるところですよね。常識の範囲内でな?
で、音声のほうなんですが、ボイス変換モデルを公開/頒布ってたぶんアプリの内部にあるボイス変換のためのライブラリを公開/頒布していいとかではないと思うのでこれが音声利用のガイドラインに該当すると思うんですね(推測)。たぶん普通に使って大丈夫。
次、追加キャラ達。利用規約に書かれているキャラは4人なんですが、私の記憶ではキャラほかにも色々いるはず。ということで確認してみたら、HPの規約は公開当初に日付10月30日となっていて、更新日とかは記述されてないのでおそらくこれは規約のほうが放置されているんでしょう。たぶん後発キャラも同じ基準で使えるんだと思います(推測)。この記事推測が多いぞ。
ずん子や吉田君みたいな他から借りてきたキャラは元のほうのガイドラインも守っている必要があるので注意。
アプリで見たら更新が来てるんでしょうかね。
くろ州の合成音声備忘録
モーフィングというのはAからBに滑らかに変化していくことを言います。とりあえずこの動画を見てください。
こういうこと。ゆかりがだんだんずん子に変化していく。
こういうことがVOCALOID4じゃなくてもできるのが「KotonoFader」です。一昨日公開されたので早速使ってみました。
【できること】
・琴葉茜悲しみからだんだん喜になる音声が作れる
・通常音源からだんだん強音源にシフトする音声が作れる
・鏡音リンがだんだん鏡音レンになる音声が作れる
・この母音発音変だなって言う場合に補正できる
・用意されてない発音を生成できる
【導入】
このページの指示に従うべし。
【使い方】
大体同じだけど声だけ違うWAVファイルを2個用意します。
例えば「具体例の歌 feat琴葉茜悲」と「具体例の歌 feat琴葉茜喜」
よりはっきり歌ってるほうを音声データ1に入れて、もう片方を音声データ2に入れる。
下のほうにフェーダーが二つ用意されていると思います。それぞれ
・変換強度:どれぐらい2に近づけるか。100なら完全に音声データ2の声色になる
・グラフ初期値:変換するタイミングでは50でいい
【使い方アイデア】
1.UTAU/VOCALOIDで強弱をつける。
強音源や弱音源など、声質差分が用意されてるならこういうことが可能。
KotonoFaderの使い道
— くろ州=情報整備士 (@96s_kM4osM) 2018年9月26日
強弱音源を用意して、混ぜる割合を書いてやる。VOCALOIDのXSYと同じ用途。
使ってるのはUTAUの具体音レイ(自音源) pic.twitter.com/D0jFe2i7pC
さっきの「グラフ初期値」はここでいじってるオレンジ色の線の初期位置なので、いじりやすいように調節すればいい。
VOCALOID4ユーザーは日常的に使ってた機能。
2.母音と母音の間の微妙な発音を作る
KotonoFaderの使い道
— くろ州=情報整備士 (@96s_kM4osM) 2018年9月26日
違う母音を用意して発音を混ぜる。
タメに「あーぅあー~」とウを混ぜたり、二重母音「したぃたぃびょぅも」を作ったり、英語っぽい曖昧な母音を作れる。 pic.twitter.com/6b55eWSOCj
二重母音も作れるし、曖昧母音も作れるし、[@r]も頑張れば作れるし、演歌のビブラート(あーぅぁぅぁぅぁぅぁみたいなの)もつくれる。タメで使いたい「あーぅあー~~」っていう入るかはいらないかくらいの「う」が作れるの良い。
「か」の母音なんかほかのア段と違くね?ってなったときに「あ」を重ねることで補正するとかいう使い方も可能。
Sharpkeyユーザーは日常的に使う。
3.用意されてない発音を作れる
「わ」と「さ」を混ぜると「ざ」が作れる。
「ふぁ」と「わ」を混ぜると「ヴぁ」が作れる。
「き」と「あ」をうまく混ぜると「きゃ」が作れる。
「く」と「わ」を混ぜると「くゎ」が作れる。
KotonoFaderの使い道
— くろ州=情報整備士 (@96s_kM4osM) 2018年9月26日
母音と子音を混ぜると新たな子音が生まれる。
「ああ」と「あさ」を混ぜたら「あざ」になった。
VOCALOIDで「ふぁ」と「わ」を混ぜたら「ヴぁ」が作れると思う。 pic.twitter.com/pce2NlcUU8
このように1と2の音程が多少違っても大丈夫。
4.キャラを混ぜることができる
キャラの同一性保持の問題があるので、やりすぎると怒られるかもしれないけど、ストーリー的にやりたい場面がないではない。
KotonoFaderの使い道
— くろ州=情報整備士 (@96s_kM4osM) 2018年9月26日
キャラを混ぜる。そういうの無理な人は閲覧注意。
鏡音リンとレンを混ぜ混ぜ pic.twitter.com/PtwbDtlQ1N
クロスフェードでも似たようなことができるけど、モーフィングでは「重なる」のではなく「変化する」ので、ストーリーを考えるとおいしいこともある。
技術的には私はよくVOCALOID kokoneと音街ウナを混ぜて力強さをコントロールするとかよくやる。
他にも、モーフィングでは頭を使えばいくらでも使い道が出てくる。
くろ州の合成音声備忘録
ボイスチェンジャーってそもそもエフェクトなので、普通にVSTeで存在するんですよね。リアルタイム性でいうとプラグインタイプが最も速いです。「RoVee/KeroVee」はこれもまたそこそこ昔からある声質変換。
RoVeeが声質変換に特化したシンプルなやつで、KeroVeeが多機能なほう。使いこなせる自信があるならKeroVeeで。
【導入】
これ、導入できない人は恋声とか使ったほうがいいとは思う。一応解説。
【使い方】
RoVeeの場合、一番右はDry/Wet=Mix率なので基本常に右に全振り。男声と女声混ぜても何にもならん。
残りの二つは左からフォルマントとピッチ。女声にしたければ右に回して男声にしたければ左に回す。簡単でしょ?
KeroVeeの場合は「Amount」ノブを0にして、Transpose=ピッチとShift=フォルマントをRoVeeと同じく調整してやる。Amountを100にすればケロケロします。
ボイスチェンジャーの処理にもそれぞれ苦手ポイントがあって、恋声やユーザーローカルは語尾やエッジ成分に弱い。対してRoVee/KeroVeeは無声子音の処理に弱め。
くろ州の合成音声備忘録
結構前からずっとあった「恋声」というボイスチェンジャーですが、2018年5月に二年版ぶりの更新が来てました。
【特徴】
シンプル。とりあえず「M→W」「W→M」ボタンを押せば何となくボイチェンできます。
生放送ではなく、しっかり編集した動画を作りたい人にはうれしいWAV読み込み機能もあります。
掛け録りしてしまうと後から調整しにくくなってしまうので、とるときは地で録ってあとから変換してやったほうがなんだかんだで楽。
ちなみにリアルタイムでの変換も可能。可能だけどレイテンシーがすごいので歌うのは感覚的に無理。なん十ミリ秒とかではない数百ミリ秒。しゃべる分にはたぶん生配信の映像のレイテンシとの差が埋まるくらいなんじゃないかと思う。
合成品質は普通。これは普通レベル。
【操作】
1.ピッチバーとフォルマントバーで声を作っていく
2.ボーカルの音域は右の窓を見ながら範囲を設定。別にできる限り大きくしてもいい
3.EffectボタンからEQとリバーブがいじれる
これで大体のことは可能。
下の真ん中にある方式選択に「話声」「歌声」というのが入っているが、「話声」の状態で歌声を読み込ませてみると音を外す。歌声を変換するときはここを「歌声」に変えるべし。