2017年の2月に発売された学校用のVOCALOID「ボーカロイド教育版」、結局のところどれくらい導入されたのかは現場見てないんでわからないですが、少なくとも浸透はしてなさそうですね。
今更感はありますが、HPで提示されている授業モデルを読んでみました。実は私、教育系の学生なんですよ。
紹介動画をちょっと見てみましょう。
ボーカロイド教育版というのは要するに教育用のVOCALOIDで、学校において音楽の授業に使われたりすることを考えられているっぽいです。
考え自体は納得です。文科省の示す教育の情報化関連の文書の文言とボーカロイド教育版関連文書の文言は明らかな関連が見て取れるのでやはりそこはしっかり押さえてきたなーという感じ。
【授業モデル】
学校の先生は一つ/一連の授業について授業の進行表をあらかじめ作っているはずです(ベテランは知らない)。その進行表がボーカロイド教育版のHPでも閲覧可能です。今回はこれを読んでみました。
対象学年:小学5年生
目 標:「きらきら星」の主旋律をボーカロイド教育版に入力することで楽譜に記載されている音の高さと長さについての理解を深める。また、メロディーと伴奏コード(和音)の関係から「きらきら星」の主旋律にハモリのパート(副旋律)を考えさせ、音の重なりの美しさを表現させることがねらいである
要するに、ボーカロイド教育版を使って楽譜(ピアノロール)の見方と和音を感じようといった感じでしょう。
なぜ「きらきら星」かというと、旋律が4分音符のみで構成されていて簡単であるということと、メロディーがコードの構成音のみでできているのでハモリが作りやすいというところらしい。なるほど。
ボーカロイド教育版の良いところとしては
・ピアノロールで音の高さと長さがわかりやすい
・触ってすぐ再生して確認できる再現性と正確性の高いレスポンスの速さ
・和音の並行表示とコードトーンのガイド表示があるので和音が見える
らしい。音楽教育の潮流とかには詳しくないので、これからピアノロールが音楽教育の現場に浸透していくのかといわれるとそれは知らないが、感覚的にグラフィックに音を見るのにはピアノロールのほうが比較的良いのかなという印象。オタマジャクシになれるとそっちのほうが読みやすいというのはそれはそうなんだけども。
レスポンスの速さは確かに良いと思います。試行錯誤して作業を進められます。グループワークとしてとりあえず「きらきら星」の旋律を打ち込むところから始めるらしいので今風な感じ。流行りのアクティブラーニング。ZPD(発達の最近接領域)とか言っておくと教育系学生っぽさが出る(安易)
楽譜を書いて今まで通り歌うなり演奏するなりでも似たようなことができますが、絶対に一回自分で読まないといけないし、自分やクラスメートを通した時点で正しく書けてるか、正しく歌ってるか全くわかんないんですよね。間違って書いてても歌えたりするし、正しく書いてても間違って歌ったりするし割と沼。あ、これが正しいのかって確信がないですよね。間違っても少なくともボーカロイドは文句言わないし。
主旋律を打ったら今度はハモリを作るようです。これ、非音楽系大学生にDTM教えててもまぁ~できないポイントです。スケールとかコードとかなんとなく把握できてないとできない。
ボーカロイド教育版はコードの構成音がハイライト表示されるのでそこに置けばいいんだとか。小5にコード理論とか度数表記とか早いのは実感としてもわかる。
ところでこれ、指導案みてみると、初めてボーカロイド教育版をみてから、主旋律からハモリ作り、自己評価レポート画まで45分でやろうとしてるんですよね。実際にやってないんでわからないですけど、これできるか?
「きらきら星」は12小節で、ノート数は42。で、ハモリ1パート追加で30分ならまぁ小5でも無理ではなさそうだけど、導入5分でVOCALOIDを軽く説明して、次の30分で、トラックに音源を割り当てる/トランスポート(再生停止)/歌詞入力/ピアノロールの見方(試行錯誤しながら理解)/鉛筆ツール消しゴムツール/モノフォニックの説明/シーケンスの保存/コードガイドの表示/ハモリの作成まで割とさらっとやるつもりらしくてびっくりした。あんまり現実的なスピードではない気がする。
小6対象のモデルもあるので見てみると楽しいと思う。「オリジナルの歌詞にメロディーをつけてみよう(3コマ)」だそうな。
中3対象の授業モデルも2つ提示されています。島崎藤村の詩に4人くらいでメロをつけてそれを合わせて一曲にするとか。こちらは3時間とか5時間とかとってて余裕ありげだった。
ちなみに個人的な注目ポイントは小6の授業モデルの最後です。
小6の授業モデルでは短いフレーズにメロをつけるっていうのをやるんですが、1コマ目で「きみとぼくとは ともだちだ」っていうフレーズにリズムと音程をつけます。2コマ目で歌詞とメロを作って、3コマ目でブラッシュアップした後、最終的に自分たちで歌って発表するんです。
ボカロスキー的には「あ、そこ歌うの?」ってツッコミ入れたくなるところかもしれません。「結局人間がいいよねとか言いたいんか!」とか思うかもしれません。
ただ、とりあえず言えるのは作曲という表現とは別に、自分で歌唱表現する時間もとらねばならんのです。たぶんDTMが義務教育に入ってきたとしても体を動かしての器楽合奏はやると思うんだ。
たぶん作曲作業中もなんだかんだみんな自分で歌ってたりするんだろうけど、やはりVOCALOIDのほうが正確に試行錯誤しやすいので道具的な使われ方としては活きてるのかなぁという印象。もちろん授業の組み立てとして最終的にVOCALOIDに歌わせて提出というのも全然やっていいんだけど、それで要領を満たせるかというとそれは別問題なので。
ちなみにこちらから導入事例がいくつか見れるので興味がある方は見てみるのもよいかも
スポンサーサイト
くろ州の合成音声備忘録
ちょっと前のVRoidってバーチャルキャストにもっていくとなんかメタリックになってたんですよ。
テカテカでしょ?
というわけで尋ねてみたら開発者さんからお答えが来たので報告。実践するとこうなる。
適正。
【手順】
「共通設定」タブの画面左から「リムライト」へ
で、髪と体の強さをゼロにする
これでOK。簡単だった。
以上です。
くろ州の合成音声備忘録
ハイやってまいりました第1回歌声合成ソフト合成速度ダービー。実況及び解説は私くろ州が務めさせていただきます。
【概要】
この大会は「同じ条件で歌声合成を行うと最も速いのはどのソフトウェアなのか」という合成速度の比較を目的としています。参加歌声合成は以下の通り。
1.VOCALOID4 VY1V4
2.UTAU デフォ子
3.CeVIO さとうささら
4.Sharpkey 稲荷(Inari)
5.SynthV Eleanor Forte
6.Sinsy f00005j
7.歌うボイスロイド 琴葉葵 with KotonoSync
8.Nakloid 単独音
はーい。以上8の歌声合成ソフトと音源さんに集まっていただきました。
なお、英語音源として唯一のエントリーとなるEleanor Forteさんですが、頑張って日本語を歌ってもらうこととなりました。日本語化の方法につきましてはこちらの記事を参照してください。
【ルール】
では、今回大会のルールを説明いたしましょう。
会場スペック
・CPU:i5-8250U(1.60GHz)
・RAM:12GB
・電源モード:「最も高いパフォーマンス」
・オーディオインターフェース接続ナシ
利用シーケンス
・手元にあった「夕景イエスタデイ」のMIDI
・1曲丸ごと
・1トラックのみ
・無調声
測定方法
・保存ボタンを押してから合成終了の印が表示されるまで
・画面を録画し測定するビデオ判定
このルールどう見ましょうか。会場スペックとしてはノートPCにしては多少高めの設定にはなっているかもしれません。特にRAM12GBというのがどうも微妙な高さです。ただ、オーディオインターフェースの接続により速さを増すCeVIOとしては少し苦手なコースとなるかもしれません。Sinsyに関しては処理を行うのはサーバー側ですので会場のスペックには左右されませんが、サーバーが計測時に調子が良いかどうかにかかっているといえるでしょう。
そして今回の勝負のポイントは「電源モード」にかかっているといっても過言ではありません。事前のレースではこの電源モードを「省電力」にしていましたが、今回は最高にしてあるというのがどの陣営にどの程度影響を与えるのか見ものです。
また、課題曲の「夕景イエスタデイ」ですが、非常にノート数が多いですので、どんな歌声合成にしてもかなりてこずる相手ではないかと予想されます。
【結果】
さて、実際に処理が実行されている場面をお見せできず急に結果となってしまいますがご了承ください。なお、結果の予想を立てるのは自由にしていただいて結構ですが、賭け事はやめていただければと思います。
第8位 歌うボイスロイド 琴葉葵
記録 17分33秒20
さすがに歌声合成の中に混じって唯一の話声合成ソフトであるVOICEROIDは有利な戦いは出来なかったか。歌うボイスロイドはそもそも外部ツールを利用してVOICEROIDをコントロールし、計算しては保存し計算しては保存しを繰り返しているのでとても不利なわけです。
第7位 UTAU デフォ子
記録 2分0秒63
今回は事前にキャッシュをためず、デフォ子におま☆かせのみ適用したうえでresamplerを利用して合成しています。電源モードを省電力にしていた事前レースでの記録を47秒短くするという大きな前進を見せています。UTAUはどのエンジンにしても電源モードで目に見えて速度が変わるのが楽しいですね。
第6位 Sinsy f00005j
記録 1分1秒93
サーバーの調子はまぁ通常通りといったところだったでしょうか。UTAUと並んで中速にランク付けられるでしょう。
第5位 CeVIO さとうささら
記録 22秒26
ここから1分を大幅に切る高速ゾーンに入ってきます。オーディオインターフェースの接続ナシ
ということで十分な記録を残せなかった可能性もあったCeVIOですが、しっかり30秒を切る大健闘です。
第4位 SynthV TP Eleanor Forte
記録 19秒60
CeVIOの追跡を振り切って4位に落ち着きました英語音源のEleanor Forte。日本語USTをArpabet形式に変換したうえで読み込んだシーケンスでも上位に食い込んできました。
第3位 VOCALOID VY1V4
記録 16秒23
なんと、VOCALOID4が高速エリアに入ってきました。事前のレースでは42秒93と出遅れたV4でしたが、電源モードの選択により大きくCeVIO、SynthVを追い抜いて堂々3位にランクインしました。波乱の展開ですね。
第2位 Nakloid 単独音
記録 9秒23
ここからは10秒を切る超速ランクに突入します。なんと思わぬ伏兵Nakloidが第2位につけました。私くろ州も全くノーマークだった「UTAUにフリーライドしている」歌声合成ことNakloidが10秒を切りました。
そもそもNakloidはUSTを読み込んだ時点で音声を合成しているので書き出しのときにはすでに保存するだけになっているんですねー。しかしそれでは公平性の観点からといいますか、あくまで「合成速度」を競いたいという趣旨のレースですのでここでは合成して保存というほかの歌声合成と同じ動きをしてもらって測定しました。
しかしながらそれでも他を圧倒する速さを見せたNakloid侮りがたし。
第1位 Sharpkey 稲荷(Inari)
記録 8秒23
堂々の第1位はSharpkeyがかっさらっていきました。2位に1秒の差をつけての勝利となります。事前のレースでも8秒50と他の追随を許さぬ速さで駆け抜けていきました。しかしながらNakloidには少々肝を冷やす場面もあったようです。
というわけで最終的に
1.Sharpkey
2.Nakloid
3.VOCALOID
4.SynthV
5.CeVIO
6.Sinsy
7.UTAU
8.歌うボイスロイド
ということになりました。合成速かったらなんだという話をするつもりはないので早々に実況席からのコメントを終了させていただこうかと思います。ありがとうございました。
くろ州の合成音声備忘録
カバー曲作るときには原曲のテンポがわからないといけない。特に既存のUSTを使わない場合は加えて耳コピもしないといけません。
聞いただけで耳コピができる人は多少いるかもしれないけど、テンポがわかる人ってなかなかいないはず。そういう時に使うのが「WaveTone」
【WaveToneでできること】
・曲のテンポがわかる
・曲のコードがわかるかも
・耳コピ支援
【テンポ解析】
WaveToneを立ち上げて、そこにカバーしたい曲のWAVEなりMP3なりをD&Dします。
で、出てくるウィンドウでとりあえず「解析ボタン」を押しましょう。
で、解析が終わったっぽかったらメニューバーの「解析→テンポ解析」すると大体正しくテンポが表示されます。
この画像の場合はテンポ135
【耳コピ】
私は耳コピ普通に耳でやるのでこの機能ほとんど使ったことないんですが、WaveToneを使えば多少耳コピ苦手でも目で見てコピーできます。
こんな画面があるじゃろ?
この赤くなっている部分がエネルギーの大きいところ。音を流してみるとわかるけどここがボーカル。音を流してもわかんない場合はたぶん耳コピ向いてないのでおとなしくUST使うか誰かに頼んだほうが良い。
この状態で再生ボタンを押す。
曲を聴きながら「Shift+Spase」を押す。Shiftは押しっぱなしでSpaseキーをテンポに合わせてタップする。これをやらないとMIDIが汚くなる。MIDIのテンポ合わせの作業です。
で、鉛筆マークを押すとノートを書き込めるようになるのでぐりぐり書いていく。
こうなる。音を聞きながらやれば大体正しくできる。
鉛筆マークの二つとなりの音符マークがクオンタイズ設定ボタンなのでここで1/8なりなんなり細かい値に設定するのが良い。
できたら「ファイル→ノートをMIDIファイルに出力」でMIDIを書き出す。これをUTAUなりVOCALOIDに読み込めばOK。
くろ州の合成音声備忘録
一部の歌声合成ではエディター内でボーカルを作り切るということが可能になっていますが、割と奥の歌声合成ソフトではエディター上でピッチを描く等々のエディットができない場合が結構あります。
Sinsyはそもそもエディターがないからボーカル編集できないし、歌うボイスロイドやAlter/Ego、LaLaSongなんかはエディターでピッチを編集するのがすこぶる面倒だったりします。
その辺をどうにかするのが「VocalShifter」です。
【できること】
・ピッチを直接描いて編集できる
・ジェンダーを自由に描いて編集できる
・音量を大まかに/かなり細かく編集できる
・タイミングを編集できる
ちなみに無料で使えるのはVocalShifter LEのほう。LEがつかないほうは2000円くらいで音質が良くなるらしい。
【ピッチ】
上の画像にも見えている黄色とオレンジの線がピッチカーブです。編集方法は主に3つ
範囲選択
範囲を選択して、ピッチを一気に上下させたりケロケロさせたりする。
右クリックから「ピッチ平滑化/平均化」「ビブラート付加」「ケロケロボイス」「自動補正」など様々な編集/補正が可能。
鉛筆/直線
ピッチを手描きで編集できる。Sinsy他歌声合成から書き出したファイルのピッチを編集できる。歌声合成上達ポイントとして「全部エディターでやらんでもええんやで」というのがあって、VOCALOIDにしてもUTAU/CeVIO他何にしても、全部エディターでやろうとするとむしろ難しいポイントがいくつかあります。そういうのは無理にエディターで全部やらなくてもこういうツールでやっちゃっていいんです。
ノート編集
ピッチをノートで表示して
簡単に編集できる。どちらかというと生歌の補正によく使う。
【FRM(フォルマント)】
歌声合成界隈ではジェンダーといわれることが多いアレ。CeVIOの声質やUTAUのgフラグよりも自由度が高いがVOCALOIDとそんなに変わらないので使うか使わないか人により分かれそう。
【VOL】
ざっくりボリューム。子音を小さくするとかクレッシェンドデクレッシェンドを作るのではなくAメロとBメロとサビの音量差を作るとかそういう用途に向いている。VOCALOIDのDYNとほぼ同じ。
【PAN】
DAWでやればいいと思うので私は使わない
【DYN】
詳細なボリューム。子音を小さくするとかクレッシェンドデクレッシェンドを作るのに向いているが逆にABメロサビの音量差を作るのは苦手。CeVIOのVOLとほぼ同じ。
【TIME】
タイミング。音素を引き延ばしたり縮めたりする。小さい「っ」を作ったりなんだりする。再生カーソルを移動させて右クリックから「再生位置に制御点追加」で制御点を量産してそれを前後させてタイミング補正なりなんなりします。超めんどいのでタイミング補正はいらないようにしてほしい(特に歌い手)
これだけ使えばあらゆる歌声合成を十分に調声できる。
くろ州の合成音声備忘録
UTAU音源制作の過程で、技術者に依頼を出すポイントって大きく3つくらいあって、一つはキャラデザ/イラスト制作、もう一つが原音設定、で最後にノイズ除去です。
UTAU界隈でノイズ除去している人はiZotopeから発売されているRXシリーズやAdobeのAuditionなどを使っていると思います。これらのソフトは超高級か月額制でなかなか簡単に手に入れられるものではないと思います。
そんな中で無料でノイズ除去ができるのが「ISSE」です。
カッコよかろ?
【ISSEでできること】
ノイズとノイズじゃない部分の分離ができます。スペクトログラムを見て「これノイズだな」っていう部分をブラシや選択ツールで塗りつぶして分離ボタンを押すとノイズが切り離せます。
ただ、自動分離機能がないのでエアコンや冷蔵庫などのずっと鳴ってるノイズ(恒常性ノイズ)の分離はあまり得意じゃないです。あとクリッピングノイズ(歪み)を消すことができません(少なくとも得意じゃない)
そういうあたりが欲しければ有料ソフトを買おうねという感じ。音質低くてもいいならAudacityやREAPERのReaFirで恒常性ノイズを消せたりもするけども。
【音声デバイスの設定】
「File→AudioSettings」に進んで音声デバイスを設定します。Testボタンを押して「ぽー」とか聞こえたら正解。
ASIOは対応無し。ダイレクトサウンドよりWinオーディオのほうが遅延が少なかった(うちの環境では)
【分離設定】
SeparationSettingsタブでこんな感じの設定にするのが私の好み。
それぞれのパラメーターの意味は私もあんまりわかってないので適宜いろいろ触って試してみてください。
【基本操作】
「File→New」かドラッグアンドドロップでWAVファイルを読み込みます。あとは各種ブラシでノイズをぬりぬりするだけ。
塗りつぶしたら「CTRL+P」で分離(Prosess)する。うまく分離出来たら「File→Export Audio」で音声を書き出せばOK
【ツール】
ブラシ/消しゴム
ブラシを選択した状態で右のツールを選択してやると分離範囲を塗れる
消しゴムを選択して右のツールを選択してやると分離範囲を消せる
矢印ツール
私は使い方よくわからない
エアスプレー
D&Dで千を書くように選択する
時間選択ツール
時間軸で選択する。無音区間を選択して完全な無音を作ったりする
周波数選択ツール
音の高さで選択する。恒常性ノイズを消すのに使う
ボックス選択ツール
四角く切り抜く。時間選択×周波数選択
トレーニングブラシ
よくわからないけど強力
ブラシ設定
エアスプレーの設定
あとは頑張ってぬりぬりしよう。
くろ州の合成音声備忘録
作りました。内容
・CeVIO
/ Sinsy
・IA English C
・ボイスのバージョン
・歌詞打ち込み
・特殊記号
・音節分割
・発音記号編集
・VOL
・TMG
・Sinsy
・英語曲レパートリーの増やし方
くろ州の合成音声備忘録
2018年6月末にリリースされたCeVIO初の英語音源「IA English C」ですが、この度CeVIOユーザー互助会wikiでも有名な「おたまかざは」さんにプレゼントしていただいたので記事書きまくります。
CeVIO IA English C
— くろ州=情報整備士 (@96s_kM4osM) 2018年10月13日
夜明けと蛍(Mesさん英訳)
1番だけ pic.twitter.com/qEpXAhPBeH
【IA English C】
VOCALOID3音源として2012年に登場したIAですが、その後2017年4月にはCeVIOでしゃべれるようになりました。
で、2018年に今度はCeVIOでも歌えるようになったわけです。英語で。
【IA English Cの音源仕様】
言語:英語
音源:2ライブラリ(Natural/Powerful)
これもまたCeVIO初ですが、ライブラリが2個入ってます。
というのはまぁ正しいですが、実は「購入特典データ」っていうフォルダがあって、その中に「CeVIO_Voice_IA_English_C_Beta_(0.9.0)」というのが入ってます。
ここにもNatural/Powerfulが入ってるんですよ。
つまり、IA English Cには
・Natural1.0
・Natural0.9
・Powerful1.0
・Powerful0.9
の4つのライブラリが入ってるわけですね。
面倒なので以下N/Pと表記します。
N10は普通、結構落ち着いていて大人しめな声
P10は芯があって力んだ感じのはっきりした声
といった感じ。N09はN10との違いが分かりにくいですが、P09はP10に比べてさらに力強め。
【ボイスのバージョン】
CeVIOのいつかのアップデートで「ボイスのバージョン」っていう機能が追加されました。今まで使いどころがなかったんですが、IA English Cで使えます。
メニューバーから「オプション」に進むとこんなウィンドウが出ます。
ソング設定タブにある「ボイスのバージョン」を押すと、またウィンドウが出るのでバージョンを選ぶ。
なるほどなー。
【歌詞入力】
ナチュラルなイングリッシュでオーケー
I look into the sky drowning in the pale moonlight
※夜明けと蛍の英語訳版最初のフレーズ
って歌わせるなら
[I][look][in][-to][the][sky][drow][-ning][in][the][pale][moon][-light]
という風にノートを区切ればOK
途中「-(ハイフン)」で始まるノートがありますね。これは「音節分割」です。私が命名した。
ちなみにですが、日本語では使える「※」「’」は使えません。※では発音されなくなり、「’」は普通に「I'm」の「'」だと思われるだけ。裏声にしたいときは「$」を使う。
【音節分割】
英語は基本「1ノート1音節(シラブル)」です。上の例で言うと「drowning」という単語
意味がえぐいのは保留にしとくとして、読みは「ジュろーにん」的な。楽譜的に考えてこれを2つのノートに分けたいときに[drow][-ning]に分けるといった感じ。
要するに「音節でノートを分けるときにはハイフンを挟め」ということ。
3つ以上に分けるときも[no][-ti][-cing]のようにハイフンでつないでいく。
Q.ハイフンがないとどうなるか?
場合によっては発音が正しくなくなる。
「のーてぃすぃん」が「のーてぃきん」になったりする。
正しいままなこともある。
Q.音節の分け方は?
発音がちょっと変わるので調声上試してみる価値あり。
[drow][-ning]と[drown][-ing]では発音自体は同じだがTMG画面で見てみるとちょっとタイミングが違ったので(音も多少違う)調声テクニックとして気に入らなかったら分割位置を変えるというのはアリ。
英語の音節基本的に1ノート1母音あれば大体大丈夫なんですが、やってみたところ[dr][-oning]なんてありえない分割も可能でした。
【発音記号入力】
発音は記号での入力、編集も可能です。「音素で歌詞入力」モードにするといわゆるArpabetという表記方法に近い何かで入力が可能になります。なんだろう。
母音はArpabetっぽいけど子音はオリジナルっぽいのが見える。これマウスオーバーすると発音の例として単語が表示されるのでそれを見ながら発音のイメージをするとよいのでは? 親切設定
ここまでわかれば以降は日本語のときと大体同じ。母音が気に入らない場合はいろいろ打ち換えてみるとよいと思う。
【TMG】
CeVIOの大本命機能TMGは英語で活きる。
1.子音の位置が全部見える
2.二重母音のタイミング・推移がコントロールできる
3.内破音も作れる
例えば「straight」と打ち込むと
1.頭子音クラスタの[s][t][r]が全部見えて全部移動できる。英語音源の子音タイミングを最も細かくいじれるのはたぶんCeVIO。
2.この「ストレート」という単語、母音が[ey(えぃ)]という二重母音になっています。TMGなので、真ん中あたりのTMG線を前後することで「えーぃ」にも「ぇいー」にも「えい」にもできる。さすが。
3.で、尾子音クラスタの[t]を内破音、つまりははっきり「すとれいとぅ」って言っちゃわずに「すとれい」と発音を抑える歌い方にしたい場合。TMGで[t]部分をつぶすというのもあり(音素コントロールで消してもいいかもしれない)
このようにTMGは英語コントロールに向いているのです。
くろ州の合成音声備忘録
結構前、このブログ開設して間もないころにAquestone2の記事を書きましたが、今回は無印のほうの「Aquestone」について書いていきます。
無印Aquestoneはこれはこれで演奏しやすい。 pic.twitter.com/F7gzsBwka1
— くろ州=情報整備士 (@96s_kM4osM) 2018年10月11日
【概要】
Aquestoneはアクエスト社の配布しているVSTプラグインです。DAW上で動くタイプの歌声合成でリアルタイム演奏にめっぽう強い。
【特徴】
実況動画でよく聞く「ゆっくり」と大体同じ声質です。ゆっくりが歌ってる感MAX。子音がとても短く発音は確かに聞き取りにくいですが、その分リアルタイム演奏にはかなり強い。
前VOCALOIDキーボード触らせてもらったんですけど、Aquestone触って一瞬で「あ、これVOCALOIDキーボードでやったわ」っていうくらい近い操作感のもの。
【導入】
HPからZIP落として中のDLLをプラグインフォルダへドーン
DTMERなら余裕。
【パラメーター】
Husky:息っぽさ
Resonance:母音の母音らしさ 下げると母音ごとの判別がしにくい声になります
Volume:音量
Release:音の末端の素早さ 下げるとバツっと切れ、上げるとUTAUの語尾息みたいになる
PortamentoTime:音程の遷移の速さ
VibratoFreq:ビブラートの速さ 強さはモジュレーションホイールで
PitchbendLevel:ピッチベンドの音程幅 VOCALOIDでいうところのPBS
【演奏】
Aquestone2にはある子音の長さのパラメーターがないが、そもそもかなり短く設定されているので演奏するのに違和感が出るほどのタイミングのずれは感じない。
ポリフォニックモードがないので2のような和音は演奏できない。
ノート同士が重なるとピッチベンドにはならず次の歌詞が鳴るのでしゃくりあげ他は常にピッチベンドで行う。
歌詞はひらがなカタカナに対応していて、TXTファイルとして用意しておいたものをD&Dして読み込むようになっている。歌詞送りはMIDIのCC10、CC50、CC51に割り当てられています。
ちょっとずつ無印と2は違いがあるので、結構別物として考えるのがよさそうです。ゆっくりボイスと実は男声もある無印とちょっと力強めの声の2では使いたい場面も違うでしょう。
和音を慣らしたい、子音の長さが欲しい、声質パラメーターは多めが良い場合は2
リアルタイム演奏ができればいい場合は無印
といった感じ。必要最低限の機能で無印は簡単に使えるので私は好き。
くろ州の合成音声備忘録
結論はシンプルだし新規性がない感じになるが、とりあえず、バーチャルシンガーにしてもバーチャルスピーカーにしても、二次創作してもらいやすいキャラクターってどんな特徴があるのか? というお話。自分の観測できる範囲からの持論です。
【観点】
キャラクターデザイン/キャラクター設定/ソフトウェアという3点から見ていく。
【キャラクターデザイン】
先に結論を言ってしまおう。
・シンプルである
・特徴的である
・魅力的である
知ってる。って言う感じの結論ではあるが、やはりこれ。
シンプルさというのはつまり「要素/パーツが少ない」ということです。例えば初音ミクは「大きいツインテ/初音緑色」だけ押さえていればミクに見える。超シンプル。記号化しやすいよね。
キャラデザがシンプルだと何がいいか。それは「描きやすい」というところ。私は絵描きじゃないので細かいところは正確に把握できてないけど、服や装飾のパーツがかなーり多いデザインと、「/〇\」←これでも何となく最低限はクリアできるデザインだったら、ふとした瞬間にササっと描いて投稿できるのはどっちか一瞬でわかりますよね。ササっと描けるということは軽率に数が出せるということでもある。もちろん凝ろうと思えばいくらでも凝れるし。
あと、パーツが少ないと拡張性が高いので派生させやすい。装飾を変更するなり追加するなり色を変えるなりが簡単。
最近キャラジェネレーターをよく見かけるけど、趣味全開で作られたキャラって案外パーツが多い。多少頭を使ってセーブしないとシンプルにはならないのかもしれない。
特徴的であるというのは「覚えられやすい」ということ。「他と判別可能」ということならそれは「独自性」。最初にパッと見て覚えられるキャッチ―さともいえるかもしれません。
例えば、アホ毛が顔の3倍くらいのサイズのキャラがいたとする。「え、でかすぎでは?」ってなるよね。もちろん誇張だが、覚えられないキャラを二次創作なんてできるわけない。シンプルさも覚えやすさには作用してくる。
キズナアイも最近大規模に人気だけど結構シンプルなデザインでありながら、双葉みたいな頭のあれとか、髪のアクセントとかは結構特徴としてわかりやすい。
魅力的であるというのは「描きたくなる」ということ。これができれば苦労しねぇよって話だが、これができなければ要するに描かれないので結局ここが最重要。でも、正直VOCALOIDやVOICEROIDはここ大体クリアできるんですよ。絵がうまければ魅力は伝わるので、プロが描けば大体魅力的でしょう。あとはユーザーのシュミに刺さるかどうか。できるだけ多くの人に刺さるようにするのも戦略だし、そこでターゲットを意識したりリサーチするとかいうマーケティングが有効になってくる。
結構、設定画として表情差分を用意しておくと喜ばれる。Twitterでたまにそういうテンプレート流行るよね。資料画はもちろんあったほうがいい。
まとめると、
・シンプルである(描きやすい)
・特徴的である(覚えやすい)
・魅力的である(描きたくなる)
ですな。そりゃそうだ。
【キャラクター設定】
絵は伸びやすい(拡散されやすい)ので、イラストが制作されやすいというのもかなーり重要だけど、SS二次創作だったりイラストの発想やストーリーを支えるためにはキャラの設定も重要。
重要だが、これに関しては「あったほうがよい」というくらいの話。身長体重なんかは作画資料としての情報なのでスキにすればいいけど、あったほうがよさそうなのは「属性」と「相関関係」である。
「属性」というのは「ツンデレ」とか「あほの子」とかそういうやつ。ざっくりとした設定の方向性がわかる。あるとないとでは天地ほどの差がある。キャラデザから「これは明らかにツンデレの顔ですわ」ってなればそれでいいけども。要するに二次創作するときの「発想の素」が欲しい。何もないと発想しにくい。一言「あほの子」って言ってもらえれば、既存のストーリーの中にも配置しやすいし、あほの子あるあるシチュエーションを組みやすい。
キャラクターが複数いるときには「相関関係」を意識できる情報があると良い。これは「このキャラAはキャラBのことが好き」とかいう相関図にしてしまうと、解釈違いとかを生んでしまいがちなのでせいぜい「キャラAはキャラBの先輩である」くらいにしとくのがバランスがいい。こうすると「先輩×後輩」派の人も「後輩×先輩」派の人もCP厨じゃない人も自由にできるし、発想の素になる。他には直接関係として書かなくても身長をそれぞれ示しておくと身長差萌えの人他もやりやすい。複数キャラがいるなら、一人ひとり独立させるんじゃもったいない気がする。私がCP厨だからというのもあるけど。
歌声合成/話声合成界隈で過ごしていると、「おまけ素材」が世間のキャラ認識を生み出してるように思えることも多い。VOICEROIDにはおまけとしてセリフwavが同梱されてたりするが、これの内容によって紲星あかりには大食いキャラが共有されていたりする。そういうところから発想力強めの人を味方につける離れ業もあったりするのだ。
まとめると、
・発想の素が欲しい
設定というのはルールではなくて発想の素なので、材料として膨らませればいいし邪魔なら無視すればいい。
【ソフトウェア】
セクションタイトルが雑だが、要素はこれくらい。
・簡単かつ作りこみも可能
・音声のクオリティーが高い
・ストーリーを作りやすい
むずいな。
「簡単かつ作りこみも可能」というのは「ユーザーを取り込みやすく、逃がしにくい」ということ。GUIデザインとかユーザービリティ―とか考えるべきことは絶えないし高度に専門的である。
「音声のクオリティーが高い」というのは魅力に大きくかかわってくるが、当たり前すぎてヤバイ。私は好きでなんでも触っているけど、結局のところ流行っているソフトは音声もクオリティー高いし、流行ってないソフトは逆に発音や音質に難がある。手厳しいけど。
カバー曲制作の場合もなんだかんだで最終音感は必要だしMIXまでしようと思えばネットの海で検索祭りである。ストーリーは描こうと思えば一応書けるからやりやすい。
もちろんSS書くのだって向いてない人には全くできないしそこらへんは人それぞれ得意なことは違うからどっちが高尚でどっちが低俗だなんてそういう話ではないが、システムとして「喋れる」というのは強い。
なんだかんだで、実感としてもVOICEROID/CeVIO界隈とても活発だし二次創作もとても多い。元気。歌おうと思えば歌えるし。
【観点】
キャラクターデザイン/キャラクター設定/ソフトウェアという3点から見ていく。
【キャラクターデザイン】
先に結論を言ってしまおう。
・シンプルである
・特徴的である
・魅力的である
知ってる。って言う感じの結論ではあるが、やはりこれ。
シンプルさというのはつまり「要素/パーツが少ない」ということです。例えば初音ミクは「大きいツインテ/初音緑色」だけ押さえていればミクに見える。超シンプル。記号化しやすいよね。
キャラデザがシンプルだと何がいいか。それは「描きやすい」というところ。私は絵描きじゃないので細かいところは正確に把握できてないけど、服や装飾のパーツがかなーり多いデザインと、「/〇\」←これでも何となく最低限はクリアできるデザインだったら、ふとした瞬間にササっと描いて投稿できるのはどっちか一瞬でわかりますよね。ササっと描けるということは軽率に数が出せるということでもある。もちろん凝ろうと思えばいくらでも凝れるし。
あと、パーツが少ないと拡張性が高いので派生させやすい。装飾を変更するなり追加するなり色を変えるなりが簡単。
最近キャラジェネレーターをよく見かけるけど、趣味全開で作られたキャラって案外パーツが多い。多少頭を使ってセーブしないとシンプルにはならないのかもしれない。
特徴的であるというのは「覚えられやすい」ということ。「他と判別可能」ということならそれは「独自性」。最初にパッと見て覚えられるキャッチ―さともいえるかもしれません。
例えば、アホ毛が顔の3倍くらいのサイズのキャラがいたとする。「え、でかすぎでは?」ってなるよね。もちろん誇張だが、覚えられないキャラを二次創作なんてできるわけない。シンプルさも覚えやすさには作用してくる。
キズナアイも最近大規模に人気だけど結構シンプルなデザインでありながら、双葉みたいな頭のあれとか、髪のアクセントとかは結構特徴としてわかりやすい。
魅力的であるというのは「描きたくなる」ということ。これができれば苦労しねぇよって話だが、これができなければ要するに描かれないので結局ここが最重要。でも、正直VOCALOIDやVOICEROIDはここ大体クリアできるんですよ。絵がうまければ魅力は伝わるので、プロが描けば大体魅力的でしょう。あとはユーザーのシュミに刺さるかどうか。できるだけ多くの人に刺さるようにするのも戦略だし、そこでターゲットを意識したりリサーチするとかいうマーケティングが有効になってくる。
結構、設定画として表情差分を用意しておくと喜ばれる。Twitterでたまにそういうテンプレート流行るよね。資料画はもちろんあったほうがいい。
まとめると、
・シンプルである(描きやすい)
・特徴的である(覚えやすい)
・魅力的である(描きたくなる)
ですな。そりゃそうだ。
【キャラクター設定】
絵は伸びやすい(拡散されやすい)ので、イラストが制作されやすいというのもかなーり重要だけど、SS二次創作だったりイラストの発想やストーリーを支えるためにはキャラの設定も重要。
重要だが、これに関しては「あったほうがよい」というくらいの話。身長体重なんかは作画資料としての情報なのでスキにすればいいけど、あったほうがよさそうなのは「属性」と「相関関係」である。
「属性」というのは「ツンデレ」とか「あほの子」とかそういうやつ。ざっくりとした設定の方向性がわかる。あるとないとでは天地ほどの差がある。キャラデザから「これは明らかにツンデレの顔ですわ」ってなればそれでいいけども。要するに二次創作するときの「発想の素」が欲しい。何もないと発想しにくい。一言「あほの子」って言ってもらえれば、既存のストーリーの中にも配置しやすいし、あほの子あるあるシチュエーションを組みやすい。
キャラクターが複数いるときには「相関関係」を意識できる情報があると良い。これは「このキャラAはキャラBのことが好き」とかいう相関図にしてしまうと、解釈違いとかを生んでしまいがちなのでせいぜい「キャラAはキャラBの先輩である」くらいにしとくのがバランスがいい。こうすると「先輩×後輩」派の人も「後輩×先輩」派の人もCP厨じゃない人も自由にできるし、発想の素になる。他には直接関係として書かなくても身長をそれぞれ示しておくと身長差萌えの人他もやりやすい。複数キャラがいるなら、一人ひとり独立させるんじゃもったいない気がする。私がCP厨だからというのもあるけど。
歌声合成/話声合成界隈で過ごしていると、「おまけ素材」が世間のキャラ認識を生み出してるように思えることも多い。VOICEROIDにはおまけとしてセリフwavが同梱されてたりするが、これの内容によって紲星あかりには大食いキャラが共有されていたりする。そういうところから発想力強めの人を味方につける離れ業もあったりするのだ。
まとめると、
・発想の素が欲しい
設定というのはルールではなくて発想の素なので、材料として膨らませればいいし邪魔なら無視すればいい。
【ソフトウェア】
セクションタイトルが雑だが、要素はこれくらい。
・簡単かつ作りこみも可能
・音声のクオリティーが高い
・ストーリーを作りやすい
むずいな。
「簡単かつ作りこみも可能」というのは「ユーザーを取り込みやすく、逃がしにくい」ということ。GUIデザインとかユーザービリティ―とか考えるべきことは絶えないし高度に専門的である。
「音声のクオリティーが高い」というのは魅力に大きくかかわってくるが、当たり前すぎてヤバイ。私は好きでなんでも触っているけど、結局のところ流行っているソフトは音声もクオリティー高いし、流行ってないソフトは逆に発音や音質に難がある。手厳しいけど。
「ストーリーを作りやすい」というのは、ぶっちゃけ「喋らせやすいかどうか」である。そもそもそんなに音楽って簡単ではないのだ。ボカロ曲制作は「作曲+作詞」が基本にある。ここから作曲を取り除けばお話は作れるので、二次創作のハードルとしてまだショートストーリーのほうが低めなのだ。
カバー曲制作の場合もなんだかんだで最終音感は必要だしMIXまでしようと思えばネットの海で検索祭りである。ストーリーは描こうと思えば一応書けるからやりやすい。
もちろんSS書くのだって向いてない人には全くできないしそこらへんは人それぞれ得意なことは違うからどっちが高尚でどっちが低俗だなんてそういう話ではないが、システムとして「喋れる」というのは強い。
なんだかんだで、実感としてもVOICEROID/CeVIO界隈とても活発だし二次創作もとても多い。元気。歌おうと思えば歌えるし。