fc2ブログ

タイトル画像

調声依頼を出すときのデータ作成

2019.03.13(16:53) 359

曲を作ったけど、調声は誰かほかの人に依頼しようという場合、いろいろデータを渡しますよね。

私も今までちょっと依頼を受けたことがありますが、まず100%欲しいものが来たためしがないのでちょっと注意ポイントをまとめてみました。個人の意見ですので、他人によって違う部分あります。

欲しいものが来ないのは当たり前っちゃ当たり前。それができたらたぶん自分で調声できるくらいに知識があるだろうので。

【渡すもの 共通項目】
・オケ(できる限り最終状態のもの)
・シーケンス

最低はこれ。

・オケ
オケがないとボーカルのイメージがさっぱりつかないのでオケは必須。

仮打ち込みの状態で問題ないが、音は最終とそんなに変わらないようにしてほしい。例えば、仮打ち込みではMIDI音源そのままだけど、最終では生演奏だとか有料音源とかにさし変わっているとかいう場合だと、MIDI音源のイメージに引っ張られて雰囲気が合わないことになったりもする。

出来ればボーカルも流し込んだ音声も欲しい。VOCALはUTAU他無料音源で作ればOK。
ボーカルの載ってないオケ+シーケンスだけだとタイミングを合わせられない。

フォーマットはWAV
ビット深度は16bit
サンプリング周波数はCeVIOユーザに調声依頼にするなら48kHz、VOCALOIDユーザーに調声依頼するなら44.1kHzです。

これがまず絶対にこの形式で送られてこない項目だったりします。AIFF・OGG・MP3はNG、VOCALOIDユーザーに対して48kHzのオーディオを送るのもNG。これがめちゃくちゃ多い。
もちろん受ける側も自分で変換できますが、正しい形式で送られてこない結果、最初に変換作業しないといけないとなるとちょっとモチベが下がる。

・シーケンス
VOCALOIDならVSQX
UTAUならUST
CeVIOならCCS

を送ります。

【VOCALOIDユーザーに調声依頼を出す】
・オケ:44.1kHz / 16bit WAVでオケ(OffVocal・OnVocal両方)
・シーケンス:VSQX or MIDI&流し込み用歌詞

相手がV2Editorユーザーであることが判っている場合はVSQ。
それ以外はVSQXでOK。VSQXならV3~V5まで読み込み可能なので。
V3, V4ユーザーに対してVPRを送っても読み込めないのでダメ。
PiaproStudioユーザー以外にPPSFを送っても読み込めないのでダメ
VSQXが作れない場合はMIDI&流し込み用の歌詞を用意しましょう。
その場合、VOCALOIDEditorでMIDIを読み込んで、歌詞を流し込みます。
歌詞の流し込みは、ノートと歌詞がずれると面倒なので絶対にずれないようにしてください。
ずれるのも修正しろというのであればできるかもしれないが、結果がずれてても文句は言えない。
1ノートに2モーラ以上の歌詞を入れるのはNG。
MIDIをリアルタイム録音で作った場合、ちゃんとクオンタイズすること。

【UTAUユーザーに調声依頼を出す】
・オケ:特になし
・シーケンス:UST or MIDI&流し込み用歌詞

オケは読み込めないので大体なんでもOK
44.1kHz / 16bit WAVでオケ(OffVocal・OnVocal両方)がベスト
意図がある場合を除いてフラグを含むすべての調声要素をリセットしておく
歌詞はひらがな単独音形式
USTが作れない場合はMIDI&流し込み用歌詞を用意しましょう。
その場合、エディターでMIDIを読み込んで、歌詞を流し込みます。
歌詞の流し込みは、ノートと歌詞がずれると面倒なので絶対にずれないようにしてください。
ずれるのも修正しろというのであればできるかもしれないが、結果がずれてても文句は言えない。
1ノートに2モーラ以上の歌詞を入れるのはNG。
MIDIをリアルタイム録音で作った場合、ちゃんとクオンタイズすること。
UTAU-Synth→UTAUの場合、USTよりMIDI&流し込み用歌詞のほうがエラーが少ないかも。
人によってはVSQXを渡しても許してくれるかもしれない。
ノート分割はしない。

【CeVIOユーザーに調声依頼を出す】
オケ:48kHz / 16bit WAVでオケ(OffVocal・OnVocal両方)
シーケンス:CCS or MusicXML or MIDI&流し込み用歌詞

オケは44.1kHzでもいいが、48kHzのほうが良いのは確実
CCSが作れない場合はMIDI&流し込み用の歌詞を用意しましょう。
MusicXMLで出す意味はほぼない。
その場合、VOCALOIDEditorでMIDIを読み込んで、歌詞を流し込みます。
歌詞の流し込みは、ノートと歌詞がずれると面倒なので絶対にずれないようにしてください。
ずれるのも修正しろというのであればできるかもしれないが、結果がずれてても文句は言えない。
MIDIをリアルタイム録音で作った場合、ちゃんとクオンタイズすること。
ノート間の小さいスキマは消しておくこと。
ノート分割はしない。

【歌うボイスロイド】
オケ:特になし
シーケンス:VSQX or UST or CCS or MIDI&流し込み用歌詞

オケは読み込めないのでなんでもOK。
シーケンスはVSQXがベスト。
UST/CCSの場合は変換作業が必要になりモチベが下がるが不可能じゃない。でも親切じゃない。
MIDI&流し込み用歌詞は人によっては許されるが人によっては許されない。非推奨の極み。
シーケンスは一曲Fullのものではなく、フレーズ毎・AメロBメロサビ別などで切ったものを複数にする。
VSQXは1トラックごとに別に作る。

【Sinsy・RenoidPlayer】
オケ:特になし
シーケンス:MusicXML or MIDI&流し込み用歌詞

そもそもSinsy調声を受け付けている人がほぼ私しかいない。
私はCCSで提出してもらうのがありがたい。
以下CeVIOと同じ。

【Sharpkey】
オケ:44.1kHz / 16bit WAVでオケ(OffVocal・OnVocal両方)
シーケンス:SK or VSQX

そもそもSharpkey調声を受け付けている人がほぼ私しかいない。
SKでもVSQXでも構わない。
ASP・Silは使わない。
以下VOCALOIDと同じ。

【SynthV】
オケ:44.1kHz / 16bit WAVでオケ(OffVocal・OnVocal両方)推奨
シーケンス:S5P or VSQX or VPR or UST or CCS or SK or MID&流し込み用歌詞

もう割と何でもあり。
以下VOCALOIDと同じだが、1ノートに2モーラ以上書き込んでも大丈夫(非推奨)。
歌詞はローマ字推奨。

【Aquestone・Alter/Ego】
オケ:特になし
シーケンス:MIDI&流し込み用歌詞

そもそも調声依頼を受けている人がたぶんいない(私は頼まれれば可能)。
無印Aquestoneであればカタカナ歌詞。
Aquestone2であればローマ字歌詞。
Alter/Egoであればひらがな or ローマ字歌詞。
フレーズごとに改行。
ノート間はわずかに開けておく。
1ノート1モーラ厳守。

【Nakloid・UTSU・OpenUTAU】
オケ:特になし
シーケンス:UST

そもそも調声依頼を受けている人がたぶんいない(私は頼まれれば可能)。
以下UTAUと同じ。


くろ州の合成音声備忘録


その他歌声合成 トラックバック(-) | コメント(0) | [EDIT]
タイトル画像

CeVIOマニュアル本が欲しい話

2019.03.13(03:32) 358

VOCALOIDには使い方マニュアル本が存在します。商業出版本がAmazonでもいくつかヒットしますね。

UTAUにもかつてはムック本が2冊ほどありました。今はプレミアがついてますが。

じゃあCeVIOは?

ないんですよねー。ギリでONEのパッケージ版に小冊子が付属してますけど、商業出版のマニュアル本というには薄い。

これ、正直不自然じゃないですか? 確かに、公式のヘルプページが充実してるし、ユーザー互助会ページもあるし、そもそもそんなに複雑なソフトじゃないし、UIがかわる程度の更新もそこそこあるしで、マニュアル本を作る意味とか必要がそんなに濃いわけではない感じはする。

でも、欲しいじゃん?

実際のところ、DTMやオーディオ関連の書籍にCeVIOの特集ページが組まれることはたまにあります。

でも、私が欲しいのは「CeVIO本」なのだ。Sharpkey本やSinsy本も欲しいけども。

【CeVIO本を妄想しよう】
・CeVIOとは:紹介・概要・歴史パート
・開発元インタビュー
・基本の使い方
・クリエイターのテクニック:クリエイターが持つ技術を紹介
・周辺ソフト:CeVIOと連携するタイプのフリーソフト紹介
・キャラクター紹介
・ギャラリー:アートワークとか動画紹介とか
・クリエイターインタビュー
・簡単DTM講座:基礎のMIXとか作曲とか

欲しい。

【本がないなら作ればいいじゃない】
うちの家訓は「欲しいのにないものは自分で作れ」なので、金と時間に余裕があれば作りたい。

欲しい人員は

・CeVIO詳しいマン
・開発者様もしくは開発者さんにインタビューできる人
・トーク・ソングクリエイター
・周辺ソフト作者さん
・イラストレーター・MMDモデラー
・表紙・誌面デザイナー
・DTM解説者
・スポンサー:重要


今のところ金も時間もないのでしばらくやらないですけど、何となく協力者は募集したい気分です。


くろ州の合成音声備忘録


CeVIO トラックバック(-) | コメント(0) | [EDIT]
タイトル画像

SHARPのロボット型デバイス「ROBOHON」でVoiceTextが使われているらしい

2019.03.08(22:24) 357

というニュースリリースを先月末見て、ちょっと放置していたんですが、ちゃんと調べました。

【ROBOHONとは?】
究極ざっくり説明すると、「ロボット型スマホ」とか「ロボット型音声アシスタント」とかいうものだといえます。細かいことは公式HP

【VoiceTextとは?】
HOYAさんで開発されている音声合成です。話声も歌声も作れます。

【ROBOHON×話声合成】
最新のデモ動画を見てみると、確かにVoiceTextの声だ!ってなりますね。

なめらか。

【ROBOHON×歌声合成】
常々、VoiceTextの歌声合成を使った製品はいつ出るんだとつぶやいていたやばいやつ(=私)的には注目ポイントはここ。

VoiceTextの歌声合成は「楽譜を渡せば無調声で勝手に表現して歌う」ことが特徴でした。いろいろ手を加えなくてもしゃくりあげだったりビブラートだったりを勝手に入れてくれます。

このように。

で、ROBOHONはどうなのかというと、これがなかなか動画が見つからなくててこずったんですが、一応展示会の映像がありました。

しゃくりとかビブラートはそんなに感じませんね。そういうコンセプトではないのかもしれません。

ROBOHONは本体+サービスという形でできることを増やしていくことができるらしいのですが、「ボクと歌お」というサービスを利用すると、エクシング(JOYSOUNDの会社)の楽曲データから歌わせることができたりするようです。なるほど?

自由に歌わせることができる歌声合成ソフトというわけではないですが、一歩前進ですね。


くろ州の合成音声備忘録


AIシンガー トラックバック(-) | コメント(0) | [EDIT]
タイトル画像

ブラウザ系歌声合成

2019.03.07(21:58) 356

最近、CeVIOの技術開発をやったテクノスピーチ&名工大のタッグが新しい歌声合成デモを公開して話題になりました。

で、そのニュースリリースのときに、合成処理をサーバーでやるタイプの歌声合成になるかもしれないみたいな話が出たりしました。

実際どうなるかはまだわかりませんが、ここで「ローカルで処理をしない歌声合成」を見てみようかと思います。正確に言うと「Webブラウザを通して使う歌声合成」ですね。

【Sinsy】
Sinsyはまさに名工大さんが出している歌声合成です。

・使い方
1.ローカルでシーケンスを作る
2.シーケンスをアップロード
3.非ローカル環境で合成
4.合成結果をダウンロードしてあとは好きに

Sinsyは合成→非ローカル、操作→ローカルといったように分離されています。

音はCeVIOと大体一緒で、言語は日中英3か国語に対応。

【RenoidPlayer】
RenoidPlayerは

「Renois」というDAWの
日本語サポートページ「Renois-Gate」を執筆する
サトーさんが提唱した
「Renoid」というRenoisの機能を活用した歌声合成方法を
g200kgさん(Keroveeとかの人)が
ブラウザ上で操作できるようにした
歌声合成です。

Renoisのみで動くRenoidと
多くのDAWで動くRenoidと
ブラウザ上で動くRenoidPlayerがあります

・使い方
1.ページでシーケンスを作る(もしくはUSTやVSQをインポートする)
2.再生ボタンを押して合成
3.合成結果をダウンロードしてあとは好きに

こちらは合成も操作も非ローカル環境でやります。

【スマホでも操作できるか】
環境によるのはもちろんですが、この二つはとりあえずスマホでも動きます。

Sinsyはシーケンスをローカルで作らないといけませんが、実はRenoidPlayerでもSinsy用シーケンスは作れるので、どちらもスマホのみで完結できます。

で、結果をGarageBandやFLStudioやCubaseみたいなアプリや、SoundtrapのようなブラウザDAWに突っ込めばボカロ曲も作れます。

最近は創作分野にもスマホしか使わないユーザーが増えてきてたりするようですし、もしかしたら需要が増えていくのかもしれないですね。今のところ、スマホで使える歌声合成はiVOCALOIDが最強なんですかねー。

【使いやすいか】
私はもうとっくに麻痺して慣れちゃってるのであてにならんことになってますが、Sinsyは操作と合成が分離しちゃってる分ちょっと難しいのかもしれません。

RenoidPlayerは細かいことをしようとするとちょっと小さい。たぶんスマホで指先操作しようとするときつい。

両者ともスマホユーザーをターゲットに作ってるわけではないと思うので、そういうGUIにはなってないです。たぶんそういうことをがっつり狙って開発するとiVOCALOIDみたいなことになるんでしょうか。

【じゃあどうするの】
PC向けブラウザ歌声合成はたぶん、ブラウザ上でシーケンスを作れる方が使われやすいだろう。今時のGUIが作れれば普通にウケるでしょう。

ただ、私は出てくれればどんなのでも大体使える自信と心の準備がいくらでもあるので、操作は別のソフトに全任せしてしまってコストカットするというのもアリだと思います。私は。

スマホ向けブラウザ歌声合成を作る人がいるかどうかわからないですが、これもブラウザ上で操作が完結するのが良いのかも。小さい画面で快適に操作できるGUIが作れるかがカギ。

もしかしてChromeのWebMIDIapiを使えばMIDIキーボードとかも使えるようになるのかも。需要は知らん。

という感じです。

ブラウザ系歌声合成はクロスプラットフォーム狙いか、処理が重すぎて強強サーバーで処理したいかとか狙いが絞れて開発されるものだと思うので、予算さえ取れればいいものが作れそうな予感がしますし、時代の流れから見ても求められるものになるのかもしれません。


くろ州の合成音声備忘録


その他歌声合成 トラックバック(-) | コメント(0) | [EDIT]
タイトル画像

キャラクターの濃さをはかってみたい

2019.03.05(18:47) 355

VY1にはキャラがなくて、初音ミクにはキャラがあるみたいな話は昔からずっと聞きますけど、「キャラがある」って

・名前がある
・キャラ設定がある
・ビジュアルがある
・声に特徴がある
・ユーザーが作ったキャライメージが共有されている

みたいな側面に分割できると思うのです。

【名前がある】
名前にもいろいろある。名前がなければキャラがあるとは言いにくいし、名が体を表してたりする。

1.名前がまったくない:声はあるけど型番すら特に決められていない OR 不明である
2.型番や記号がある:JF-03Aみたいな識別記号のみがある
3.有意味だけど名前感が薄い:v flowerとか名前っぽさはそんなにない
4.名前っぽい名前がある:結月ゆかりとか

1.製品として出てくる前のデモ動画とかなら名前なしはある
2.Sinsyの「f00005j」とか

【キャラ設定がある】
名前は武骨でも、謎に深い設定が用意されていたりする。そうすると「キャラ濃!!」ってなる。

1.設定がまったくない:マジでなんもない
2.最低限の設定のみ:性別や誕生日程度
3.設定がある:好きなモノとかツンデレとかその程度
4.設定が細かい:背景設定や世界観・ストーリーとかがある


1.VY1とか
2.ミクとかはこのくらい
3.歌愛ユキとか、キヨテルの生徒とか趣味が歌とかちょっとある
4.最近のIAとかLUMiとか結構作りこんでる

【ビジュアルがある】
ボカロにはビジュアルがあることが大きな特徴だったりする。

1.ビジュアルがまったくない:マジでなんもない
2.アイコン・顔のみ:「女性」「男性」くらいの解像度
3.全身全面のみ:背面とか小物設定とかはなし
4.全身・設定画付き:小物や表情・ポーズなどの設定があったりする

1.Sinsyの「f00005j」 VY1には一応扇のビジュアルがあるともいえる
2.LaLaSongのお姉さんとか、一応絵はついている
3.CeVIOのタカハシとか。裏も設定画もない
4.CeVIOのONEは設定画ある

人型かどうかを言うと、UTAU無生物音源をとらえにくくなるんだな~

【声に特徴がある】
ボカロは一応楽器なので、音は大事。名前も設定もなくても声だけでウケを狙える奴は「キャラ濃!!」ってなる。

1.平均声:技術的な意味での平均声
2.没個性:似た声がいっぱいありそう
3.普通:聞けば判別可能
4.個性的:完全に一人しかいない・頭に染み付いている

ここは正直感覚によるところなので何とも言えない。定量化する方法が欲しい。
声が個性的だと、ビジュアルや名前がなくても「キャラ濃いなぁ」ってならない?

例えばAquestoneの「Female-F1」は名前こんなだしビジュアルも設定もないけど、声が頭に染み付いちゃってて個性を感じる。

【ファンメイドの設定が共有される】
公式が作ったものがすべてじゃない。ミクのネギとかチクンナヨとか見るとキャラ濃いを感じる。

1.ユーザーが作った設定がほぼない
2.何となく方向性がある、いくつか散見される
3.定番設定がある程度共有されている、たくさんのうちの子がいる
4.もはや公式設定ばりにある


1.たいていない
2.VOCALOIDの持ち物とか
3.ボイスロイド紲星あかりの「大食い」キャラとか
4.そうそう見ない

2,3の判定は難しい。

【採点】

これで20点満点がつけられそう。点数が高いほうがいいとかじゃない。

Name:名前4点
Reference:設定4点
Appearance:見た目4点
Voice:声の個性4点
Fan's Reference:ファン由来設定4点

大体
5~キャラ弱め
10~キャラ普通
15~キャラ強め

VOCALOIDのVY1
N,R,A,V,F = {2,1,2,3,1} = 9

弱め

Sinsyのf00005j
N,R,A,V,F = {2,1,1,1,1} = 6

超弱い

CeVIOのさとうささら
N,R,A,V,F = {4,3,4,1,3} = 15

強め

声は技術的に平均声に近い。やさぐれとかボイロ実況とかでファンメイドなキャラ設定はかなりあるほう。

VOCALOIDのv flower
N,R,A,V,F = {3,1,4,4,2} = 14

ちょい強めだけど普通

名前や設定は低めで、声とビジュアルは高めな両極性が合わさって「中間」の枠内に収まっている。

何となくそれっぽくはなった。でもたぶん、「名前があってもビジュアルがない」なら「ビジュアルはあるけど名前がない」より点数が低くなるようにすべきでは? とか思うところもあるので、まだ改善したい。


くろ州の合成音声備忘録


未分類 トラックバック(-) | コメント(0) | [EDIT]
2019年03月
  1. 調声依頼を出すときのデータ作成(03/13)
  2. CeVIOマニュアル本が欲しい話(03/13)
  3. SHARPのロボット型デバイス「ROBOHON」でVoiceTextが使われているらしい(03/08)
  4. ブラウザ系歌声合成(03/07)
  5. キャラクターの濃さをはかってみたい(03/05)
前のページ
前のページ