中国の歌声合成ソフト「Sharpkey」が先日アップデートしてさらに機能が追加されました。この歌声合成は純粋にかなりすごいと思うし、とっても好きなので皆さん触ってみてください。
ちなみにVOCALOID・UTAU・CeVIOの配合率は6:2:2くらいです。
歌声を聞いてみましょう。
ホームページはこちら
表現力ありますよね。早速使ってみました。
【ファイルサイズ】
エディター自体はそんなに大きくないですが、音源サイズはばかでかいです。Huan Xiao Yiの音源インストーラーのサイズは1.4GBで、インストール後の音源本体とみられるファイルは1.91GBあります。後述しますが4音階音源のようなのでファイルサイズは妥当より少し大きいかもくらい。少なくともHMMベースなだけの音源ではないようです。
【音源】
現在配布されている音源は幻晓伊(Huan Xiao Yi)とサードパーティー?の琪亚娜(Kiana)のようです。Kianaはもともとあるゲームのキャラクターのようですね。
【操作画面】
楽譜(ノート入力)画面
とってもVOCALOIDライクになっています。使い心地は良好で、中国語が読めなくても迷いなく操作できます。アタックやビブラートの編集窓(クリックで表示される)はVOCALOIDとほぼ一緒。
VOCALOIDと少し違うのは左のピアノロールは押しても音が出ないこと、ビブラートはツールで伸縮できないことあたりです。
歌詞の入力は中国簡体字かピンインでできます。音素の指定をしたい場合はピンインで入力します。TABキーで次のノートに移ったり、歌詞の流し込みができるのも大体同じ。
UTAUと同様にブレスはノートとして打ち込むことができます。
画面上の真ん中あたりにある「参数」をクリックすると編集モードになります。この時ピアノロールの左上に出る鉛筆マークの中から編集したい項目を選びます。
編集画面 音量
純粋な音量調節で、声質は変わらない。VOCALOIDのDYNとほぼ同じ機能。上下の幅が結構広いのでかなり大きく動かしてるつもりでも思ったほど変化はない感じ。
編集画面 音調
ピッチ編集モードです。これはCeVIOとほぼ同じ操作感でフリーハンドかラインツールでピッチを感覚的に手書きできます。ビブラートはついた状態で表示され、もろとも編集できる。
編集画面 亮度
VOCALOIDのBRIと大体同じもの。声の明瞭度・明るさ・ハリをコントロールします。
編集画面 力度
これはとてもいいパラメーターで、オリジナルのものと言えます。声の強さをコントロールすることができます。この時の「声の強さ」は音量の変化というよりも声質の変化、つまり「力強さ」です。
力度0から徐々に上げていくとこうなる
編集画面 気声
これはVOCALOIDのBREと同じもので、息っぽさをコントロールできます。割とノイジーというよりは自然な仕上がりになってくれました。
編集画面 声線
今回はいじってませんがVOCALOIDのGENと同じものです。あげると男性的に・年齢が高くなり、下げると女性的に・年齢が低くなります。
編集画面 音素
これはCeVIOのタイミング調整画面に近いもので、各ノートの発声タイミングをコントロールできます。子音の長さを変えたければ赤の区間をいじります。CeVIOの人は慣れている画面と近いですが、VOCALOIDの人はVELや母音分割で対応しているあたりで、UTAUの人は子音速度で対応している部分になります。
編集画面 音色
この画面ではそのノートで使うサンプルの変更ができます。UTAU的な機能です。VOCALOIDやUTAUは中の人の声を録音して切り貼りしているわけですが、録音した音程から大きく離れた音を出そうとするとどうしても無理が出るので、高い声や低い声も同様に録音して対応しています。この画面を見た感じではHuan Xiao Yiは4音階音源のようです。
左の色分けはUTAUのプリフィックスマップと同じようなものでサンプルの対応範囲を示しています。フラグをクリックするとサンプルが選択でき、中域高めの音程(T3の対応範囲)を鳴らすときに低域のサンプル(T1)を鳴らすことも可。
UTAUの人はG4の音程で「- あ」と鳴らすときに、その音が気に入らなければ「- あC4」など別音程のサンプルを引いてくることがありますが、その感覚です。
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
と、このようにSharpkeyはいろんな要素を詰め込んだ歌声合成であることがわかります。
VOCALOIDのようなノート・パラメーター編集
UTAUのような音素選択・ブレス打ち込み
CeVIOのようなピッチ・タイミング編集
オリジナルの力度編集
さらに、噂によると歌声ライブラリの自作もできるようになるらしい(あくまで噂)ので今後UTAU音源制作勢の参入も期待です。
今回できた音声を一応置いておきます。
スポンサーサイト
くろ州の合成音声備忘録
UTAUは音源が自作できるという特性から、音源の技術開発が激しい分野になっています。
数多ある工夫の中から今回は「換起点音源」というのを使ってみました。
1)換起点とは
「換起点」というのは「ミドルボイスとヘッドボイスが変わる点」のことを言います。
歌を知らない人に向けて言うと「ナチュラルな歌声と裏声の変わり目」でOK
これを連続音音源で再現するのは案外大変です。
連続音音源の場合、音素の切り貼りの境目は音符の変わり目と比べてかなり前のほうにあります。
①が音符の変わり目②が音素の変わり目です。
要するに例えば上の図の2個目の音素を裏声にしたいとき、後ろを「弱」音素や「囁」音源にした場合①のタイミングで声質が変わってほしいのに、②のタイミングでささやき始めてしまうのです。
2)対応
意地でも連続音で対応しようという場合は②のラインが①の位置に来るまで後ろの音素のタイミングをずらしてピッチを描きなおすと思います。
CVVCや単独音の場合(もしくはCVVCや単独音音素が切り出されている連続音)ならあまりいろいろ考えずともノートの変わり目で声質を変えればOK
換起点は連続音の弱点だったのです。
単独音やCVVCでも換起点を再現しているというよりは回避しているだけです。
さらに、通常の音素と弱・囁音素の接続はその声質が大きく異なるためどの形式にしてもどのエンジンにしても頑張ってごまかさなければならない程度の接続クオリティーになることが多いです。
そこで換起点音源の出番となるわけです。
3)換起点音源とは
これは私の考えですが、「換起点も録っちゃえばいいんじゃん?」という発想で
ミドルボイスとヘッドボイスを行ったり来たりする方法で録られた拡張音源の一種です。
(ピッチは手書きしたので誰の原音というわけでもないです)
ピッチが高い時にはヘッドボイスになっていて、低い時にはミドルになっているのでいろいろ考えなくてもいい感じに切り替えができます。
【まとめ】
ミドルとヘッドの切り替えが楽
以上。
これを使うとこんな感じになります。
くろ州の合成音声備忘録
今回紹介するプラグインはFLUXの「BitterSweet」です。
【効果】
素材のドラムはこちら。
これにBitterSweetをかけてみます。まずは右側「Bitter」のほうにつまみを回します。
アタックが強くなってタイトになっています。
逆にBitterSweetのつまみを左側「Sweet」のほうに回すと、
アタックが弱くなった分余韻が相対的に大きくなり、ルーズになっています。
ドラムを締めたり緩めたりがつまみを回すだけでコントロールできて簡単です。マスタリングではコンプの代わりに使っても簡単です。
それなりにMIXをやってる人ならすぐ気づくと思いますが、Sweetのほうはコンプでもできるんですね。
しかし、コンプで同じことをしようとすると①アタック最速②リリース短めに設定して③スレッショルドは中程度④レシオは若干大きめにして調整する必要があって手間が多く、初心者には難しいです。
【まとめ】
アタック感が簡単にコントロールできる
結論は簡潔ですがこれは大きい。
ダウンロード&インストールはこちらから(https://www.fluxhome.com/download)
FLUX Centerをダウンロード&インストールして起動。BitterSweet(Free)を探してインストールボタンを押せば完了です。