タイトル画像

無機能ブラウザ

2016.12.11(15:05) 122

音声合成とは関係ないのですが、プログラミングの勉強しないとということで、フリーソフトを作りました。

その名も「無機能ブラウザ」

戻るボタンすらないシンプル設計。本体はたったの10KB。すべての操作はショートカットでします。

メリット
・軽い
・余計な機能がついてないからわずらわしさがない
・「目的のことばが調べられればいい」という人向け
・ショートカットが使える人向け

デメリット
・できることが少ない
・ショートカット使えない人には全く使えない
・対応していないWebサービスが多い
・それなりにバグる

C#でプログラミングしました。フォームにWebBrowser貼り付けただけの5分間プログラミングです。README書く方が時間かかりました。



くろ州の合成音声備忘録


制作 トラックバック(-) | コメント(0) | [EDIT]
タイトル画像

VOCACONまとめ⑩ 滑舌と発音の沼

2016.11.01(13:56) 79

もともと管楽器を演奏していた身としては、正直歌詞は聞いていないのです(弾き語りができないから)。そんなこともあって「滑舌」に注目したことはありませんでした。

【UTAUの滑舌】

滑舌に関係してくる要素は、中の人と原音設定です。

中の人

中の人の滑舌が悪かったら、申し訳ありませんがどうにもなりません。

原音設定

滑舌が悪いといわれてしまっている音源はおそらく原音設定が間違っているのだと思います。先行発声のタイミングのミスをすると滑舌が悪くなってきます。

もう一つはオーバーラップの長さです。ここが長いと滑らかにつながりますが、早口に対応できなくなります。私は一定の値に決めずに、前の音素の右ブランクのあたりにオーバーラップを設けて左ブランクとオーバーラップの間は先行発声と子音区間の間の長さと同じくらいを目安にしています。

【発音】

滑舌のほかに「口の開き方」や「喉の締め具合」など「声」に関するパラメーターはほかにもたくさんあります。しかしこれらをすべて音源にして収録するといくらあっても足りないので、これはフラグでの調声で対応してもらうことになります。

VOCALOIDならGENやBRI・OPEをいじるでしょう。それと同様にしてUTAUも調声することになります。




くろ州の合成音声備忘録


制作 トラックバック(-) | コメント(0) | [EDIT]
タイトル画像

VOCACONまとめ⑨ 録音とトリートメントと初心者向け・上級者向け

2016.11.01(13:22) 78

【録音とその後のトリートメント】

録音の時に残響やノイズ以外に気を付けるべきなのが「マイクプリアンプ」です。と言ってもそこまで気を付けることはないのですが。ポイントは「無個性で上質なマイクプリ」を選ぶことです。

たまに、ボーカルの録音に限らず真空管プリアンプを使う場合があります。これはこれで別にいいのですが、ここでの「味付け」はUTAUでの編集もまだ残っている状態ですので、かえってその後のMIXやマスタリングの自由度を奪ってしまう可能性があります。

録音後にもファイルには下手に手を加えない方がいいと思っています。リップノイズとその他ノイズを消したらそのままでいいのではないでしょうか。

ポイントは「下手にいじらない」

【初心者向けと上級者向け】

「良UTAU音源」と言いながらそれが「誰にとっての」良音源であるかについてはあまり触れることができませんでした。ターゲットは重要な要素ですね。

UTAUは無料の歌声合成ソフトであるので、中学生や高校生など「VOCALOIDやってみたいけどお小遣いではどうにもならない」という人が多いようです。

そんな初心者の皆さんが求めるものは何かといえば

「簡単に上質なものが作れること」

でしょう。もちろん質を上げようと思えば、連続音やCVVC音源を使うことは必須になってきますが、初心者ですので「簡単に」ということが重要なのです。

一般的なソフトであればこの辺はGUIデザインを変えるだのなんだので対応していくのでしょうが、UTAUは音源からのアプローチが可能です。

1.単独音であること、もしくは単独音として利用可能であること
2.ナチュラルな歌声で挙動が安定していること(要するによく言うことを聞く素直な音源であること)
3.WAVEファイルに出力した後トリートメントが少なくて済むこと

あたりは必要だと思います。

2.は中の人の声質と、正しい原音設定により実現され、3.は録音から設定までの間の作業によって実現されるでしょう。

私はその後の上達も含めて考えると単独音として利用可能であるほかに連続音やCVVCとしても利用可能である形式を推しています。

こうすることで初心者から上級者まで対応できるライブラリになれると思っています。


くろ州の合成音声備忘録


制作 トラックバック(-) | コメント(0) | [EDIT]
タイトル画像

VOCACONまとめ⑧ 宅録とノイズと中の人(=姫)

2016.11.01(12:57) 77

【宅録とノイズ】
UTAU音源は多くの場合「自宅で深夜にこそこそと録音」することが多いです。

製品でもなければ、有償でもないしましてやお遊び程度のものだったりするので、そこにお金をかけることはないし、そもそもUTAU自体が「VOCALOID持ってないので…」から始まっている以上、経済的な余裕はないんですね。

そんなわけでUTAU音源でよくあるのが

・ハムノイズやエアコンのノイズが載っている
・変な残響音が残っている
・声が小さかったりおどおどしている

などです。

ノイズに関してはエアコンはもちろん切るというのと「蛍光灯も切る」とノイズが減るみたいです。ここからもノイズが出ているというのは盲点でした。

録音後にGateエフェクトでノイズリダクションという方法もありますが、これもお金をかけないといいものは手に入らないのです。フリーのものには限界があります。そういえばそもそもフリーでゲートってあんまり見ないかもしれない。

ノイズが載るような環境だったり宅録ではリスニング環境が悪かったりしてノイズが載っていても気づかないということも多いようです。

だからと言ってスタジオで録音しようとすると、これもまた残響をなくす努力は同じくらい必要になってきます。バンドの練習もできるようなスタジオだと余裕でお隣の音が漏れてきて話にならないですし。

プロの方によると
「押入れが最強」とのこと。中にある布団が音を吸ってくれるので残響音がない。

また、Airbnbで別荘一つ借りちゃってとるというのもありだそうな(高くつくけどスタジオより安い)

まとめると
「郊外の閑静でお隣さんとの距離もある一軒家の押し入れで、部屋の電気もエアコンも消して録音」がベスト。

【中の人の体調と気分】

思いっきり歌える環境は必要最低限です。音源の魂である中の人は「姫待遇」で行きましょう。全力で気分がよくなるようにおもてなしいたしましょう。どんなにその他で頑張っても、ソースがダメではどうにもならないです。

中の人の体力を考えるとやはり収録時間も長くはできないです。


くろ州の合成音声備忘録


制作 トラックバック(-) | コメント(0) | [EDIT]
タイトル画像

VOCACONまとめ⑦ 音源の容量と名前

2016.11.01(12:28) 76

【音源の容量とスピード】

DTMの世界では「音源の容量」は重要なポイントです。品質を上げようとすれば容量が大きくなっていくことが多いので、いくつも音源を入れているとすぐにHDDがいっぱいになってしまう、というのもありますが、

「スピード」です。

多くのVSTは処理にかかる負荷とスピードが重要になってきます。

UTAUはそもそも本体の仕様としてリアルタイム性がないので、容量が大きくて遅いとか小さくて速いとかいうこともなく、どちらかというと合成エンジンとの相性によるところが大きいです。そのためUTAU音源の配布ページには「推奨エンジン」が書かれていることもしばしばあります。

【表情音源の名前】

容量のついでに。ノーマルの音源のほかの表現力アップのための追加音源を「表情音源」と言いますが、UTAUだとここに「素敵な花の名前」とか「美しい日本語」などがつかわれることが多いです。

とても情緒があっていいのですが、「これはどういう声質の音源なのだろうか」と思うことはしばしばあります。

私は表情音源を作るときはシンプルに「Power」「Soft」と名付けて、エイリアスも「PC4(PowerC4)」と名付けています。


くろ州の合成音声備忘録


制作 トラックバック(-) | コメント(0) | [EDIT]
制作
  1. 無機能ブラウザ(12/11)
  2. VOCACONまとめ⑩ 滑舌と発音の沼(11/01)
  3. VOCACONまとめ⑨ 録音とトリートメントと初心者向け・上級者向け(11/01)
  4. VOCACONまとめ⑧ 宅録とノイズと中の人(=姫)(11/01)
  5. VOCACONまとめ⑦ 音源の容量と名前(11/01)
前のページ 次のページ
前のページ 次のページ