タイトル画像

フリーライド歌声合成 Nakloid

2017.05.11(20:42) 141

UTAU音源はUTAU以外のソフトでも使えることがあります。今回はUTAUにフリーライドしている「Nakloid」という歌声合成ソフトを使ってみました。
歌声を聞いてみましょう。いい曲です。

【概要】
「Nakloid」はUTAU音源とUST/MIDIがあれば歌声を合成してくれるWinで動くソフトウェアです。

ソースコードがMITライセンスで公開されているようなので、いろいろいじれるみたいです。

【配布場所】
手っ取り早く歌声合成をしたいなら「Nakloid GUI」を使います。こちらのページでダウンロードできます。

【導入】
ソフトを動かすためにはJavaのランタイムが必要なので先にインストールしておきます。正直本家様の導入方法を読めば全部わかります。のでもう本家様にフリーライドさせていただきます。

【導入可能なUTAU音源】
Nakloidにはデフォルトで歌声ライブラリが付属していないので自分で導入する必要があります。

ここで注意するべきはUTAU音源には「UTAU以外のソフトで読み込んでいい音源」と「UTAU以外のソフトで読み込んではいけない音源」があるということです。

音源のReadmeや規約をよく読んで導入してもいいものだけ導入しましょう。


今回は私もかかわったのでその辺安心な「会長ロイド」を使います。

もろもろ導入できたらとりあえず起動してみます。

【操作画面】
起動直後はとてもシンプル
Nak01.png 

音符表示画面
ファイル>楽譜をインポート でUSTかMIDIを読み込みます
nak02.png 
ウィンドウ上部には合成波形が表示され、ピアノロールも表示されますが、グリッドは表示されません。また、ノートのタイミングはミリ秒で指定するようになっているのでゼロからの打ち込みは厳しいです。

ピッチ表示画面
F2キーでピッチ編集用の画面になります。
nak03.png

ピッチ曲線はフリーハンドで描けます。ちなみに元に戻すことはできないという男気仕様です。元USTでのピッチ情報は保持されないようです。 

ちなみに選択部分のみ合成&再生というのもないです。常に全部再生します。

設定
Nakloid GUIの細やかさはここに出ます。 オプション>設定 で歌い方の設定をすることができます。

特徴的な項目は

微細変動:ピッチのヒューマナイズ?
オーバーシュート:オーバーシュートを自動で入れたり入れなかったり調節できる
プレパレーション:プレパレーションを自動で入れたり入れなかったり調整できる
簡易コンプレッサー:簡単にコンプレッサーをかけてくれる

【その他の機能たち】
あまり詳しく調べられていませんが

・原音設定
・Nakloid特有のピッチマーカーの編集
・話し声合成

など、力の入れどころからしても実際にはこちらがメインな気がします。

【まとめ】
・歌声合成の勉強によい
・ピッチが手書きできる
・波形を編集中に見られる
・歌声合成部分はガチ



スポンサーサイト

くろ州の合成音声備忘録


その他歌声合成 トラックバック(-) | コメント(0) | [EDIT]
タイトル画像

所有UTAU音源レビュー(4)緋惺

2017.05.10(08:46) 140

UTAU音源/キャラクターの名前は「読める」「読めてるつもりが読み違えている」「読み方に迷う」「そもそも全く読めない」くらいに分類されると思いますが、とりあえず「緋惺」さんは「あけさと」と読みます。

声を聴いてみましょう。


【特徴】
・基本は力強め
・単独音/連続音/CVVCとして使えるものもあって調声自由度がとても高い
・一つの音階で音階が多い=ピッチシフトで劣化しにくい&音域が広い

拡張音源もそこそこあるので選ぶのに迷うかもしれませんが、HPがとても親切なのでHPに沿って音源を選べば幸せになれそう。

MMDや絵素材も本家さまで用意してくださっているので動画素材にも困らず総合的に見て使いやすいです。



くろ州の合成音声備忘録


UTAU トラックバック(-) | コメント(0) | [EDIT]
タイトル画像

日本語の「が」の発音

2017.04.10(12:10) 139

東北方言ですが「わからない」を「わがんね」と発音してみてください。

この「が」の発音。東日本の人は「N a」、関西の人は「g a」イマドキの東日本の人は「G a」と発音するそうです。

「N a」
いわゆる「鼻濁音」と言う発音で「ンが」と聞こえたりします。英語の「ing型」の「ng」と書けば「N a」が「な」ではなく「が」であることがわかるかもしれません。関西の人は発音できない/発音するのが苦手と言われたりする。

「g a」
普通の「が」。有声軟口蓋破裂音と言います。

「G a」
最近の日本人が「N a」の代わりに使う発音で有声軟口蓋摩擦音。「N a」が緩んだ発音と言える。

聞き分けてみましょう


東北弁として発音があってるかどうかは置いといて
1.わ「g a」んね
2.わ「N a」んね
3.わ「G a」んね
誇張気味の発音です。

UTAU音源の場合「ガ」行は鼻濁音で録音することも多いですが、西日本の人は発音できていなかったりおかしなことになっていることが多く、また、絶対に録らないといけないわけでもないのでスルーされることもあります。

しかし、あったらあったで人気の音素らしいので、どうしても「N」が発音できないようなら「G」で発音するのも一つ手かなと思います。


くろ州の合成音声備忘録


制作 トラックバック(-) | コメント(0) | [EDIT]
タイトル画像

内破音

2017.04.10(11:03) 138

「いっっっっっっっっっった!!」と発音してみてください。

この「っ」が内破音です。

正確には違いますが。もう少し正確に説明しましょう。

「いっっっっっっっっっった!!」と発音するときに、「っ」の状態で止めてみて舌の位置を確認してください。

「い」を発音した後すぐに上の歯茎に舌先をあてて音を止めてますね。

「あっっっっっっっっっっか!!」と発音したらどうでしょう。

「あ」の発音のすぐ後に下の後ろのほうで音を止めてますね。

「いっっっっっっっっっっぱ!!」と発音した場合は

「い」の後すぐに口を閉じて音を止めてますね。

つまりは「発音が違う」わけです。

「内破音」は「破裂音の破裂しないやつ」です。

破裂せずに内にとどめた状態ですね。

聞き比べてみましょう。

1個目が「k」の内破音
2個目が「p」の内破音
3個目は内破音ではないので今回はスルー
4個目が「t」の内破音

後半ではそれぞれ破裂音として発音しています。

発音が違ったのが聞き分けられましたか?

UTAU調声の時「あっか」を
akka01.png
と打つと、内破音が再現できていません。

CVVC音源の「a k」音素を使うか、連続音化して「a か」の子音速度を下げると内破音が再現できます。
akka02.png  


くろ州の合成音声備忘録


制作 トラックバック(-) | コメント(0) | [EDIT]
タイトル画像

帯気音化

2017.04.10(10:33) 137

いきなりですが、
日本語で「ペン」と発音してみてください。
次に英語の「pen」を発音してみてください。

正しく発音すればこの2つの「p」の発音が「別のものである」事がわかります。

日本語で「ペン」と発音した場合
「p」の後すぐに「e」がきて「N」で終わるでしょう。

対して英語で「pen」と発音すると
「p」の後少し間があって「e」が来たあと「n」で終わります。

つまり、「e」の発音が遅れるのです。

そしてこの「間」には「h」のような息成分でできた音が挟まっています。

これが帯気音化(有気音化とも)です。

聞き比べてみましょう。

最初の「た」は帯気音化なし。
2番目は軽い帯気音化。
3番目がかなりの帯気音化。

「母音が遅れ」て「hが挟まる」のがわかったと思います。波形を見てもわかりやすいです。
帯気音図 
帯気音化は基本的に無声破裂音の行(か行、た行、ぱ行など)で起こります。

破裂音のいわゆる「破裂」部分を「バースト」と呼びますが、バーストから母音(有声音)までの長さを「VOT」と呼びます。帯気音化した発音はこのVOTの値が正の方向に大きいです。

歌唱表現としてもそこそこ使われるのでUTAU音源に組み込んでみてもいいかもしれません。


くろ州の合成音声備忘録


制作 トラックバック(-) | コメント(0) | [EDIT]
最近の記事
  1. フリーライド歌声合成 Nakloid(05/11)
  2. 所有UTAU音源レビュー(4)緋惺(05/10)
  3. 日本語の「が」の発音(04/10)
  4. 内破音(04/10)
  5. 帯気音化(04/10)
次のページ
次のページ