タイトル画像

BPM別UTAU音源を考える

2017.06.11(12:51) 142

中の人の立場になった時、UTAU音源の収録台本は一定のテンポ(BPM)で収録しますが「どれくらいのテンポで収録するか」には様々な視点と好みがあります。

現実的なところでは肺活量や発音の面で向き不向き好き嫌いのあるものですが、こんな考え方があるようです。

「高めBPMで収録したらテンポの速い曲向きの音源になり、低めのBPMで収録したらテンポの遅い曲向きの音源になるのでは?」

高いBPMでの収録は自然にテンションが上がるとか低いBPMでの収録では落ち着いたテンションになりやすいという部分の違いもあるかもしれないというのは今回置いておいて

今回は子音の長さに着目します。

テンポによって子音の長さが変わるならテンポの遅い曲を収録時のBPMが高い音源で歌わせたら子音の長さが合わないのでは? その逆もあるかもしれません。

という話を聞いたので実験してみました。

【方法】
 ・台本は「_あかさたなはまやらわがざだばぱ」
 ・BPM=100, BPM=120, BPM=150でそれぞれ収録
 ・子音ごとに直前の母音が終わった時点から直後の母音が始まるまでの時間を計る
    →子音の長さがそこそこ違うならBPM別音源はこの点において意味がありそう
    →子音の長さが同じならBPM別音源はこの点では意味がなさそう

子音の長さという言い方は正確でないですね。
全体の発音時間はBPM=100 → 9秒, BPM=120 → 7.5秒, BPM=150 → 6秒
BPM=68とかBPM=180とか極端なものも録ればよかったと後悔しながら。

【結果】
測定の結果はこちら。縦軸単位は(ms)

Graph01.png

私の発音癖もあるでしょうが、BPMが上がるにつれて子音の長さが短くなるものと120の時にのみ長くなるものができました。

【まとめ】
とりあえずそこそこ違う(と私は判断する)のでこの点でBPM別音源には意味がありそうです。

汎用性の高い音源というよりはジャンル特化型音源を作るときによさそうです。


スポンサーサイト

くろ州の合成音声備忘録


制作 トラックバック(-) | コメント(0) | [EDIT]
タイトル画像

日本語の「が」の発音

2017.04.10(12:10) 139

東北方言ですが「わからない」を「わがんね」と発音してみてください。

この「が」の発音。東日本の人は「N a」、関西の人は「g a」イマドキの東日本の人は「G a」と発音するそうです。

「N a」
いわゆる「鼻濁音」と言う発音で「ンが」と聞こえたりします。英語の「ing型」の「ng」と書けば「N a」が「な」ではなく「が」であることがわかるかもしれません。関西の人は発音できない/発音するのが苦手と言われたりする。

「g a」
普通の「が」。有声軟口蓋破裂音と言います。

「G a」
最近の日本人が「N a」の代わりに使う発音で有声軟口蓋摩擦音。「N a」が緩んだ発音と言える。

聞き分けてみましょう


東北弁として発音があってるかどうかは置いといて
1.わ「g a」んね
2.わ「N a」んね
3.わ「G a」んね
誇張気味の発音です。

UTAU音源の場合「ガ」行は鼻濁音で録音することも多いですが、西日本の人は発音できていなかったりおかしなことになっていることが多く、また、絶対に録らないといけないわけでもないのでスルーされることもあります。

しかし、あったらあったで人気の音素らしいので、どうしても「N」が発音できないようなら「G」で発音するのも一つ手かなと思います。


くろ州の合成音声備忘録


制作 トラックバック(-) | コメント(0) | [EDIT]
タイトル画像

内破音

2017.04.10(11:03) 138

「いっっっっっっっっっった!!」と発音してみてください。

この「っ」が内破音です。

正確には違いますが。もう少し正確に説明しましょう。

「いっっっっっっっっっった!!」と発音するときに、「っ」の状態で止めてみて舌の位置を確認してください。

「い」を発音した後すぐに上の歯茎に舌先をあてて音を止めてますね。

「あっっっっっっっっっっか!!」と発音したらどうでしょう。

「あ」の発音のすぐ後に下の後ろのほうで音を止めてますね。

「いっっっっっっっっっっぱ!!」と発音した場合は

「い」の後すぐに口を閉じて音を止めてますね。

つまりは「発音が違う」わけです。

「内破音」は「破裂音の破裂しないやつ」です。

破裂せずに内にとどめた状態ですね。

聞き比べてみましょう。

1個目が「k」の内破音
2個目が「p」の内破音
3個目は内破音ではないので今回はスルー
4個目が「t」の内破音

後半ではそれぞれ破裂音として発音しています。

発音が違ったのが聞き分けられましたか?

UTAU調声の時「あっか」を
akka01.png
と打つと、内破音が再現できていません。

CVVC音源の「a k」音素を使うか、連続音化して「a か」の子音速度を下げると内破音が再現できます。
akka02.png  


くろ州の合成音声備忘録


制作 トラックバック(-) | コメント(0) | [EDIT]
タイトル画像

帯気音化

2017.04.10(10:33) 137

いきなりですが、
日本語で「ペン」と発音してみてください。
次に英語の「pen」を発音してみてください。

正しく発音すればこの2つの「p」の発音が「別のものである」事がわかります。

日本語で「ペン」と発音した場合
「p」の後すぐに「e」がきて「N」で終わるでしょう。

対して英語で「pen」と発音すると
「p」の後少し間があって「e」が来たあと「n」で終わります。

つまり、「e」の発音が遅れるのです。

そしてこの「間」には「h」のような息成分でできた音が挟まっています。

これが帯気音化(有気音化とも)です。

聞き比べてみましょう。

最初の「た」は帯気音化なし。
2番目は軽い帯気音化。
3番目がかなりの帯気音化。

「母音が遅れ」て「hが挟まる」のがわかったと思います。波形を見てもわかりやすいです。
帯気音図 
帯気音化は基本的に無声破裂音の行(か行、た行、ぱ行など)で起こります。

破裂音のいわゆる「破裂」部分を「バースト」と呼びますが、バーストから母音(有声音)までの長さを「VOT」と呼びます。帯気音化した発音はこのVOTの値が正の方向に大きいです。

歌唱表現としてもそこそこ使われるのでUTAU音源に組み込んでみてもいいかもしれません。


くろ州の合成音声備忘録


制作 トラックバック(-) | コメント(0) | [EDIT]
タイトル画像

日本語の「ら」の発音

2017.04.10(10:10) 136

日本語の「ら」行は世界的に見ても珍しい発音です。

英語を習っているとよく「ローマ字では『ら』を『ra』って書くけど、どっちかというと『la』だよね」とか「日本語の『ら』がうまく聞き取ってもらえないときは『da』と発音するとよいことがある」とか言われます。

正直、私としては日本語の「ら」には「ra」「la」「da」の性質が少しずつ含まれていると思います。

日本語の「ら」行の子音は多くの場合「そり舌はじき音」といってVOCALOIDでは「4」と書かれる音です。

これは
・「r」ほどではないにしても少し下を巻き
・「l」のように舌を硬口蓋前目に着け
・「d」ほどでは内にしても少し破裂(はじく)
発音です。

イマドキの若者の間では発音に変化が起きて「はじき」の成分が弱まって、英語の「l」に近づいているようです。

「ら」を聞き比べてみましょう

1.日本語の「ら」。現代日本人が使う英語の「La」に近い発音。少し違うがX-SAMPAでは「4 a」
2.英語の「Ra」。舌を巻いて口の上に近づけるだけの「ら」。そり舌接近音。「r\' a」
3.英語の「La」。舌を巻かずに口の上につけるが舌の両端はどこにも触れていない「ら」。歯茎側面接近音。「l a」
4.スペイン語の「Ra」。巻き舌。歯茎震え音。「r a」 

かなり誇張した発音になっています。


くろ州の合成音声備忘録


制作 トラックバック(-) | コメント(0) | [EDIT]
制作
  1. BPM別UTAU音源を考える(06/11)
  2. 日本語の「が」の発音(04/10)
  3. 内破音(04/10)
  4. 帯気音化(04/10)
  5. 日本語の「ら」の発音(04/10)
次のページ
次のページ