タイトル画像

UTAU用7モーラ連続音リスト配布

2017.08.10(00:13) 147

UTAU連続音を録るためのちょっと意味深な7モーラリストができたので配布します。


【概要】
くろ州が作ったUTAU連続音用7モーラリスト

【特徴】
・「てゅ」のブロックとロングトーンのブロック以外で法則が崩れない
・各ブロックの各行はそれぞれ「あ」「い」「う」「え」「お」「ん」で終わる(活用の余地として)
・総発音回数192回
・BPM=120, ワンループ16拍のBGMで収録した場合リテイクなしなら理論上25分36秒で収録可能
・ロングトーン音素のエイリアスは「x -」
・語尾息のエイリアスは「x R」
・「くぁ行」「ガ行(鼻濁音)」のブロックがない
・「ヴぁ行」のブロックはある

【ライセンス】
・リスト内容は改変可
・使った場合は表示していただけると喜ぶ
・事後報告してもらえるとめっちゃ喜ぶ

【禁止事項】
・法に触れる行為
・くろ州にとって都合の悪い事態になる行為

【免責】
関連ファイル群を利用したことによる責任は、一切負うことはない

【連絡】
Twitterが最速( @96s_kM4osM )



くろ州の合成音声備忘録


制作 トラックバック(-) | コメント(0) | [EDIT]
タイトル画像

Twitterに音声だけUpしたい以下略AviUtl用テンプレート

2017.07.17(20:05) 145

歌声合成界隈ではTwitterが宣伝ツールとしてよく使われていますね。Twitter上でシームレスに音声や動画が試聴できるというのはプロモーション的にもいいらしいですが、

Twitterって音声そのまま投稿できないんですよね。

Soundcloudを使えばTwitter上で音声をそのまま再生できますが、なにやら危ういのか危うくないのか危うい状況なのです。

つまり、Twitterに(その場で再生できる)音声を上げようとしたら動画を作らないといけなくなるのです。

めんどい!

というわけでそういう場合は真っ黒な画面に音声をくっつけたり頑張って背景をつけたりしているようですのでテンプレートを作りました


【ダウンロード】

【使い方】
1.「音声差し替え」レイヤーの「DummieSound.wav」をUpしたい音声ファイルに差し替える
2.「コメント編集」レイヤーの「Sample TEXT」をTwitterIDや簡単な説明に書き換える
3.動画の長さを指定する
4.「つんでれんこ」などのエンコードツールでTwitter用にエンコード
5.TwitterにUpする

めんどい!

いえ。比較的めんどくないと思います。10分程度で作れます。

ちなみに背景を変えることも可能。線の色味も合わせると


キャラのイラストを最初に登録しておけばずっと簡単に生成し続けられます。


くろ州の合成音声備忘録


制作 トラックバック(-) | コメント(0) | [EDIT]
タイトル画像

BPM別UTAU音源を考える

2017.06.11(12:51) 142

中の人の立場になった時、UTAU音源の収録台本は一定のテンポ(BPM)で収録しますが「どれくらいのテンポで収録するか」には様々な視点と好みがあります。

現実的なところでは肺活量や発音の面で向き不向き好き嫌いのあるものですが、こんな考え方があるようです。

「高めBPMで収録したらテンポの速い曲向きの音源になり、低めのBPMで収録したらテンポの遅い曲向きの音源になるのでは?」

高いBPMでの収録は自然にテンションが上がるとか低いBPMでの収録では落ち着いたテンションになりやすいという部分の違いもあるかもしれないというのは今回置いておいて

今回は子音の長さに着目します。

テンポによって子音の長さが変わるならテンポの遅い曲を収録時のBPMが高い音源で歌わせたら子音の長さが合わないのでは? その逆もあるかもしれません。

という話を聞いたので実験してみました。

【方法】
 ・台本は「_あかさたなはまやらわがざだばぱ」
 ・BPM=100, BPM=120, BPM=150でそれぞれ収録
 ・子音ごとに直前の母音が終わった時点から直後の母音が始まるまでの時間を計る
    →子音の長さがそこそこ違うならBPM別音源はこの点において意味がありそう
    →子音の長さが同じならBPM別音源はこの点では意味がなさそう

子音の長さという言い方は正確でないですね。
全体の発音時間はBPM=100 → 9秒, BPM=120 → 7.5秒, BPM=150 → 6秒
BPM=68とかBPM=180とか極端なものも録ればよかったと後悔しながら。

【結果】
測定の結果はこちら。縦軸単位は(ms)

Graph01.png

私の発音癖もあるでしょうが、BPMが上がるにつれて子音の長さが短くなるものと120の時にのみ長くなるものができました。

【まとめ】
とりあえずそこそこ違う(と私は判断する)のでこの点でBPM別音源には意味がありそうです。

汎用性の高い音源というよりはジャンル特化型音源を作るときによさそうです。



くろ州の合成音声備忘録


制作 トラックバック(-) | コメント(0) | [EDIT]
タイトル画像

日本語の「が」の発音

2017.04.10(12:10) 139

東北方言ですが「わからない」を「わがんね」と発音してみてください。

この「が」の発音。東日本の人は「N a」、関西の人は「g a」イマドキの東日本の人は「G a」と発音するそうです。

「N a」
いわゆる「鼻濁音」と言う発音で「ンが」と聞こえたりします。英語の「ing型」の「ng」と書けば「N a」が「な」ではなく「が」であることがわかるかもしれません。関西の人は発音できない/発音するのが苦手と言われたりする。

「g a」
普通の「が」。有声軟口蓋破裂音と言います。

「G a」
最近の日本人が「N a」の代わりに使う発音で有声軟口蓋摩擦音。「N a」が緩んだ発音と言える。

聞き分けてみましょう


東北弁として発音があってるかどうかは置いといて
1.わ「g a」んね
2.わ「N a」んね
3.わ「G a」んね
誇張気味の発音です。

UTAU音源の場合「ガ」行は鼻濁音で録音することも多いですが、西日本の人は発音できていなかったりおかしなことになっていることが多く、また、絶対に録らないといけないわけでもないのでスルーされることもあります。

しかし、あったらあったで人気の音素らしいので、どうしても「N」が発音できないようなら「G」で発音するのも一つ手かなと思います。


くろ州の合成音声備忘録


制作 トラックバック(-) | コメント(0) | [EDIT]
タイトル画像

内破音

2017.04.10(11:03) 138

「いっっっっっっっっっった!!」と発音してみてください。

この「っ」が内破音です。

正確には違いますが。もう少し正確に説明しましょう。

「いっっっっっっっっっった!!」と発音するときに、「っ」の状態で止めてみて舌の位置を確認してください。

「い」を発音した後すぐに上の歯茎に舌先をあてて音を止めてますね。

「あっっっっっっっっっっか!!」と発音したらどうでしょう。

「あ」の発音のすぐ後に下の後ろのほうで音を止めてますね。

「いっっっっっっっっっっぱ!!」と発音した場合は

「い」の後すぐに口を閉じて音を止めてますね。

つまりは「発音が違う」わけです。

「内破音」は「破裂音の破裂しないやつ」です。

破裂せずに内にとどめた状態ですね。

聞き比べてみましょう。

1個目が「k」の内破音
2個目が「p」の内破音
3個目は内破音ではないので今回はスルー
4個目が「t」の内破音

後半ではそれぞれ破裂音として発音しています。

発音が違ったのが聞き分けられましたか?

UTAU調声の時「あっか」を
akka01.png
と打つと、内破音が再現できていません。

CVVC音源の「a k」音素を使うか、連続音化して「a か」の子音速度を下げると内破音が再現できます。
akka02.png  


くろ州の合成音声備忘録


制作 トラックバック(-) | コメント(0) | [EDIT]
制作
  1. UTAU用7モーラ連続音リスト配布(08/10)
  2. Twitterに音声だけUpしたい以下略AviUtl用テンプレート(07/17)
  3. BPM別UTAU音源を考える(06/11)
  4. 日本語の「が」の発音(04/10)
  5. 内破音(04/10)
前のページ 次のページ
前のページ 次のページ