タイトル画像

正弦波重畳方式

2016.12.06(19:33) 120

「正弦波重畳方式」というのは歌声音源の合成方式の一つです。

音というのは波ですよね。いわゆる「音波」です。

そしてその波の形を「波形」と言います。
あ 波形図1:「あ」の波形 

この音波には「いくつかの正弦波に分解できる」という性質があるのです。

詳しいことや正しいことが知りたい方は「音声 フーリエ解析」とかで検索してみましょう。

正弦波とは? y=sinxのグラフです。
sinx=y.png 図2:y=sinxのグラフ

いろんな周期の正弦波=SIN波を畳のように重ねて図1のような波形が作れれば、「中の人のいない音源ができる」ということですね!!

手順1)解析
 「あ」の波形はどんな正弦波の組み合わせでできているのかを調べます。ツールはExcel。
あ 周波数 図3

こんな感じ。
要するに

344Hz   0.05
689Hz   0.10
1033Hz   0.22
1378Hz   0.18
1722Hz   0.05

くらいの構成になっているのです。

つまり

y=0.05×sin(344×2π)+
    0.10×sin(689×2π)+
  0.22×sin(1033×2π)+
  0.18×sin(1378×2π)+
  0.05×sin(1722×2π)

が「あ」の近似式なのです。

実際の合成には「私の好みの音源数種」の平均を用いて、しかもきれいな式になるように数値をいくつか改変して、息成分を少なめにした式を使いました

手順2)数式⇒波形
 1)で作った式をグラフに起こします。ツールはGRAPES。
sinple.png 図4

ずいぶんとシンプル。実際の合成ではもっと複雑な式でやりました。
このGRAPESはコマンドで波形を再生してくれる機能があるのでそれでWAVEファイルを作ります。

手順3)1周期切り出し&ループ
 できたWAVEから1周期分切り出してループ再生して再録音。ツールはAudacity。これでやっと聞ける感じになってきます。この行程がないととても聞けない。

手順4)ピッチ・ダイナミクスをつける
 できた波形は現在こんな感じ。
現状図5 

ピッチに適度な揺らぎを与えて、波形を人の声っぽくトリミングします。ツールはVocalShifter。
手書き 図6

黄色がピッチ線、緑がダイナミクスです。これは手書きしています。

結果。
キャプチャ図7
 
手順5)エフェクト掛け
 人らしさがないので、エフェクトでぽくします。ツールはModernExciter(エキサイター)。
人の声に聞こえるようになるまで調整します。これは好み。ここで差が付きます。

完成!!


あ、い、う、え、お、だけ作りました。
スポンサーサイト


くろ州の合成音声備忘録


その他歌声合成 トラックバック(-) | コメント(0) | [EDIT]
<<モーラとシラブル(拍・音節)の違い | ホームへ | REAPER日本語化>>
コメント
コメントの投稿













管理者にだけ表示を許可する