fc2ブログ

タイトル画像

合成音声のスペクトログラムを見てみよう

2019.10.06(10:34) 419

 スペクトログラムというのは、音声のスペクトルに時間軸付け足してビジュアライズしたものです。これを見ると合成音声の性質がちょっと見えてくるぞ。

・人間の生声
SPEHuman.png

 これはUTAUの原音ですね。綺麗。

・VOCALOID
SPEVocaloid.png

 結構人に近い気もする。ピッチの整ってる感は人工な感じ。

・UTAU
SPEUtau.png

 かなり息成分が出ている。子音も見やすい。UTAUは全体的に息成分が生きやすい気がする。ちなみにエンジンはfresamp14。

・CeVIO
SPECeVIO.png

 超低音域が結構出ている。ONEの特徴かと思いきや、CeVIOは大体この100Hz以下の低音が強め。

SPECeVIO2.png

 拡大してみると、息成分がだいぶ整っていることが分かる。

・VOICEROID(歌ボ)
SPEVoiceroid.png

 息成分少な目。子音は明瞭。子音以外にたまに入っている縦線は歌ボ特有の「-伸ばし」によるもの。

・Sinsy
SPESinsy.png

 Sinsyも息成分が少なめ。案外高音域が弱め。

SPESinsy2.png

 Sinsyのスペクトログラムはかなり特殊な感じ。息成分に「X」のような模様がよく出る。これのせいというわけじゃないだろうが、息成分だけ取り出すと結構ゴワゴワした音であることが分かる。

・SynthV
SPESynthV.png

 低音も含め息成分がまんべんなくしっかりと出ている。

・Alter/Ego
SPEAlterego.png

 息成分あまりなし。高音はあんまり出てない。

・Aquestone(無印)
SPEAquestone.png

 中域・中高域の息成分が案外ある。高音はさっぱり出てない。子音以外の縦線はシンセでいうところのアタック部分。

・LaLaSong
SPELala.png

 高音域は足りてないながらも結構健闘している。基本周波数と低めの倍音当たりの幅がなぜか広い。

・MUTA
SPEMuta.png

 システムやUIはCeVIOに似ているけど、音は別に似ていない。

・OpenUTAU
SPEOpenUTAU.png

 UTAUと同様、息成分がだいぶ正しく出ている感じ。

・Sharpkey
SPESharpkey.png

 息成分はあんまりない。
スポンサーサイト





くろ州の合成音声備忘録


その他歌声合成 トラックバック(-) | コメント(0) | [EDIT]
<<NeoCeVIO(仮)見てきた | ホームへ | どんな歌声合成でも囁かせられるツール「ToWhisperTone」>>
コメント
コメントの投稿













管理者にだけ表示を許可する