FC2ブログ

タイトル画像

MegpoidTalk使ってみた。

2018.06.02(03:26) 232

世の中には様々な話声合成ソフトが存在します。VOICEROIDだったりCeVIOだったり。これらは操作方法も大体に通っているんですが、今回触ってみたMegpoidTalkは結構異質。アプローチが大きく違いました。

体験版3日しか動かないのでインストールは計画的に。

【基本操作】
基本的には、文字を打ち込めば何となくしゃべってくれます。ここはほかの話声合成と大差ない。

発話スピードや声の高さはあらかじめ設定ウィンドウで大まかに決めておくことが可能です。
MegpoidTALK設定

設定できる項目はVOICEROIDと似たような感じ。

発話させる中でスピードやピッチを随時変更するときは記号を使います。
<高さ>音声の高さ
<速さ>音声の速さ
<音質>なんか劣化します。声質とは違う
<抑揚>音声の抑揚

ちょっと差があるのはExVoice的な音声の使い方。

VOICEROIDには、発話とは別に咳だったり掛け声だったり、エディターで作るのは無理あるような音声が別途音声ファイルとして付属していたりします。

そういう音声は発話した音声と後々AviUtlだったりDAW上でぺたぺたしながら音声を作っていきますが、MegpoidTalkはソフト内部で処理しちゃいます。
MegpoidTALK実験

↑を再生するとこうなる


セリフを書き込むゾーンに直接<くしゃみ>と打ち込むことで、くしゃみの音声が発話されます。

結果としては普通にくしゃみのサンプル音声が再生されます。タイミングはかるのムズイ。

ちなみに<定型音14>で規制音(ピー音)が鳴ります

【ピッチ・タイミング編集】
これがMegpoidTalkの大きな特徴。よくある話声合成ソフトのアクセント編集機能はこんな感じ
Megpoid VOICEROID

丸い点を上下させて音の高さをいじります。

対してMegpoidTalkは
MegpoidTALK.png

ピアノロールにノートが打ち込まれています。明らかにDTMERというかVOCALOIDユーザー向けな設計といった感じ。

このノートを上下左右にD&Dすることでトークを調声していきます。

時間軸でスナップしてくれないのすごく不安感ある……(スナップする意味ないけど)

細くピッチカーブが表示されていますが、これも一応手書きで修正することが可能です。

これで鍛えればトクロとかHANASUがうまくなりそう

【VSQX書き出し】
MegpoidTalkにはここで作ったデータをVSQXにして書き出す機能があります。

書き出したVSQXにほかのVOCALOIDあてればほかのキャラを簡単にしゃべらせることが可能だという算段ですね。

書き出し方にはいくつか種類があります
1.ピッチに合わせたノート&PIT を書き出す
2.一定の音程のノート&PIT を書き出す

1.の場合はこんな感じ
Megpoid VOCALOID01

VOCALOIDをやってる方ならわかるでしょうが、ピッチが破綻します。直すのめんどい。

2.の場合はこんな感じ
Megpoid VOCALOID02

こっちならピッチの破綻なく編集ができます。PBSが12固定になっているのでいじりにくい人もいるかも。

ピッチのほかに、うまく発音できていないノートの発音記号を修正したり、MegpoidTalk本体のほうでは無声化されるけどVOCALOIDに持ち込むと無声化されないノートの無声化をしたり、ちょっと修正が必要。

【音声トレース機能】
このソフト、マイクからの音声やWAVEファイルから音声を認識してトレースする機能があります。

1.文字は自分で入力する
2.マイクで録音する OR WAVを読み込む
3.画面上に解析結果が出る

という流れ。

試しにボイロとCeVIOをしゃべらせたものを読み込んでみたら何となく似た感じになりました。


ちなみに歌を読み込ませた結果はボロボロだった。
スポンサーサイト


くろ州の合成音声備忘録


話声合成 トラックバック(-) | コメント(0) | [EDIT]
<<UTAU音源収録に必要なものまとめてみた。 | ホームへ | Sharpkey日本語カバー投稿祭>>
コメント
コメントの投稿













管理者にだけ表示を許可する