いつか、東芝から「コエステーション」というiOSアプリが出ましたね。これは自分の声でTTS(Text to Speech)が作れるアプリです。アプリの指示に沿ってひたすら文章を読み上げていくと、自分の声質やしゃべり方とそっくりなTTSが出来上がって、いろいろ喋らせて遊ぶことができるというやつ。
UTAUの人たちは自分の声で何かしらのライブラリを作るのが好きなので、UTAU音源では飽き足らずおしゃべり音源も作りたかったりするのかもしれない。だいぶ流行りましたね。
そんなコエステーション。私が最初に見たときは「あぁこれ自分の声は使えるけど配布したり人の音源使ったりはできないのね」とか思いつつ「そのうちできるようになるんだろうな」とか考えていたんですが、制限アリでできるようになったっぽいですね。
【コエシェア機能】
自分の話声ライブラリ(以下「コエ」と表記)を他人に貸し出したり、他人のコエを借りたりできる機能だそうです。
貸し方
1.アプリでパスワードを作る
2.貸したい人にパスワードを教える
3.アプリにリクエストが来たら承認する
4.相手はコエを使えるようになる
勝手に他人に自分の声を使われることはない。声を貸し出せるのは5人まで。一般に広く公開できるわけじゃないので、音源配布という感じではない。
ちなみに「5人まで」というのは同時に貸し出せる最大人数なので、もっといろんな人に貸し出したいなら、今まで貸してた人の承認を取り消して枠を開けておいて次の人に貸すということになる。
借り方
1.借りたい人に「貸し出しやって!」と頼む
2.貸す側の人がアプリでパスワードを発行
3.パスワードをDMなりメールなりでもらう
4.パスワードを使ってアプリから貸し出しリクエストを送る
5.承認されたら使えるようになる
らしい。勝手に他人のコエを使うとかはできない。
ちなみにこれも5人からしか借りられない。無制限じゃないところがポイント。
声を借りたら、もちろん自分のスマホで好きにしゃべらせることができる。ただし、他人のコエで作った音声はSNSで共有できない。
私は今回珍しく実際にやってみないで記事を書いてるので、興味ある人は試してみて感想教えてPlease。
スポンサーサイト
くろ州の合成音声備忘録
我々の耳は完全に萌え声歌声合成に慣れてしまっているので判定基準があてにならんのですが、あてにならない耳をもってしても「これは萌え萌えですわ」って声を出す話声合成があります。
声質という意味ではなかなか。
— くろ州=情報整備士 (@96s_kM4osM) 2018年8月8日
音質はまぁ、ね。 pic.twitter.com/8g73QNZXLx
メイド喫茶っぽい。HPはここ
このサイトもうこれ以上何もないので、文字入力して合成ボタン押すだけ。
!/?などの記号は付け加えても特に変化なし。語中の句読点では変化が見られた。
音質はそんなにだけど喋り自体は結構自然で、珍しい「しゃべり方」をする話声合成なのでなかなか面白い。
くろ州の合成音声備忘録
トークロイドってUTAUでいうところのHANASUとは違って今まであんまり支援ツールがなかったんですが、出ました。「TTSV」
ダウンロードも上の動画案内文からたどれます。
OpenJTalkという学習系の話声合成がありますが(Sinsyのしゃべる版)そのしゃべり方をVOCALOIDでマネすることでトークロイドを簡単に作るというもの。
【できること】
文章を打ってボタンを押せばVSQXができる!
超簡単にトークロイドが作れます。
【使い方】
文章を打ってボタンを押せばVSQXができる!
超簡単にトークロイドが作れます。
マジでこれだけなので説明するところがあんまりない。
コツ?としては、一文をあんまり長くせずに句読点で細かく区切ることです。
設定ファイルを書き換えると、音程変化をいくらか設定できます。
ポイントはですね。
・自然な文章で入力しても(漢字とか)ちゃんと変換してVSQXにしてくれるので楽
・ちゃんと無声化するところは無声化している
上のほうで「簡単」って言ってますけど、文章打ってボタン押してこれだけ聞きやすいのはすごい。無声化してないと結構聞きづらいというかくどいカンジになってしまうところが、無声化できているので聞きやすい。
【まとめ】
拘りのトクロ勢からすると、調声の自由度とか素の状態での自然さには疑問が残るかもしれないけど、VSQXで出してくれるのでいくらでも編集可能だし、実況/解説動画をチャチャっと作りたい場合にはかなり重宝する即戦力クオリティー。
くろ州の合成音声備忘録
世の中には様々な話声合成ソフトが存在します。VOICEROIDだったりCeVIOだったり。これらは操作方法も大体に通っているんですが、今回触ってみたMegpoidTalkは結構異質。アプローチが大きく違いました。
体験版3日しか動かないのでインストールは計画的に。
【基本操作】
基本的には、文字を打ち込めば何となくしゃべってくれます。ここはほかの話声合成と大差ない。
発話スピードや声の高さはあらかじめ設定ウィンドウで大まかに決めておくことが可能です。
設定できる項目はVOICEROIDと似たような感じ。
発話させる中でスピードやピッチを随時変更するときは記号を使います。
<高さ>音声の高さ
<速さ>音声の速さ
<音質>なんか劣化します。声質とは違う
<抑揚>音声の抑揚
ちょっと差があるのはExVoice的な音声の使い方。
VOICEROIDには、発話とは別に咳だったり掛け声だったり、エディターで作るのは無理あるような音声が別途音声ファイルとして付属していたりします。
そういう音声は発話した音声と後々AviUtlだったりDAW上でぺたぺたしながら音声を作っていきますが、MegpoidTalkはソフト内部で処理しちゃいます。
↑を再生するとこうなる
セリフを書き込むゾーンに直接<くしゃみ>と打ち込むことで、くしゃみの音声が発話されます。
結果としては普通にくしゃみのサンプル音声が再生されます。タイミングはかるのムズイ。
ちなみに<定型音14>で規制音(ピー音)が鳴ります。
【ピッチ・タイミング編集】
これがMegpoidTalkの大きな特徴。よくある話声合成ソフトのアクセント編集機能はこんな感じ
丸い点を上下させて音の高さをいじります。
対してMegpoidTalkは
ピアノロールにノートが打ち込まれています。明らかにDTMERというかVOCALOIDユーザー向けな設計といった感じ。
このノートを上下左右にD&Dすることでトークを調声していきます。
時間軸でスナップしてくれないのすごく不安感ある……(スナップする意味ないけど)
細くピッチカーブが表示されていますが、これも一応手書きで修正することが可能です。
これで鍛えればトクロとかHANASUがうまくなりそう
【VSQX書き出し】
MegpoidTalkにはここで作ったデータをVSQXにして書き出す機能があります。
書き出したVSQXにほかのVOCALOIDあてればほかのキャラを簡単にしゃべらせることが可能だという算段ですね。
書き出し方にはいくつか種類があります
1.ピッチに合わせたノート&PIT を書き出す
2.一定の音程のノート&PIT を書き出す
1.の場合はこんな感じ
VOCALOIDをやってる方ならわかるでしょうが、ピッチが破綻します。直すのめんどい。
2.の場合はこんな感じ
こっちならピッチの破綻なく編集ができます。PBSが12固定になっているのでいじりにくい人もいるかも。
ピッチのほかに、うまく発音できていないノートの発音記号を修正したり、MegpoidTalk本体のほうでは無声化されるけどVOCALOIDに持ち込むと無声化されないノートの無声化をしたり、ちょっと修正が必要。
【音声トレース機能】
このソフト、マイクからの音声やWAVEファイルから音声を認識してトレースする機能があります。
1.文字は自分で入力する
2.マイクで録音する OR WAVを読み込む
3.画面上に解析結果が出る
という流れ。
試しにボイロとCeVIOをしゃべらせたものを読み込んでみたら何となく似た感じになりました。
ちなみに歌を読み込ませた結果はボロボロだった。
くろ州の合成音声備忘録
長かった。実に長かった。私がこれできるようになったのはついさっきです。
中国版CeVIOともいうべき歌声合成「MUTA」にはCeVIO同様トーク機能があるんですが、これ日本語PCでピンイン入力できるようになってるだけでは合成できないんですよ。プチプチノイズが鳴るだけ。
中国版CeVIOともいうべき歌声合成「MUTA」にはCeVIO同様トーク機能があるんですが、これ日本語PCでピンイン入力できるようになってるだけでは合成できないんですよ。プチプチノイズが鳴るだけ。
以下目次
・下準備:これがないと何もできない
・使い方:動画解説付き