トークロイドってUTAUでいうところのHANASUとは違って今まであんまり支援ツールがなかったんですが、出ました。「TTSV」
ダウンロードも上の動画案内文からたどれます。
OpenJTalkという学習系の話声合成がありますが(Sinsyのしゃべる版)そのしゃべり方をVOCALOIDでマネすることでトークロイドを簡単に作るというもの。
【できること】
文章を打ってボタンを押せばVSQXができる!
超簡単にトークロイドが作れます。
【使い方】
文章を打ってボタンを押せばVSQXができる!
超簡単にトークロイドが作れます。
マジでこれだけなので説明するところがあんまりない。
コツ?としては、一文をあんまり長くせずに句読点で細かく区切ることです。
設定ファイルを書き換えると、音程変化をいくらか設定できます。
ポイントはですね。
・自然な文章で入力しても(漢字とか)ちゃんと変換してVSQXにしてくれるので楽
・ちゃんと無声化するところは無声化している
上のほうで「簡単」って言ってますけど、文章打ってボタン押してこれだけ聞きやすいのはすごい。無声化してないと結構聞きづらいというかくどいカンジになってしまうところが、無声化できているので聞きやすい。
【まとめ】
拘りのトクロ勢からすると、調声の自由度とか素の状態での自然さには疑問が残るかもしれないけど、VSQXで出してくれるのでいくらでも編集可能だし、実況/解説動画をチャチャっと作りたい場合にはかなり重宝する即戦力クオリティー。
スポンサーサイト
くろ州の合成音声備忘録
最近いろんな歌声合成が10周年を迎えています。VOCALOIDに影響されて開発されたものが多いのでVOCALOID10周年以降にこういうイベントが各ソフトで続くことになるんですが、去年みくが10周年を迎えてお祭り騒ぎしているうちに20周年を迎えていた超古参ソフトが「My MidiVocalist」です。
このソフトの情報は「My Midi Vocalist」でも「MyMidiVocalist」でもうまく出てきません。「My MidiVocalist」だと出るんです。なんなんでしょうね?
【概要】
My MidiVocalistはWindowsで動く歌声合成ソフトです。初版は1997/01/06ということで、私が生まれたのが1996年なのでちょっと年下です。ヤベェ。ちなみに最終更新は2009年。
なんと(制限は強いが)オケのMIDI編集と歌詞入力などのボーカル編集がシームレスにできたり、UTAUのように多音階音源が作れたりと絶対この人時代違うだろって言う技術が詰まっています。
【導入】
このページからダウンロード可能。有料ソフトということになっているが基本的には寄付という形になるし、寄付しても何も起こらない。
ダウンロードしたら中のMSIを実行してインストール。簡単。
【使い方】
「My MidiVocalist」を起動すると、めちゃくちゃシンプルかつ小さいウィンドウが出ます(下図右上)
「ファイル」から「歌声ファイルを開く」でサンプルの曲が読み込めます。
最初は右下の「チャンネルリスト」が表示されるんですが、ここでびっくりポイント1
歌声だけでなく伴奏も編集することができる。
こいつ……今ある歌声合成の中で唯一「歌声合成ソフトに伴奏編集機能までついてしかもシームレスに編集可能」なのです。は?ってかんじ。
とはいってもゼロからMIDIを作るのではなく、MIDIは読み込みでそれを多少編集できるくらいです。VOCALOIDがボカキューとか言っているよりずーっと前にこれやってたってどういうことだってばよ……
メロディートラックをダブルクリックすると左の歌声編集画面が出てきます。
古のマジ打ち込みによるノート編集なのでかなりやりにくいですが。
基本的にこのソフトはゼロから曲を作り上げるんではなく、もともとあるMIDIに歌詞を付け加えて再生するというのがメインの使い方のようです。
普通にWAV保存できるというのもMIDIシーケンサーとしては結構先進的ですよね。LRで音量調整すらできます。
このほかにもびっくりするぐらい機能が詰まっています。ほんとにこの人この時代の人か?
歌声の細かい編集はほぼ望めないのでそういうあたりはVocalShifterに頼ることになります。
【音源制作】
デフォで男声音源が一つついてますが、なんとこのソフトUTAUのように音源を自作することができます(びっくりポイントその2)
形式はUTAU単独音みたいなものなんですが、このソフト単体でガイド音声付きで録音するところから原音設定まで可能。嘘だろ……
↑録音ウィンドウ(ガイド音声も流してくれる)
↑原音設定画面(なんか見たことあるし”ノーマライズ”とか見える)
ちょっと原音設定してみたけど、鬼のように細かく設定できる。
多音階に対応するためプリフィックスに相当する記号まで……
もはや恐ろしい。
【まとめ】
ナニコレ。時代の先取りしすぎだし多機能すぎる。
くろ州の合成音声備忘録
[About]
These are romaji encoded UTAU CVVC&VCV recording lists for Japanese.
[Reclist types]
3, 4, 5, 8, 17CVVC_A:CVVC list with continuous vowels (VV)
3, 4, 5, 8, 17CVVC_AH:CVVC with VV and VCV recordings for "h" consonants
3, 4, 5, 8, 17CVVC_ARH:CVVC with VV and VCV recordings for "r", "ry" and "h" consonants
3~8, 16, 36, 44VCV:Full VCV romaji recording list
[Explenation]
These recording lists are for people whose computer doesn't support the Japanese writing system, has technical issues due to Mojibake and for those who cannot read hiragana well. This is why "Kurosu style romaji reclists" are made for.
I just translated Hiragana version of these reclists.
CVVC_A: For smooth vowels, vowels are in continuous sound style.
CVVC_AH: "h" are in this as VCV because "h" has a lot of sound variations making hard to sound natural as CVVC.
CVVC_ARH: Has all same than two lists above but with VCV "r" [4] and "ry" [4'] because these sounds can be too short and so hard to make smooth as CVVC. Has also continuous vowels.
[License]
- Editing the recording list is allowed
- If used reclist, I will be happy
- I will be very happy if you told me about the usage of my reclist
[Forbitten usage]
- Any illegal usage towards law
- Any act that causes unfavorable circumstance for Kurosu
[Disclaimer]
- I take no responsibility of usage of these files.
[To contact]
Twitter is the fastest way to contact me( @ 96s_kM4osM )
===============
Readme translated by Yukito Yuki (@ xingtuxue)
These are romaji encoded UTAU CVVC&VCV recording lists for Japanese.
[Reclist types]
3, 4, 5, 8, 17CVVC_A:CVVC list with continuous vowels (VV)
3, 4, 5, 8, 17CVVC_AH:CVVC with VV and VCV recordings for "h" consonants
3, 4, 5, 8, 17CVVC_ARH:CVVC with VV and VCV recordings for "r", "ry" and "h" consonants
3~8, 16, 36, 44VCV:Full VCV romaji recording list
[Explenation]
These recording lists are for people whose computer doesn't support the Japanese writing system, has technical issues due to Mojibake and for those who cannot read hiragana well. This is why "Kurosu style romaji reclists" are made for.
I just translated Hiragana version of these reclists.
CVVC_A: For smooth vowels, vowels are in continuous sound style.
CVVC_AH: "h" are in this as VCV because "h" has a lot of sound variations making hard to sound natural as CVVC.
CVVC_ARH: Has all same than two lists above but with VCV "r" [4] and "ry" [4'] because these sounds can be too short and so hard to make smooth as CVVC. Has also continuous vowels.
[License]
- Editing the recording list is allowed
- If used reclist, I will be happy
- I will be very happy if you told me about the usage of my reclist
[Forbitten usage]
- Any illegal usage towards law
- Any act that causes unfavorable circumstance for Kurosu
[Disclaimer]
- I take no responsibility of usage of these files.
[To contact]
Twitter is the fastest way to contact me( @ 96s_kM4osM )
===============
Readme translated by Yukito Yuki (@ xingtuxue)
ここから日本語
【概要】
4, 5, 8モーラのUTAU用日本語リスト(CVVC・VCV)です。ローマ字で書いてあります。
【種類】
3, 4, 5, 8, 17CVVC_A:ア行がVCVでそれ以外がCVVCのローマ字リスト
3, 4, 5, 8, 17CVVC_AH:ア行とハ行がVCVでそれ以外がCVVCのローマ字リスト
3, 4, 5, 8, 17CVVC_ARH:ア行とラ行とリャ行とハ行がVCVでそれ以外がCVVCのローマ字リスト
3~8, 16, 36, 44VCV:すべてVCVのローマ字リスト
【解説】
UTAU日本語音源を日本語ではないシステム上で作るとき、リストがローマ字であれば文字化けの心配がなく、ひらがなが読みにくい人も音源を作れる。
そのためのリストが「くろ州式ローマ字リスト」です。
内容は日本語リストをローマ字にしただけ。
CVVC_Aは母音連続音をとるためにア行だけ連続音形式になっています。
CVVC_AHはア行に加えて子音の違いが激しいハ行が連続音です。
CVVC_ARHはさらに子音が短すぎてCVVCにしにくいラ[4]行とリャ[4']行を連続音にしています。
【ライセンス】
・リスト内容は改変可
・使った場合は表示していただけると喜ぶ
・事後報告してもらえるとめっちゃ喜ぶ
【禁止事項】
・法に触れる行為
・くろ州にとって都合の悪い事態になる行為
【免責】
・関連ファイル群を利用したことによる責任は、一切
負うことはない。
【連絡】
Twitterが最速( @96s_kM4osM )
くろ州の合成音声備忘録
何らかの理由でUTAU音源をこんな感じでローマ字入力にしたい場面があったとしましょう。
これ、どういうエイリアスにすればいいのか私はかなり悩んだのでまとめておきます。
【内容】
・基本的に準拠するリスト
・「ん」の扱い
・ザ行/ガ行/Yi/Wu他特殊行
・例
* The sale of this Blog content has been discontinued.
You can enjoy content with other Sales settings.
View a list of MagabloSM here!
What is MagabloSM?
You can enjoy content with other Sales settings.
View a list of MagabloSM here!
くろ州の合成音声備忘録
ソフトが使われるかどうかの一つの観点として「導入が簡単かどうか」ってあると思うんですね。そういうわけでいろんな歌声合成の導入難易度を「価格・手数・情報」というところから比較してみました。
VOCALOID(3, 4)
-価格:Editor=10k & 音源=8~3k
-手数:パッケージ版の場合 購入→インストール→アクティベーション(エディター・音源ごとに)
-情報:ネットで「VOCALOID インストール」って検索しても上位に公式情報出るし、パケにインストール方法は全部書いてある
金があれば恵まれた環境でスタートできる
VOCALOID(5)
-価格:V5=27k 高い
-手数:(アカウント登録)→購入→ダウンロード→インストール→アクティベーション(エディター・音源ごとに)
-情報:購入できるならあとはできる。購入も公式ページから可能
価格が高くてちょっとハードル上がったかな
PiaproStudio
-価格:15k程度 音源とエディターが同梱なので安め
-手数:パケ購入→インストール→アクティベーション(エディター・音源ごとに)
-情報:パケに導入方法が書いてある説明書あるクリプトン勢狙いならハードルは低め
UTAU(WIN)
-価格:0 ハードルなんてない
-手数:ダウンロード→インストール(エディター・音源ごとに)
-情報:分散している 初心者はちょっと頑張る必要がある最小構成なら超簡単。でも快適に使うための環境構築となると結構難しい。知り合いのUTAU民にやってもらうのが吉
CeVIO
-価格:ソングスターターパック=8.5k(割とよくセールしてるので6k台のことも多い)安め
-手数:購入→ダウンロード→インストール→アクティベーション(エディター・音源ごとに)
-情報:「CeVIOインストール」で公式情報がすぐ出るVOCALOIDと比べたときに安い分ハードルが低くなる
VST系(Aquestone, Alter/Ego, DelayLama)
-価格:0
-手数:ダウンロード→インストール だまされてはいけない
-情報:ほぼないこれは結構難しい。それぞれダウンロード場所を見つけるのが難しい、Alter/Egoは音源導入方法も特殊、DAW&VSTの知識がないと本体インストールも難しい。日本語情報ほぼないし。ハードルは高め
ブラウザ系(Renoid, Sinsy)
-価格:0
-手数:ページにアクセスするだけ
-情報:ページにアクセスすれば全部ある導入ハードルが最強に低いのはこれ。Webアプリなのでページに行けばいいだけ。Sinsyは行った後の使い方がむずいけども
中国・韓国系(MUTA, Sharpkey, NIAONIAO, VOCALINA)
-価格:0(VOCALINAはサブスクリプション=600\/月)
-手数:ダウンロード→インストール(エディター・音源ごとに)
-情報:少ないし日本語じゃないハードル高い。MUTAとかただ「MUTA」って検索しても本家HP出てこない。しかも日本語対応してないので読めない。SharpkeyとVOCALINAに関してはダウンロードファイルがくそでかいのでその点でも難しい。
UTAU音源読み込める系(Cadencii, Nakloid, OpenUTAU, なめうぇーぶ)
-価格:0
-手数:ダウンロード→インストール(ZIPを展開するだけ) ※OpenUTAUは別
-情報:ほぼないOpenUTAUは「GitHubからDLしてSLNファイルをVSで開いてビルド」なので難易度MAX。導入方法は本家HPにも書かれてなかったりする。うちのブログには大体書いてあるぞ
他(Mikovoice, HANAUTAU, LaLaSong, SugarCape)
-価格:0
-手数:ダウンロード→インストールが多い
-情報:ほぼないここに手を出す人はすでに歌声合成かなりいろいろやってるはずなので逆にハードル低い(逆に)
【まとめ】
まぁ、導入方法はほとんどこのブログにまとまってるんですけどね!
結論としては導入ハードルが最も低いのはRenoidPlayer、最も高いのはOpenUTAU。この情報誰の役に立つんだ?
くろ州の合成音声備忘録
VOCALOIDの大型アップグレードが来て時代はV5に突入したわけですが、V5開幕してからの1番人気音源は「Ken」という日本語男声音源でほぼ決まりなように見えます。
ここへきて男声音源が注目されてきていますが、VOCALOID界隈では昔からこんなことが言われてきました。
「男少なくね?」
ということでとりあえず割合を調べてみました。
・VOCALOID
男女比 24:57 男声比率29.6%
思ったよりいた。海外に多い。ZORAを3カウントしてたりする。ショタはとりあえず男声にカウント
・UTAU
男女比 測定不能 試しにUTAU音声ライブラリWikiに載ってるものだけ調べると
300:450 男声比率40%
多分もうちょっと女声に傾くと思うけど、比較的男声は多い。
・CeVIO(ソング・トーク含め)
男女比 5:7 男声比率41.7%
かなり高め。母数が少ないというのもあるけど。
・Sinsy
男女比 2:4 男声比率33.3%
母数が少ない&ちょい低め。
・Renoid
男女比 4:5 男声比率44.4%
かなり高い。
・NIAONIAO
男女比 78:168 男声比率31.7%
ちょい低め。
・LaLaSong
男女比 3:3(+ロボット×3) 男声比率50%
完全なる50% たぶんそうなるように作ってる。
DelayLama
男声比率100%
僧侶しかいないし参考にはならない。
・Sharpkey/MUTA/Aquestone/MikoVoice/VOCALINA
男声比率0%
女声しかない。母数は1~5なのであまり参考にはならない
【男声は少ないか】
女声と比較して少ないのは事実。ただし思ったよりいる。
【なぜ?】
・男声は技術的に難しい説
内部の技術者じゃないので正しいことはわからないけど、「男声は難しい」ということをよく聞くのはVOCALOIDのみ。実際のところ極端な例を除けば男声比率が最も低いのはVOCALOID。
・男声は作っても売れない説
売れ行きも内部の人間じゃないので知らないけど、ライブラリを販売しているVOCALOID/CeVIO/VOCALINAの中でも男女比はかなりばらけながらおおむね女声の割合がかなり高め。
でも最近は「オタクの中でも金がより落ちるのは女性向けコンテンツ」って言うし売れないこともない気はする。
・男声バーチャルシンガー作るのそんなに楽しくない説
知らない。
・女声のほうが楽曲に使いやすい説
いろんな側面あるけどMIXしやすいのはやっぱり女声。もしくは男声向きの曲よりも女声向きの曲のほうがリスナーにウケてるのかもしれない。
くろ州の合成音声備忘録
歌声合成の中でも本体がVSTなものはリアルタイムで演奏できたりします(Alter/Ego、Aquestone、DelayLamaなど)それをちょっと演奏してみようというのがこの記事。
歌詞も含めてやろうとすると一気に難易度が上がってしまうので(歌う楽器界隈というのもあるよ)今回は歌詞なしで。
ウインドシンセでリアルタイムに歌声合成Alter/EgoのMarieを演奏し、歌詞はないけど雨とペトラをカバーする動画。 pic.twitter.com/cItPBooQed
— くろ州=貧困 (@96s_kM4osM) 2018年7月13日
演奏している楽器は電子管楽器ウインドシンセ。歌声合成はAlter/EgoのMarieOrkです。
【演奏方法】
1.DAW起動
2.Alter/Egoを読み込んで歌詞を入れておく
3.演奏を録音
簡単。子音の長さが長いとリアルタイム演奏しにくくなるので最速に設定しておきます。でもそうすると聞き取りにくくなるジレンマ。
【結果】
・たまに子音の分だけ遅れる
・聞き取りにくい
・けどまぁそこそこ行ける
・でも正直何やってるか歌声合成の人もいまいちわかんなさそう
【ついでに】
歌う僧侶も演奏しました。
ついでなので歌う僧侶でも雨とペトラ演奏してみた。
— くろ州=貧困 (@96s_kM4osM) 2018年7月13日
発音は右手の親指でコントロールできるよ。 pic.twitter.com/QLdwh4UQoj
くろ州の合成音声備忘録
DAWで読み込めるVSTタイプの歌声合成ってAlter/Ego、Aquestone、DelayLamaといろいろあるんですが、今回ネタ枠で入ってきたのがMinimal Instrumentの「Minimaliser」です。
どうも、幼児向けおもちゃ絵本にたまにあるひらがな読み上げるちょっとした機械をサンプリングしたものらしいです。HPはここ
【機能】
Glide:意味不明な音になる(意味不明)
Cut Off:ハイパスとかローパスとかかけられる
Pitch:ちょっと変わります。
Volume:音量
Pan:パン
Reverb:リバーブ
【ノート打ち込み】
C-2ノートからE8までの鍵盤を広々と大胆に使い、それぞれのノートに1文字分発音をあてはめています。
C-1=あ
C0=か
C#0=が
E8=ん
といった具合。サウンドフォント版Renoidみたいなシステム。
そうして歌詞を打ち込んだ後、何かしらの音程補正ツールで無理やり音階をつけます。
ちなみにほぼ誤判定しかしないのでかろうじて音程がつくかもしれないくらいのものです。
そして、鍵盤をどんなに押し続けても絶対に音を伸ばしてくれないので、「あ」はロングトーンのつもりで鍵盤推しても「あ。」です。
そうやって歌わせたのがこちら。
【まとめ】
まぁ楽しい。