FC2ブログ

タイトル画像

歌声合成ソフトのピッチコントロールは大体3系統に分けられる

2019.08.27(23:41) 409

 皆さんの好きな歌声合成ソフトは何ですか? その歌声合成ソフトでピッチを描くとき、どうやって書きます?

 ピッチの描き方には結構好みが出るので、ソフトによって好き嫌いが激しく分かれます。個人的には、「歌声合成ソフトの使いやすさ」はほぼピッチで決まると思っている。

 好みが出るということは、普段使っているソフトと似た操作方法のソフトは手になじみやすく、似てないソフトはなじみにくい可能性が高いということでもある。今回は大体3系統に分けてみようと思います。ちなみに複数カテゴリーにまたがるソフトもある。

【タイプV】
 VOCALOIDのようなMIDIっぽい書き方をするもの。ピッチカーブを直接いじることはできず、ノートごとにピッチベンドをいじって間接的にピッチを描いていく方式。ピッチベンドを使う以外に、複数のノートを組み合わせてピッチをコントロールする「ノート分割」を使うことも多い。

 VOCALOID、Alter/Ego、Aquetone、Cadencii、ディレイラマ、NIAONIAO、PiaproStudio、Renoid、SynthVなど

 ピッチベンドがなく、ノート分割のみでピッチをコントロールするものもこのカテゴリーの内部グループかも。

 EmVoice、SugarCapeなど

【タイプU】
 UTAUのような制御点を打ってピッチをコントロールするもの。調声スピードは出しにくいが、最も綺麗なピッチカーブが描ける。基本的にはUTAUとUTAUリスペクトの歌声合成ソフトのみが対応している。

 UTAU、OpenUTAU、UTSUなど

【タイプC】
 CeVIOのようなピッチカーブを直接手描きするもの。感覚的にピッチが描けて、大分自由度が高いが、タイプUの人は特に苦手意識を持ちやすい。マウス操作との相性が悪い。まずもってノート分割はしない。

 CeVIO、MUTA、Nakloid、なめうぇーぶ、NIAONIAO、Sharpkey、・SynthVなど

 調声機能を持たないため、ピッチ調声をVocalShifterなどでやる場合、VSがピッチ手描き系なので、このカテゴリーの下位カテゴリーとしよう。すべての歌声合成でVSは使えるので全部入るといえなくもない。

 LaLaSong、MikoVoice、Sinsy、歌うボイスロイドなど

スポンサーサイト




くろ州の合成音声備忘録


その他歌声合成 トラックバック(-) | コメント(0) | [EDIT]
タイトル画像

歌声合成ソフト30選

2019.08.26(23:52) 408

 Twitterで「全部まとめとる奴おらんな?」みたいなトークを見かけたので「おっしゃやったろうこのやろう」と思って書きました。30選とは書いたけど数字はテキトー。

・VOCALOID3、4
 めっちゃ普通の歌声合成ソフト。標準的すぎてどう表現すればいいのか悩む。キャラクター歌声合成に限っていえば、ユーザー数と知名度はおそらく世界最多。音源数もだいぶ多い。

・VOCALOID5
 最新版VOCALOID。ワンクリックでしゃくりが作れたりするので省エネ調声向き。これまでのVOCALOIDと比べてプロDTMERむけっぽさがすごい。V4慣れしてるとこれじゃない感する。

・VOCALOID SDK for Unity
 ゲームとかに組み込む用VOCALOID。使える音源は「ランタイム版Unity-chan!」。しばらく無料配布されていたが、正式にはもう配布されてない。

・Mobile VOCALOID Editor
 iOS上で動くVOCALOID。本体も安いし音源も安いのでiPhoneとかiPad持っている場合は結構おすすめ。ただ、iPhoneは画面がちっさすぎるのでiPad推奨。

・UTAU
 自分で音声ライブラリを作れる歌声合成筆頭。多様性がすごすぎて一言では言い表せない。一言で言うなら「多様性の塊」。世界で最も音声ライブラリが多いソフト。2位との差は数千個。

・CeVIO
 ベタ打ちでもそこそこいいカンジで歌うので初心者向けなソフト。歌声合成ソフトの中でも最も音素の長さを細かくいじれる。音源によってはしゃべれる。

・Alter/Ego
 DAW上で動くプラグインタイプの歌声合成。英語音源が多いが、日本語も歌えるし、フランス語音源もある。実は歌声合成ソフトの中でも最も声質パラメーターが多いものだったりする。たぶん。

・Aquestone
 プラグインタイプの歌声合成。MIDIキーボードを使ってリアルタイムに歌わせるのに特化している。こういう原始的な歌声合成ソフトを本気でいじり倒して神調教を施すのが最強に楽しい。

・Aquestone2
 Aquestoneの2号機。声はだいぶ違うし、よりシンセサイザーらしい機能が増えている。かなり楽器寄りのソフトなので、デチューンが搭載されてたりポリフォニックに対応してたりする。

・Cadencii
 汎用歌声合成エディター。これ自体はあくまでエディターなので、エンジンや音源を入れないと何にもならない。Aquestone、Aquestone2、VOCALOID2、UTAU等いろんな歌声合成が使える。

・DeepVocal
 したーのほうにあるSharpkeyの後身。機能は減ってしまっているが、音源制作ソフトとセットで放出されているので、アグレッシブUTAU音源制作ピープルの餌食になっている。

・ディレイラマ
 プラグインタイプの歌声合成ソフト。母音しか歌えない。使い方によって毒にも薬にもなる。オランダ製。歌わせているとGUIの僧侶が微妙に動く。めっちゃうざい顔する。

・EmVoice
 プラグインタイプの歌声合成。英語の発音があまりにも良すぎる。透き通る神秘的な声。声はすごく良いが、操作性が息していない。操作性はアレだが、なんにしても声がいい。

・HANAUTAU
 歌声合成? リアルタイム特化型歌声合成ソフト。ピッチ調声は自分の喉で行う。歌声をマイクで拾い、ピッチを抽出。それを音源に適用して歌わせる難しい奴。

・LaLaSong
 東芝の古いソフト。世にも珍しい五線譜で入力するタイプ。発音タイミングは若干危ういが、若干なのでマシ。30くらい触ってればかわいいほう。調声はVocalShifterやWAVES TUNEでやる。

・MikoVoice
 トークもできる歌声合成ソフト。世にも珍しい文字で入力するタイプ。古も古のMIDIシーケンス手打ち文化圏。その時代のソフトというわけではない。基本アプリに組み込む形で使う。

・MUTA
 中国のCeVIOっぽいソフト。ちょっと前まではしゃべる機能付いてた。ピッチカーブがほかのソフトと違う位置に描画されるのでちょっと混乱する。エディターの色がエグイ。

・My MidiVocalist
 2000年より前からある歌声合成ソフト。MIDI読み込みでオケを鳴らすこともできるし、音源制作もできる。ただしフォルマントフィルターがないので超多音階音源にしないといけない。

・Nakloid
 UTAU音源を読み込める歌声合成。基本はUTAUのようなソフトで、出音が結構硬い。ちなみに「元に戻す」がないので超がんばって。打ち込みは基本UTAUでやってUSTを読み込んだほうがいい。

・なめうぇーぶ
 人力用歌声合成ソフト。UTAU音源も読み込めるが、WAVEファイル群から音素を切り出しまくる機能もある。MIDIキーボードを使えば、おそらく世界で最も高速でベタ打ちができるソフト。

・NIAONIAO
 中国のUTAUっぽいソフト。GUIが超オレンジ。「人声模倣」というすごい機能があるが、私も含めあまり知られていない。今知ったナニコレやばくね? たぶん録音した音声からピッチ録れる。

・OpenUTAU
 UTAU音源が読み込めるソフト。GUIがPOPでカワイイ。複数トラック作れるしオケの同時再生もできる。操作性もいいし音も普通にいいけど、再生ボタンを押すと98%くらいの確率で落ちる。

・PiaproStudio
 クリプトン製のVOCALOIDに付属している歌声合成ソフト。プラグインタイプ。VOCALOID Editorと比べるときれいにパラメーターを描けるので気分がいい。

・PiaproStudioStandalone
 初音ミクV4Cを買うと付いてくる歌声合成ソフト。PiaproStudioの単独起動版。機能も大体同じ。PiaproStudioは好きだけどDAWを立ち上げるのはめんどい人向けかと思いきやV4Cしか使えない。

・RenoidPlayer
 ブラウザで動く珍しい歌声合成。基本的にはUTAU単独音みたいな出音。ブラウザで動くので、PCでもMacでもスマホでも余裕で動く。スマホ普及時代にこういうSaaSっぽいのは期待できる。

・SF2Renoid
 オフラインでも動く歌声合成。と思いきや実はSF2Renoidは歌声合成ではなく、RenoidPlayerで使える音源のこと。RenoidPlayerがなくてもDAW+ピッチシフト系エフェクトで歌わせられる。

・Sharpkey
 中国の歌声合成ソフト。公式配布はもう終わった。世界で唯一別々の母音間でモーフィングができる。VOCALOIDっぽさとUTAUっぽさとCeVIOっぽさとオリジナル成分でできている。

・Sinsy
 ブラウザで動く珍しい歌声合成。CeVIOと同じ技術でできているが無料で使える。ノートの打ち込み機能も調声機能も一切ないけど、VocalShifterやWAVES TUNEが使えるので何も問題ない。

・SugarCape
 Mac専用歌声合成ソフト。なんだかんだMac専用アプリってないのでこれも珍しい。UTAU同様に自作音源を読み込んで使える。開発者の解説動画が面白いというどうでもいい情報。

・SaltCase
 SugarCapeの後身ソフト。後進だが、割と早い段階で開発が止まっているので、現状SugarCapeのほうが機能が多く安定しているような印象。調声できなくはないが外部ソフト使うと楽。

・SynthV
 英語のクオリティーめちゃ高い歌声合成。最近は商業中国語音源が量産されておる。それももうそろそろ出し尽くした感があるので、次はどんな展開になるのか読めない。

・歌うボイスロイド
 歌わないVOICEROIDをなんやかんやで無理やり歌わせたものを「歌うボイスロイド」という。手作業で気の遠くなる作業をしないといけないが、支援ソフトで50倍くらい作業が楽になる。

・UTSU
 UTAUのようなソフト。基本的な機能はUTAUにほぼ準拠している。単独音形式の歌詞入力でも自動で連続音に対応できたりする。音源制作機能がある。対応言語がやたら多い。

・VOCALINA
 韓国の歌声合成ソフト。VOCALOID4をのぞいて唯一外部エフェクトを読み込めるソフト。珍しいサブスクリプション形式の有料音源がある。専用でもないが動画投稿プラットフォームがある。


くろ州の合成音声備忘録


その他歌声合成 トラックバック(-) | コメント(0) | [EDIT]
タイトル画像

DeepVocalとDVTBが更新された

2019.08.13(22:27) 406

 DeepVocalは8月4日に、DVTBは12日に更新がかかったっぽいですね。リリースノートとかがないのでよくわかりませんが、ぱっとみ特に機能が追加されたとかでもないっぽいので、おそらくエンジンとか音声モデル作成の精度とかが上がったんでしょう。ちなみにこの記事すべてが憶測です。

【うわさ1 交叉復活か】
 そのうち交叉パラメーターが復活するかもという噂があります。交叉パラメーターに関してはこちらの記事で概要をつかんでいただいて、こちらの記事で実際の使いどころを確認してください。こちらの記事を読んでも参考になるかもしれません。実装されればおそらく「モーフィング」という名前のパラメーターになると思います。最強なので、復活してくれれば私が泣いて喜びます。

 復活に向けてSharpkeyのモーフィングパラメーターで腕慣らしをしてみるとよいんじゃないですかね! この記事では、Sharpkey稲荷のダウンロードリンクや、実際にモーフィングを使いまくった動画が確認できます。

【うわさ2 パラメーター追加か】
 モーフィングとは別にパラメーターが追加されるかもという噂もあります。普通に考えれば、「ブライトネス」「ジェンダー」「パワー」が順次追加されるんじゃないかと思います。この記事を見れば、とりあえずすべてのパラメーターについて復習できます。

 復活に向けてSharpkeyの稲荷で腕慣らしをしてみるとよいんじゃないですかね! この記事では、Sharpkey稲荷のダウンロードリンクや、実際に各種パラメーター使いまくった動画が確認できます。

【まとめ】
 Sharpkey稲荷、よくできてると思うんだよね。

 冗談はさておき、SharpkeyのドキュメントはかなりDeepVocalに使いまわせるので、このブログで記事検索してみるとよい。


くろ州の合成音声備忘録


その他歌声合成 トラックバック(-) | コメント(0) | [EDIT]
タイトル画像

DeepVocalのマニュアル作った

2019.08.03(12:52) 404

 DeepVocalはSharpkeyとほぼ同じソフトなので、80%Sharpkeyのドキュメントを流用してぱぱっと作りました。


 テキトーにダウンロードして使ってください。


くろ州の合成音声備忘録


その他歌声合成 トラックバック(-) | コメント(0) | [EDIT]
タイトル画像

EmVoiceの音域が広がったぞ!

2019.07.27(11:23) 401

 今日、EmVoiceのアップデートが公開されて、歌える音域が大幅に広がりました。やったね。特にアプデ作業しなくても勝手に切り替わります。サーバー側をちょっといじればいいからかな?

 EmVoiceについて詳しいことはこちら

【音域】
 今まではF#2-C4=1.5オクターブだったんですが、
新バージョンではE2-A4=2.5オクターブになりました。

 実際に人間が歌う曲って大体、歌いやすいように1オクターブ半でメロディーが作られてるかと思うんですが、音域が1.5オクターブしかない歌声合成だと、とりあえず移調が必要になったときに音域足りなくなりますよね。調子乗ったボカロ曲とかだと音域2オクターブ越えとか言ってくるので、とにかく1オクターブ半じゃ厳しかった。

 それが、下に2上に9も伸びてくれたんです。高音域が大幅な伸びですね。メロが1オクターブ半に収まる曲ならすべての調に対応できるようになったし、音域の広いボカロ曲もそこそこ歌えるようになりました超うれしい。

【発音プレビュー】
 発音プレビュー機能が付きました。歌詞を打ち込んで右クリックすると、発音一覧が表示されるので、プレビューしてどっちの発音がいいか聞きながら選べます。「of」って書いて右クリックすると「オブ寄りのof?」か「アブ寄りのof?」か選べます。耳で聞いてちょうどいいほうを選びましょう。

 これまではプレビュー以前に発音一覧が表示されなかったので、「of」と書いたときに「アブ寄りのof」があるかどうかわからなかったんですよね。はかどるわー

 それ以外は特に変更なし。


くろ州の合成音声備忘録


その他歌声合成 トラックバック(-) | コメント(0) | [EDIT]
その他歌声合成
  1. 歌声合成ソフトのピッチコントロールは大体3系統に分けられる(08/27)
  2. 歌声合成ソフト30選(08/26)
  3. DeepVocalとDVTBが更新された(08/13)
  4. DeepVocalのマニュアル作った(08/03)
  5. EmVoiceの音域が広がったぞ!(07/27)
次のページ
次のページ