タイトル画像

日本語の「が」の発音

2017.04.10(12:10) 139

東北方言ですが「わからない」を「わがんね」と発音してみてください。

この「が」の発音。東日本の人は「N a」、関西の人は「g a」イマドキの東日本の人は「G a」と発音するそうです。

「N a」
いわゆる「鼻濁音」と言う発音で「ンが」と聞こえたりします。英語の「ing型」の「ng」と書けば「N a」が「な」ではなく「が」であることがわかるかもしれません。関西の人は発音できない/発音するのが苦手と言われたりする。

「g a」
普通の「が」。有声軟口蓋破裂音と言います。

「G a」
最近の日本人が「N a」の代わりに使う発音で有声軟口蓋摩擦音。「N a」が緩んだ発音と言える。

聞き分けてみましょう


東北弁として発音があってるかどうかは置いといて
1.わ「g a」んね
2.わ「N a」んね
3.わ「G a」んね
誇張気味の発音です。

UTAU音源の場合「ガ」行は鼻濁音で録音することも多いですが、西日本の人は発音できていなかったりおかしなことになっていることが多く、また、絶対に録らないといけないわけでもないのでスルーされることもあります。

しかし、あったらあったで人気の音素らしいので、どうしても「N」が発音できないようなら「G」で発音するのも一つ手かなと思います。

スポンサーサイト

くろ州の合成音声備忘録


制作 トラックバック(-) | コメント(0) | [EDIT]
タイトル画像

内破音

2017.04.10(11:03) 138

「いっっっっっっっっっった!!」と発音してみてください。

この「っ」が内破音です。

正確には違いますが。もう少し正確に説明しましょう。

「いっっっっっっっっっった!!」と発音するときに、「っ」の状態で止めてみて舌の位置を確認してください。

「い」を発音した後すぐに上の歯茎に舌先をあてて音を止めてますね。

「あっっっっっっっっっっか!!」と発音したらどうでしょう。

「あ」の発音のすぐ後に下の後ろのほうで音を止めてますね。

「いっっっっっっっっっっぱ!!」と発音した場合は

「い」の後すぐに口を閉じて音を止めてますね。

つまりは「発音が違う」わけです。

「内破音」は「破裂音の破裂しないやつ」です。

破裂せずに内にとどめた状態ですね。

聞き比べてみましょう。

1個目が「k」の内破音
2個目が「p」の内破音
3個目は内破音ではないので今回はスルー
4個目が「t」の内破音

後半ではそれぞれ破裂音として発音しています。

発音が違ったのが聞き分けられましたか?

UTAU調声の時「あっか」を
akka01.png
と打つと、内破音が再現できていません。

CVVC音源の「a k」音素を使うか、連続音化して「a か」の子音速度を下げると内破音が再現できます。
akka02.png  


くろ州の合成音声備忘録


制作 トラックバック(-) | コメント(0) | [EDIT]
タイトル画像

帯気音化

2017.04.10(10:33) 137

いきなりですが、
日本語で「ペン」と発音してみてください。
次に英語の「pen」を発音してみてください。

正しく発音すればこの2つの「p」の発音が「別のものである」事がわかります。

日本語で「ペン」と発音した場合
「p」の後すぐに「e」がきて「N」で終わるでしょう。

対して英語で「pen」と発音すると
「p」の後少し間があって「e」が来たあと「n」で終わります。

つまり、「e」の発音が遅れるのです。

そしてこの「間」には「h」のような息成分でできた音が挟まっています。

これが帯気音化(有気音化とも)です。

聞き比べてみましょう。

最初の「た」は帯気音化なし。
2番目は軽い帯気音化。
3番目がかなりの帯気音化。

「母音が遅れ」て「hが挟まる」のがわかったと思います。波形を見てもわかりやすいです。
帯気音図 
帯気音化は基本的に無声破裂音の行(か行、た行、ぱ行など)で起こります。

破裂音のいわゆる「破裂」部分を「バースト」と呼びますが、バーストから母音(有声音)までの長さを「VOT」と呼びます。帯気音化した発音はこのVOTの値が正の方向に大きいです。

歌唱表現としてもそこそこ使われるのでUTAU音源に組み込んでみてもいいかもしれません。


くろ州の合成音声備忘録


制作 トラックバック(-) | コメント(0) | [EDIT]
タイトル画像

日本語の「ら」の発音

2017.04.10(10:10) 136

日本語の「ら」行は世界的に見ても珍しい発音です。

英語を習っているとよく「ローマ字では『ら』を『ra』って書くけど、どっちかというと『la』だよね」とか「日本語の『ら』がうまく聞き取ってもらえないときは『da』と発音するとよいことがある」とか言われます。

正直、私としては日本語の「ら」には「ra」「la」「da」の性質が少しずつ含まれていると思います。

日本語の「ら」行の子音は多くの場合「そり舌はじき音」といってVOCALOIDでは「4」と書かれる音です。

これは
・「r」ほどではないにしても少し下を巻き
・「l」のように舌を硬口蓋前目に着け
・「d」ほどでは内にしても少し破裂(はじく)
発音です。

イマドキの若者の間では発音に変化が起きて「はじき」の成分が弱まって、英語の「l」に近づいているようです。

「ら」を聞き比べてみましょう

1.日本語の「ら」。現代日本人が使う英語の「La」に近い発音。少し違うがX-SAMPAでは「4 a」
2.英語の「Ra」。舌を巻いて口の上に近づけるだけの「ら」。そり舌接近音。「r\' a」
3.英語の「La」。舌を巻かずに口の上につけるが舌の両端はどこにも触れていない「ら」。歯茎側面接近音。「l a」
4.スペイン語の「Ra」。巻き舌。歯茎震え音。「r a」 

かなり誇張した発音になっています。


くろ州の合成音声備忘録


制作 トラックバック(-) | コメント(0) | [EDIT]
タイトル画像

VOCALOID音圧戦争とラウドネス

2017.03.16(17:03) 132

VOCALOIDが起こってから早十年。音圧戦争といわれる戦いが特に激しく途切れることなく行われてきた。

結論から言うと

大事なのは「聴き手にどう聞こえるか」である。

【音圧とは】
下の図を見てください
VU1.png 
ステレオ音源なので2列で1セットです。

上のセットと下のセットの波形を見比べてみるとかなり違うように見えますが、この2つは全く同じ曲の波形を表しているのです。

下の波形は上の波形に対して「音圧あげ」の一連の加工を施したものです。

「音圧」を視覚的に簡単にとらえるならこの「面積」といってもよいでしょう。青い部分(波形)の面積が大きいほうが「音圧」が高く、面積が小さければ「音圧」が低いと判断できます。

上の波形に比べて下の波形は音が大きい時間が長いというのはわかりますね? 下の波形はほとんど常にいっぱいいっぱいの音が出ています。

ということはこれらを聞いてみたときにどちらがより大きな音に聞こえるかというと、音が大きい時間が長い下の波形ということになります。

「音圧」というのは人間が感じる音の大きさの基準の一つです。機械での計測の結果音が大きい時間が長いものが「音圧が高い」状態です。

しかし、全編を通したとき最終的に「音量の最大値」は両者とも同じなのです。上の波形はほんの一瞬だけ音量の上限に達しています。

この音量の上限値の中でどれだけ大きく聞かせられるか。それが音圧戦争なのです。

なぜそれがそんなに重視されるかというと「音がでかいほうが迫力がある」からです。

木管5重奏と和太鼓パフォーマンスとでは音だけでも迫力が全く違います。


【ラウドネスとは】
日本語に直訳すると「おおきさ」だが、詳しく言うと「人間の聴覚を基準にした音の大きさ(の平均)」のことを指す。

人間の耳は機械とは違うので

・4.41万分の1秒の精度で音量を65536段階で感知する
・どんな高さの音も同じ基準で測定する

とかそんなことはできないのです。一瞬の大きな音は割と聞き逃すし、音の高さによって聞こえやすさが違うのです。女性の甲高い声と男性の野太く低い声では同じ音量でも女性の声のほうがよっぽどよく聞こえるのです。

というわけなので瞬間的な音の大きさはある程度無視して、音の高さによる聞こえ方の違いも考慮した音の大きさの基準ラウドネスです。


【聴き手のボリューム操作】
音楽TVなりプレーヤーなりで聞いてる人はボリュームを上げ下げしてちょうどよく聞こえるように操作しますね。

ここで重要なのが、

「聴き手は音圧を基準にボリュームを操作するのか、ラウドネスを基準に操作するのか」

ということです。正解は後者。なぜなら「ラウドネスは人間の聴覚を基準にしているから」

音圧戦争には実は見落とされがちな前提条件があり、それというのが

「聴き手の環境でボリュームのつまみが同じ位置にある」

ということなのです。ボリュームのつまみが同じ位置にあれば音圧が高いほうが大きく聞こえます。

でも実際には変えますよね。どのように変えるかというと「同じ大きさに聞こえるように」

この時、音圧が高い曲と低い曲はどちらが「音楽的か」という話になります。
ラウドネスを同じにした状態で先ほどの波形を見比べてみましょう。
VU2.png 
下の波形が「音圧が高かった」波形です。もちろんラウドネスが同じなので聞いたうえではだいたい同じ大きさに聞こえます。

違ってくるのはダイナミクスです。

上の波形では落ち着くところは小さく、盛り上がるところでは大きくなっていて曲にメリハリがあります。対して下の波形では常に大体一定。落ち着いていても盛り上がっていても同じなのです。

また、音圧を上げると「音量の大きいところを叩き潰して均した感のある音」になるとか「アタック感がなくなる」とかいう弊害があるのですが、その影響も受けてしまっています。

つまり、「聴き手にボリュームつまみを操作された場合音楽的なのは音圧を上げていないほう」なのです。

もちろん音圧あげを表現として使うジャンル・場合はそれでいいでしょう。

アルバムCDのマスタリングの段階でも聴き手が曲ごとにボリューム調整する面倒をなくすためラウドネスを統一するようにすることもあります。


【音量の自動調整】
ボリュームつまみをいちいち変えるのは面倒なのでCDやTVのラウドネスには基準がありますが、CDの場合は時代によってもかなりラウドネスが違うので「音量の自動調整」機能で対応するサービス・ソフトウェアもあります。

はっきり「ラウドネスを基準に調整しています」と言っているとは限りませんが、ラウドネス基準で自動調整する機能があるらしいのは

・iTunes
・YouTube

のようです。ニコニコ動画はラウドネスに関する記述が見つからなかったのでPeak(音量)基準なのかもしれません。

つまりニコニコでは音圧あげしても十分効果があるが、YouTubeやiTunesでは音圧あげしないほうが音楽的かも、ということ。


くろ州の合成音声備忘録


未分類 トラックバック(-) | コメント(0) | [EDIT]
最近の記事
  1. 日本語の「が」の発音(04/10)
  2. 内破音(04/10)
  3. 帯気音化(04/10)
  4. 日本語の「ら」の発音(04/10)
  5. VOCALOID音圧戦争とラウドネス(03/16)
次のページ
次のページ