# 2021/06/02 ボカロ講座記事 この記事は2021/06/02に行われたボカロ講座の内容を記事にしたものです。 今回解説する音声合成ソフトは、**VOCALOID4(鏡音レン**)と**初音ミクNT**です。ソフト内で行う作業をいくつかのステップに分けながら解説していきます。今回はLISAさんの曲「紅蓮華」のサビ部分を歌わせていきます。 また、**講座、記事で作ったファイルは配布しています**。VOCALOIDか初音ミクNTを持っている方は、配布物のファイルを開いて自分で確認しながら記事を読むのも良いかもしれません。以下のリンクからDLできます。 [配布物](https://drive.google.com/drive/folders/1UhsOzaMMleS_xBVdq6x7p77W9EKRshz6?usp=sharing) **内容** * **gurenge_lyrics.txt** <-今回歌わせた部分の歌詞です。見やすさ重視で漢字変換しています。 * **gurenge_mikuNT.ppsf**<-初音ミクNTのファイルです。piapro studio NTの読み込みから開いてください。 * **gurenge_VOCALOID.ppsf** <-VOCALOID4のファイルです。piapro studio の読み込みから開いてください。 * **gurenge_piano.wav** <-今回使用したインスト音源です。 * **melo.mid** <- Step 0(後述)のmidiデータです。最初から作業工程をなぞっていきたい人はこれを読み込んで始めるのも良いかと思います。 # Step 0 - MIDIデータの用意 DAWからメロディ部分のMIDIデータを出力し、各音声合成ソフトの「ファイル」→「読み込み」からMIDIデータを読み込みます。この工程は音声合成ソフト内で直接打ち込んでも変わらないので、曲を書く順序や好みに依ります。 # Step 1 - 歌詞を入れる メロディを打ち込んだら、歌詞を入れてみましょう。......とはいっても、そのまま歌詞を入れると語数が合わない、という問題が発生します。なので、まずは**ノート(音)の長さを歌詞に合わせて調整**しましょう。 **注目ポイント** * 伸ばし棒の部分 * 「っ」の部分 いくつか具体例を挙げます。 ![](https://i.imgur.com/qCa5bph.png)  上の画像はサビの冒頭「どうしたって」の部分ですが、歌詞を入れるときは「どしたて」となっています。  「どう」を「どー」のように発音する場合は、このように伸ばし棒を省略しましょう。ただ、「う」の発音を残したい場合もあるので、ケースバイケースです。  「っ」を省略しています。これは、結局のところ「っ」は発音しないので、休符と解釈しても問題ないからです。え?ノートが繋がってるから休符になってない?それは後程解説します。 次 ![](https://i.imgur.com/PDlQIFp.png) これは最後の方の「運命を」の部分です。変更点としては、「を」を「うぉ」に変更しています。これを解説するには、まず**発音記号**という概念について説明する必要があります。 ## 発音記号 其の一 音声合成ソフトが歌詞を発音するとき、歌詞そのものを参照しているわけではなく、厳密にはその発音に対応した**発音記号**を参照して発音しているのです。 [発音記号表](https://pikaia-pictures.com/data/hatsune-miku.html)というものがあるので、これを見れば何を言っているか理解しやすくなると思います。この表を見ると発音記号が「**子音+母音**」の形をしているのがわかると思います。ただ、例えば同じタ行でも「た」と「ち」では子音の発音の仕方が違うので、対応する発音記号も変わっています。鼻濁音なども表現できるようになるので、この発音記号を駆使すれば歌の自由度が高くなるわけです。(下画像は鼻濁音に変更している例です) ![](https://i.imgur.com/lO8p2k0.png) さて、話を戻します。先程のサイトでは「を」の発音記号は[w o]となっているんですが、私の使用しているソフトだと「を」の発音記号は[o]になっていました。場合によっては[o]で発音させる場合もありますし、実際「負ける意味を知った」の「を」は[o]のままにしています。しかし、この「運命を」の部分は[w o]で発音させたかったので歌詞を「うぉ」に変更しました。 ここで**Tips**ですが、歌詞の入力は**ひらがなorローマ字**でできます。講座、記事では見やすくするためひらがな入力しましたが、私は普段はローマ字入力でやっています。ローマ字の方が半角全角切り替えの手間もなく、歌詞を「wo」と入れれば発音記号が[w o]になってくれるのでこっちの方が便利だと思います。ちなみに「つ」は「tu」ではなく「tsu」と入れないと「つ」と発音してくれないので(他にも似たようなケースあり)、ケアレスミスには要注意です。 # Step 2 タイミング調整 さて、step 1で歌詞を入力できたのでいざ再生!......何か違う感じがしますね。特に初音ミクNTは理想とはまだ遠いと思います。 Step 2では発音をよりリアルに近づけていくのですが、ここからはVOCALOIDと初音ミクNTで調整方法が違うので、別々に解説していきます。 ## VOCALOID Step 2では**ノートの長さと、発音記号、ベロシティ**を調整していきます。 実は、**VOCALOIDで使う「ベロシティ」というパラメータはDTMで一般的に使われるベロシティとは全く違う働きをします**。VOCALOIDでの「ベロシティ」は一言でいえば、「タ行、カ行、マ行など、一度口を閉じてから発音する音の溜め具合」です。具体的には、「っ」はベロシティパラメータの調整により表現できます。 ![](https://i.imgur.com/BZVw6nm.png) これは、「どうしたって」の部分ですが、この画像の「て」の部分に注目してください。画像下がベロシティになっているんですが、「て」のところのベロシティが低くなっているのがわかると思います。これで「っ」が表現できます。つまり、**ベロシティを低くすると、溜め具合が長くなり、逆にベロシティを高くすると溜め具合が短くなるわけです**。これを利用して、カ、サ、タ、マ行を中心に発音が滑らかになっていくようにベロシティを調整していきます。 次に、ノートの長さについてですが、これは伸ばし棒があったときなどに、実際に歌うときの音の長さに合わせて調整します。クオンタイズ(画面の上部にある網目みたいなボタン)をオフにして調整するとやりやすいです。例えば、上の画像の「ど」を延ばして「し」を短くしているのがわかると思います。このような感じで調整していきます。 さて、お次は発音記号ですが、今度は**無声音**について解説します。 ## 発音記号 其の二 まず、無声音ってなに?って話ですが、無声音とは母音を発声せず、子音のみを発生する音(ただし、口の形はその母音の形)のことです。要するに、ヒソヒソ声というやつです。 では、これの発音のさせ方ですが、上の画像の真ん中は歌詞を入力する部分になっていますが、歌詞入力の下は発音記号を編集する場所になっています。発音記号のすぐ後ろに(空白を入れずに)[ _0 ]を入力すると、無声音になります。 また、無声音ではなく、**全く発音しない無音の発音記号が実は二種類あります。それは[Asp]と[Sil]です**。これの違いも説明しようと思います。 どちらも発声しないのですが[Asp]は音程を参照し、[Sil]は音程を参照しません。簡単に言うと、**[Asp]の前に置いてある音の音程の最後は[Asp]の音程に向かう動きをしますが、[Sil]はどの音程においてもそのような変化が起きません**。私は基本的には[Sil]よりも[Asp]を使うことの方が多いです。 ちなみに、初音ミクNTでは上記の方法(_0)で無声音は発声できません。(アプデ求ム) なので、別の方法で無声音を再現します(後述)。[Asp]や[Sil]は初音ミクNTでも使えます。 話を戻しましょう。上の画像では、丁度「し」を無声音に変更しているのがわかりますね。こんな感じで、無声音や無音を使ってより自然な歌い方にしていきます。 ## 初音ミクNT さて、初音ミクNTで似たようなことをするには、ノートの長さ、Consonant Rate、Note gain を中心に調整していきます。 ![](https://i.imgur.com/dDGYTHu.png) 初音ミクNTは波形を見ながら編集できるので、VOCALOIDよりも少しやりやすいですね。ただ、NTはVOCALOIDよりも1つ1つの音が区切れてしまっていて前後の繋がりが弱い気がしているので、結構ここの調整は頑張ります。 NTはサ行による音の区切りが特に強いです。上の画像では、「ど」のノートを分割して「ど」「o」としています。こうすることで、「どー」の伸ばしが長く続くようになります。また、**Consonant Rateで子音の発音タイミングを微調整できるので、それも活用します**。上の画像では「し」のConsonant Rateを下げて発音タイミングを遅らせています。ファイルを見るとわかると思いますが、ノートの分割はかなり頻繁に行っています。これでようやく歌が滑らかに聞こえてくるわけです。 無声音に関してですが、これは私はNote gain を調整して表現するのが良いと思っています。Note gain は名前の通り、ノート毎に音量を調整できるパラメータです。**無声音にしたいところや、ノートを分割した母音側の方のNote gain を下げることで、より聞きやすくなるよう調整していきます**。これも、波形を見ながら調整するとやりやすいです。 # Step 2.5 - 大雑把に声色を調整 さて、ここで軽く声色の調整をしておきます。これは打ち込みの最初にやっても全然いいと思っています。 **VOCALOIDでは、「Brightness」、「Gender Factor」、「Cross Synthesis」を中心に調整します**。 * **ブライトネス** <- 声の明るさ調整です。あとでオートメーションを描くので、この時点ではざっと直線で調整します。 * **ジェンダーファクター** <- 上げると男っぽく、下げると女子供っぽくなります。極端に振ると実用的でない感じがあるので、微調整程度に。 * **クロスシンセシス** <- この機能は搭載されてないボイスバンクもあります。複数の声色(純、穏、凛など)が用意されているボイスバンクで、その複数の声色のうち2つを混ぜ合わせることができます。 **初音ミクNTは「Voice Voltage」、「Super Formant Shifter」を中心に調整します**。 * **Voice Voltage** <- 声圧を調整します。これもあとでオートメーションをゴリゴリ描くので、この時点では基準値を設定するだけでよいと思います。 * **Super Formant Shifter** <- VOCALOIDでいうGender Factor と似た感じです。Gender Factorよりも使いやすくなっていると思います。 # Step 3 - ピッチの調整 さて、この時点でも十分聞けるくらいにはなってると思いますが、ここからより人っぽくしていきます。具体的には、**しゃくり**を作ります。 ![](https://i.imgur.com/TD3CDvz.png) ![](https://i.imgur.com/lDG3a2E.png) 上がVOCALOID、下が初音ミクNTです。初音ミクNTはピッチ編集モードでピッチを直観的に調整できるので、操作性は初音ミクNTの方が高いと思います。 しゃくりのつけ方は画像を見ればわかりますが、じゃあその**しゃくりはどこにつければいいの**?っていう問題がありますよね。これは、人の好みに大きく依るし、試行錯誤が必要ではありますが、**音程が跳躍して強調したい部分にしゃくりを入れると良い**と思います。私は下から上への跳躍では下からしゃくり、逆に上から下への跳躍では上からしゃくるのを基本としています(もちろんそうでない場合もありますが)。また、**同じ音程が連続するとき、後ろの音にしゃくりを入れることで、後ろの音を強調する**こともできます。 次に**ビブラート**をつけていきます。 ![](https://i.imgur.com/H1oe8Lg.png) ![](https://i.imgur.com/P1GySAW.png) ビブラートは「**Depth**」「**Rate**」のパラメータがあり、文字通りビブラートの振幅と周波数を表しています。伸ばしているところにビブラートを追加して、聞き心地が良くなるようにパラメータを調整します。画像を見るとわかりますが、VOCALOIDの方はビブラート中にパラメータを調整できるので、自由度が高いです。NTにも実装してほしいですね。 **E.V.E.C**という機能があって、これはノートに簡単にアクセント(その逆も可)がつけられたりする機能なんですが、私はあんまり使ってなかったので割愛させていただきます...... # Step 4 - 感情を創る さて、しゃくりを追加したしかなり人っぽくなったと思いますが、まだ何か足りない気がします。それは**強弱**です。現時点では音量変化を加えていないので平坦な感じが出てしまっています。 **VOCALOIDでは「Dynamics」「Brightness」を中心に調整していきます**。 ![](https://i.imgur.com/80a6l3T.png) ![](https://i.imgur.com/pwMpKrI.png) なんだかぐちゃぐちゃしていますね。上が「Brightness」、下が「Dynamics」です。**メロディの動きやつけたい強弱に合わせてオートメーションを描いていきます**。今回は極端には振らず、些細な変化としています。~~割と適当にやってます~~ **初音ミクNTでは「Voice Voltage」、「Dynamics」を調整していきます**。 ![](https://i.imgur.com/eNXDbQD.png) ![](https://i.imgur.com/w1MKVhk.png) 上が「Voice Voltage」、下が「Dynamics」です。パラメータの振り方はVOCALOIDと変わらないですね。 これで、**音声合成ソフト内でのメロディ作業は完了です**! 今回いじくってないパラメータもあるので、その辺を試してみても面白いかもですね。 # Step 5 - ハモリを作る ここで**ハモリ**を作ります。また一から作るのは面倒なので、先ほど完成させた**メロディをコピペして編集しましょう**。今回は既存の曲でハモリがわかっているのですぐに済みましたが、曲を作る際にはハモリも自分で考えなきゃいけないですよね。世の中には色んなハモらせ方がありますが、3度ハモリ、4,5度ハモリを抑えておけば何とかなると思います。 3度ハモリは文字通り、メロディから3度下げたあとに、曲のスケール(調、キー)に合わせて調整していく感じです。4,5についても同じです。一回全部のパートでハモりを作った後にいらない部分を削除していく、なんて方法もあります。 # 完成!!!!! やったね!! 自分の曲でこの工程をやれば結構人っぽく歌わせられるようになると思います! ケロケロボイスとかをやりたい場合もStep 2までは役に立つかと思いますので、是非とも活用してください!