NEUTRINOの衝撃 | 社員ブログ | リグレックス株式会社

こんにちは。くるーざーです。

最近、一部で「NEUTRINO」（「AIきりたん」）が話題になっています。NEUTRINOはメロディーと歌詞を入力することで歌声を出力することのできるソフトであり、初音ミクなどに代表されるVOCALOIDに近しい存在です。

一方で、NEUTRINOはVOCALOIDと違い、いわゆる「調声」が必要ないという特徴を有しています。これにより、VOCALOIDと比べると、とても手軽に、人間らしく歌わせることが可能になっているのです。

普段VOCALOIDの楽曲に接しない人にはなじみのない概念かもしれない「調声」。これは、VOCALOIDの音色を人間の歌声に近づけるうえで不可欠な作業です。

調整を行わない場合、VOCALOIDの歌声は非常に平板なものになります。機械音声そのものの歌声、といっても良いかもしれません。

これは、VOCALOIDが出力する歌声が実在する人間の歌声から取り出した要素をまとめたものであり、これらの中の子音や母音の要素を組み合わせることで出力する音声を作り出していることに由来するようです。

つまり、ただ音声を出力するだけでは、どの音もまったく同じ歌い方になってしまい、違和感のある歌が完成してしまうのです。

この状態を脱するためには、素の歌声を加工しなければなりません。音に強弱をつけたり、活舌の調整を行ったり、しゃくりを入れたり……。

これらの作業を、調声と呼んでいます。

これに対して、NEUTRINOで音声を出力する際には、調声が必要ありません。メロディーと歌詞を入力すれば、それだけで人間に近い歌声が出力されるのです。

NEUTRINOの歌声は、VOCALOIDとは違い、ニューラルネットワークを使った統計的歌声合成の手法を用いて作成しています。東北きりたんというキャラクターの声優さんの歌唱する50曲分のデータを利用しているそうです（そのためAIきりたんという名称が使われる）。

結果として、ただ曲と歌詞を入力するだけでも、元となった声優さんの特徴を反映した、非常に人間らしい歌声が出力されるのです。

NEUTRINOの調声が必要ないという特徴は、楽曲を作成するうえで大きなメリットです。

調声は手間と慣れが必要な作業であり、VOCALOIDを利用するうえでの壁となっていました。

そうした調声が不要になったことで、楽曲を作成するハードルは下がったということができます。

NEUTRINOは音楽作りへの門戸を広く開く可能性を秘めているのです。

一方で、NEUTRINOにも弱点は存在しています。それは、どうしても音声素材となった楽曲に影響を受けてしまうという点です。

NEUTRINOの元になっている楽曲はポップなものが多かったため、それらに似た曲は自然に歌えるのですが、ポップスとは異なるバラードなどでは不自然さが目立ってしまうというのです。

VOCALOIDはプレーンな音源であるため、調声のやり方次第で幅広い楽曲に対応できたり、人間には難しいほど早口な歌を歌えたりしていたのですが、NEUTRINOではそこまでの応用性を確保できません。

素材となる曲のジャンルを変えたソフトが登場すれば多少は改善されるとはいえ、応用性の点ではVOCALOIDが優れているようです。

最近では、少しずつNEUTRINOを使用した楽曲が動画サイトに現れ始めています。興味のある方は、一度ご覧ください。