僕の意見
SUNOは歌詞付きよりもインストの方が遥かに美しい音楽を作りますね。
AIの意見
その傾向はかなりありますね。
特にSUNO�は、インスト曲になると急に「作曲能力そのもの」が前面に出てきます。
理由はいくつかあります。
① ボーカル生成に大量のリソースを使っている
歌付きの場合、AIは同時に:
メロディ
歌唱
発音
感情表現
リズムへの言葉の押し込み
ミックス
歌詞解釈
を全部やっています。
特に日本語は母音が多く、英語より音節制御が難しいため、
「歌詞を成立させること」
にかなり能力を割かれます。
その結果、
和音進行
空間処理
オブリガート
音色変化
展開美
が犠牲になりやすいのです。
② インストになると「映画音楽脳」になる
インスト指定すると、SUNOは急に:
シネマティック
ジャズ
フュージョン
アンビエント
ポストロック
劇伴
的な方向へ強くなります。
ユーザーがよく作っているような:
Rhodes
sax
semi-acoustic guitar
major7 / major9
mellow fusion
waltz
nature cinematic
系は、実はSUNOがかなり得意な領域です。
特に、
「言葉で感情を説明しなくていい」
状態になると、
コード進行や音色だけで感情を描き始める。
ここが非常に強いです。
③ AIは“意味”より“音響”の方が本来得意
人間は歌詞に意味を感じますが、AIは本質的には:
波形
周波数
時間変化
パターン
を扱う存在です。
だから実は、
サティ風ピアノ
昭和フュージョン
深夜FM風
中央フリーウェイ的コード感
EWF風ディスコグルーヴ
みたいな、
「言葉にならない空気感」
を作る時に真価が出やすい。
④ 人間側が“脳内補完”する
インストは聴き手が自由に情景を想像できます。
例えばユーザーがよく作る:
フラワーパークの朝
風
丘
光
幸せそうなお客様
少し切ない幸福感
みたいな世界観は、
歌詞で説明されるより、
「余白」
として残っている方が、むしろ感情が深くなることがあります。
これは久石譲や坂本龍一系統でも非常に強い特徴です。
逆にSUNOの歌物が真価を出しやすいのは:
シンプルな英語
母音の多いT-POP系
フック重視
リズム優先
繰り返し構造
です。
だから最近ユーザーがよくやっている:
日本語を少し削る
母音を揃える
タイ語混ぜる
音数調整する
という方向は、実はかなり理にかなっています。
面白いのは、
AI音楽は今、
「歌付き」より 「インスト+映像+空気感」
の方が、既にかなり実用レベルに近いことです。
特にフラワーパーク映像との組み合わせは、かなり相性が良いと思います。
