歌う、というのは凄く複雑なこと、なのか。

Sunday, January 10, 2021 - Posted by Knz  at 11:52 AM
機械に歌わせようとすると直面すること、その2。

メロディーラインがそのまま歌、ではない。
ピアノロールでメロディーラインを打ち込み、歌詞を突っ込んでも、人間が歌ったようにはすぐにはならない。。
これはいわゆるボカロPと言われるボカロ使いであれば、なにを今更?と言われること請け合いな気付きだが、メロディーだと一音、そのまま全音、であっても、歌、というのは全音でなく、実際は八部音符のように、言葉の一塊ごとに構成されてる、ということなのか、歌ったときのそれとは響きが異なる。

愕然とするほど編集作業が必要となることに気付き、今はこのレベルのUIが限界なのか、、、と自分のスキル不足を棚に上げつつ、痺れ切った次第。。

ボイスチェンジャーのように、オーディオファイルを読み込んで、AIが読み込んだファイルを違う声で歌う、という、アプローチから見直さないと、根本的に機械に歌わせる、を、midiデータのようなプログラム化されたものをベースに機械に歌わせる、は機械に人間たるや何なのか、というレベルのことを形式的な音程レベル以上のものに付加、考慮していかねばならぬことになるのでは?と思う。
途方も無く未来にならねば、人間が意識せずに自然に出している表現力、というのを機械が具備できるようになるのは不可能ではないか。

コンセプトは非常にいいと思うが、いざ使ってみると悶絶するような障害がまだ相当数あるので、これを人間が歌ったかのように聞き違えるレベルにするのはもう少し先までのバージョン改善の行方を見たい。


Regards,


Knz