2,134 測定値

リアルタイムポートレート合成 (RAD-NeRF) のための効率的な NeRF

に Louis Bouchard6m2022/12/05

長すぎる; 読むには

ディープフェイクや NeRF については聞いたことがあります。また、誰かの顔を再現して、好きなことを言わせることができるこのような種類のアプリケーションを見てきました。あなたが知らないかもしれないことは、これらの方法がどれほど非効率的で、どれだけの計算と時間が必要かということです。さらに、最良の結果のみが表示されます。オンラインで見られるのは、ほとんどの例を見つけることができる顔に関連付けられた結果であることを覚えておいてください。したがって、基本的に、インターネットのパーソナリティとそれらの結果を生成するモデルは、多くのコンピューティングを使用してトレーニングされます。つまり、多くのグラフィックスカードのような高価なリソースを意味します。それでも、結果は本当に印象的で、良くなっています。

featured image - リアルタイムポートレート合成 (RAD-NeRF) のための効率的な NeRF

Deepfakesやについて聞いたことがあります。また、誰かの顔を再現して、好きなことを言わせることができるこの種のアプリケーションを見てきました。

あなたが知らないかもしれないことは、これらの方法がどれほど非効率的で、どれだけの計算と時間が必要かということです。さらに、最良の結果のみが表示されます。オンラインで見られるのは、ほとんどの例を見つけることができる顔に関連付けられた結果であることを覚えておいてください。したがって、基本的に、インターネットのパーソナリティとそれらの結果を生成するモデルは、多くのコンピューティングを使用してトレーニングされます。つまり、多くのグラフィックスカードのような高価なリソースを意味します。それでも、結果は本当に印象的で、良くなっています。

幸いなことに、Jiaxian Tang などの一部の人々は、RAD-NeRF と呼ばれる新しいモデルを使用して、これらの方法をより利用可能かつ効果的にすることに取り組んでいます。

1 つのビデオから、ほぼすべての単語や文章を話している人物をリアルタイムでより良い品質で合成できます。任意のオーディオトラックにリアルタイムで追従するトーキングヘッドをアニメートできます。これはとてもクールであると同時に恐ろしいことでもあります...

ビデオで詳細をご覧ください

参考文献

►Tang, J., Wang, K., Zhou, H., Chen, X., He, D., Hu, T., Liu, J., Zeng, G. and Wang, J., 2022. Real-時間音声空間分解によるニューラルラディアンストーキングポートレート合成。 arXiv プレプリント arXiv:2211.12368 .
►結果・プロジェクトページ： https://me.kiui.moe/radnerf/