写真を撮って、まるで別世界への扉のように魔法のように飛び込むことができると想像したことがありますか? えっと、考えても考えなくても、そう思った人がいて、おかげさまでAIでできるようになりました!これは、テレポーテーションから一歩離れたところにあり、物理的にそこにいることができます。いつの日か AI がそれを助け、実際の問題も解決する日が来るかもしれません!冗談です、これは本当にクールです。 これがInfiniteNature… ゼロ!これは、私が以前に取り上げた InfiniteNature という論文のフォローアップであるため、このように呼ばれています。違いは何ですか?品質! 動画で詳しく... 参考文献 ►記事全文を読む: ►Li, Z., Wang, Q., Snavely, N. and Kanazawa, A., 2022. InfiniteNature-Zero: ラーニング パーペチュアル ビュー 自然の生成 単一の画像からのシーン。コンピュータビジョンに関する欧州会議で (pp. 515-534)。スプリンガー、チャム、 ►コードとプロジェクトのウェブサイト: ►マイ ニュースレター (毎週メールで説明される新しい AI アプリケーション!): https://www.louisbouchard.ai/infinitenature-zero/ https://arxiv.org/abs/2207.11148 https://infinite-nature-zero.github.io/ https://www.louisbouchard.ai/newsletter/ ビデオトランスクリプト 0:00 できると想像したことはありますか 0:02 写真を撮って魔法のようにダイビング 0:04 への扉になるかのように 0:06 と思ったのか、別世界。 0:08 これについて何人かの人々がやったかどうかについて 0:11 彼らのおかげで、AIでそれが可能になりました 0:13 これはほんの一歩です 0:16 テレポーテーションとそこにいることができること 0:18 いつかAIが助けてくれるかもしれない 0:21 それで実際の問題も修正します 0:23 冗談です、これは本当にクールで、 0:25 頑張ってる人がいて嬉しい 0:27 これは無限の自然ゼロと呼ばれています 0:31 のフォローアップなので、この方法で 0:33 私が以前取り上げた論文は 0:35 無限の性質の違いは何ですか 0:37 品質はそれがとても多いことを見てください 0:40 たった1つの論文でより良い 0:43 あなたは実際にあなたのように感じることができます 0:45 写真に飛び込み、それだけ 0:47 入力画像が 1 つ必要です。 0:50 さらにクールな唯一のことは、その方法です 0:53 それは機能しますが、最初に飛び込みましょう 0:56 10 秒ほどお時間をください 0:58 このビデオのスポンサー 自分自身 はい のみ 10 1:01 秒 私はもっと値するとは思わない 1:02 素晴らしい企業と比較して 1:04 あなたが好きなら、通常、私の仕事を後援します 1:06 動画を最初にするべきだと思います 1:08 チャンネル登録するけど私も 1:10 私の2つのニュースレターを気に入っていただけると思います 1:12 ここで私は毎日の研究論文を共有し、 1:15 ニュースと私が共有する毎週のニュース 1:17 これらのビデオと非常に興味深い 1:19 これらの論文に関連する議論と 1:21 あなたはおそらく私に従うべきAIの倫理 1:24 Twitter と what's AI if you would 1:26 最新のニュースを知りたい 1:28 そして現場の論文が大量にやってくる 1:30 ちょうどcvprの締め切りでアウト 1:32 合格し、見逃したくない 1:34 それらはどうやって無限の自然をゼロにしますか 1:37 すべては 1 つのイメージから始まる 1:40 入力として送信 はい 単一の画像 1:43 ビデオまたは複数を必要としない 1:44 ビューまたはその他これは異なります 1:47 私も彼らの以前の論文から 1:49 ビデオが必要な箇所をカバー 1:51 モデルは自然の情景を理解する 1:53 トレーニング中に 1:55 このモデルを無限の自然ゼロと呼ぶ 1:58 ここでは動画が必要ないため 2:01 彼らの仕事は3つの方法に分かれています 2:03 を取得するためにトレーニング中に使用されます。 2:05 モデルを開始するための結果 2:07 2 つの仮想カメラをランダムにサンプリングする 2:10 どこにあるかを教えてくれる軌跡 2:12 ありがとうございます 2:14 力が必要だから 2:16 どこにあるかを示す新しいビューを生成します 2:19 画像に飛び込んで秒を生成する 2:21 画像 これが実際の軌跡です 2:24 2番目の仮想を取得します 2:25 軌道はトレーニング中に使用されます 2:28 ダイビングして元の画像に戻る 2:31 モデルにジオメトリを認識して学習するように教える 2:33 ビュー生成中のビューの改良 2:36 私たちが教えているように、自己管理された方法で 2:39 すでに持っているイメージに戻る 2:42 私たちのトレーニングデータセットでは、彼らは参照しています 2:44 循環仮想カメラとしてのこのアプローチ 2:46 始まりと終わりとしての軌跡 2:48 ビューは入力画像と同じです 2:51 仮想または偽物に行くことによってそれを行います 2:54 サンプル ビューポイントに戻り、 2:56 あとは教えるだけのオリジナルビュー 2:58 モデルへの再構築部分 3:01 ビューポイントは、 3:03 自動操縦アルゴリズムと呼ばれるアルゴリズム 3:05 スカイダイブではなく空を見つける 3:08 誰も望んでいない岩や地面 3:10 それを行うには、トレーニング中に 3:13 弁別器を使用した銃のようなアプローチ 3:15 新しいビューがどれくらいあるかを測定する 3:17 生成された画像は実際の画像のように見えます 3:19 L adversarial または laadv で表される 3:23 はい、銃はまだ死んでいません。これは 3:26 それらの非常にクールなアプリケーション 3:28 持っていないときのトレーニングのガイド 3:30 たとえば、地上の屋根 3:32 この場合、無限の画像はありません 3:34 基本的に彼らは別のモデルを使用します 3:37 私たちのトレーニングで訓練された識別器 3:39 画像が見えるかどうかを確認できるデータセット 3:42 その一部であること、またはそうではないことに基づいて 3:44 世代を向上させることができる答え 3:46 データからの画像のように見せる 3:49 おそらく現実的に見えるセット 3:52 また、私たちの違いを測定します 3:53 再生成された初期画像と 3:56 モデルを助けるためのオリジナルのもの 3:57 反復的に再構築がうまくなる 3:59 ここでLリックに代表される演技と 4:03 このプロセスを複数回繰り返すだけです 4:05 新しいフレームを生成する時間と 4:07 これらの種類のビデオを作成します 4:10 それらを取得する前に微調整する最後のこと 4:12 彼らが見た驚くべき結果 4:14 その無限のために空に近づく 4:17 地面に比べて自然が変わる 4:19 彼らが使用していることを修正するにはあまりにも早く 4:21 を見つけるための別のセグメンテーション モデル 4:24 生成された空は自動的に 4:26 画像とインテリジェントを使用してそれを修正 4:28 生成された間のブレンドシステム 4:31 空と最初の画像の空 4:33 急に変わらないように 4:35 でトレーニングした後、非現実的に 4:38 この 2 段階のプロセスとスケール 4:40 洗練された無限の性質 0 はあなたを可能にします 4:42 安定した長距離弾道を持つために 4:44 自然なシーンでも正確に 4:47 である高貴なビューを生成します 4:49 幾何学的に一貫性があり、ほら、これは 4:52 写真を撮って飛び込む方法 4:54 鳥のようにあなたを誘う 4:56 詳細については、論文を参照してください。 4:58 彼らの方法と限界 5:00 特に彼らが達成する方法に関して 5:02 そのような巧妙な方法でモデルを訓練する 5:05 いくつかの技術的な詳細を省略したため 5:07 シンプルさのためにこれを可能にする 5:09 コードが利用可能でリンクされている方法 5:11 試してみたい場合は以下から 5:13 あなたがそうするかどうかを知り、私に結果を送ってください 5:15 見てみたいですよろしくお願いします 5:17 ご覧いただきありがとうございます。 5:19 来週お会いしましょう 5:21 別の素晴らしい紙