您是否曾想过能够拍摄一张照片并神奇地潜入其中,仿佛它是通往另一个世界的大门?
好吧,不管你有没有想过这个,有些人已经想到了,多亏了他们,人工智能现在可以实现了!这距离隐形传态和能够亲临现场仅一步之遥。也许有一天人工智能会帮助解决这个问题并解决实际问题!我只是在开玩笑,这真的很酷,我很高兴有人正在为此努力。
这是无限自然……零!之所以这样称呼它,是因为它是我之前介绍过的一篇名为 InfiniteNature 的论文的后续。有什么不同?质量!
在视频中了解更多...
►阅读全文: https ://www.louisbouchard.ai/infinitenature-zero/
►Li, Z.、Wang, Q.、Snavely, N. 和 Kanazawa, A.,2022 年。
InfiniteNature-Zero:学习自然的永久视图生成
来自单幅图像的场景。在欧洲计算机视觉会议上
(第 515-534 页)。斯普林格,查姆, https://arxiv.org/abs/2207.11148
►代码及项目网址: https ://infinite-nature-zero.github.io/
►我的时事通讯(每周向您的电子邮件解释一个新的 AI 应用程序!): https ://www.louisbouchard.ai/newsletter/
0:00
你有没有想过能够
0:02
拍张照片然后神奇地潜水
0:04
进入它就好像它是一扇门
0:06
另一个世界好吧你是否想过
0:08
关于这个或没有一些人做了和
0:11
多亏了他们,人工智能现在成为可能
0:13
这只是一步之遥
0:16
传送并能够在那里
0:18
物理上也许有一天人工智能会有所帮助
0:21
并解决一个实际问题
0:23
我只是在开玩笑,这真的很酷而且
0:25
我很高兴有人正在为此努力
0:27
这是无限的自然零它被称为
0:31
这样,因为它是
0:33
我之前报道过的论文叫做
0:35
无限的自然有什么区别
0:37
质量只看它这么多
0:40
只在一篇论文中做得更好,这太不可思议了
0:43
你真的可以感觉到你是
0:45
潜入画面,它只是
0:47
需要一张输入图片有多酷
0:50
唯一更酷的是如何
0:53
它有效让我们深入研究它但首先
0:56
请允许我占用你 10 秒的时间
0:58
这个视频的赞助商我自己是只有 10
1:01
秒我不认为我应该得到更多
1:02
与那些了不起的公司相比
1:04
如果你喜欢,通常会赞助我的作品
1:06
首先是视频,我认为你应该
1:08
订阅频道,但我也
1:10
我想你会喜欢我的两份时事通讯
1:12
我在那里分享日常研究论文和
1:15
新闻和我分享的每周新闻
1:17
这些视频非常有趣
1:19
与这些论文相关的讨论和
1:21
人工智能伦理你可能应该关注我
1:24
在 Twitter 上以及什么是 AI 如果你愿意
1:26
喜欢了解最新消息
1:28
该领域的论文即将到来
1:30
赶上 cvpr 截止日期
1:32
过去了,你不想错过
1:34
那些那么无限自然如何归零
1:37
一切从一张图片开始
1:40
你发送作为输入是的单个图像它
1:43
不需要一个或多个视频
1:44
观点或其他任何不同的地方
1:47
从他们以前的论文中我也
1:49
涵盖了他们需要视频帮助的地方
1:51
模型理解自然场景
1:53
在训练期间,这也是为什么他们
1:55
称这个模型为无限自然零
1:58
因为这里需要零个视频
2:01
他们的工作分为三种方法
2:03
在训练期间使用以获得
2:05
这些结果启动模型
2:07
随机采样两个虚拟相机
2:10
轨迹会告诉你在哪里
2:12
你也要去图片里为什么
2:14
因为力是必要的
2:16
生成一个新视图,告诉您去哪里
2:19
飞入图像生成第二个
2:21
想象这是你的实际轨迹
2:24
将参加第二个虚拟
2:25
在训练期间使用轨迹来
2:28
潜水并返回原始图像
2:31
教模型学习几何感知
2:33
视图生成期间的视图细化
2:36
在我们教它的时候以一种自我监督的方式
2:39
回到我们已经拥有的图像
2:42
在我们的训练数据集中,他们指的是
2:44
这种方法作为循环虚拟相机
2:46
轨迹作为起点和终点
2:48
视图与我们的输入图像相同
2:51
通过去一个虚拟的或假的来做到这一点
2:54
示例视点并返回
2:56
原来的观点后来只是为了教
2:58
模型的重建部分
3:01
视点使用一个采样
3:03
称为自动驾驶算法的算法
3:05
寻找天空而不是跳伞进入
3:08
没有人愿意的岩石或地面
3:10
这样做然后在训练期间我们使用
3:13
使用鉴别器的类似枪支的方法
3:15
衡量新观点的多少
3:17
生成的看起来像真实图像
3:19
用 L adversarial 或 ladv 表示
3:23
所以是的,枪还没有死,这是
3:26
它们非常酷的应用
3:28
在没有的情况下指导培训
3:30
任何地面屋顶,例如当你
3:32
在这种情况下没有无限图像
3:34
基本上他们使用另一种模型
3:37
在我们的训练中训练的判别器
3:39
可以查看图像是否看起来的数据集
3:42
成为它的一部分或不那么基于它
3:44
回答你可以提高一代
3:46
让它看起来像我们数据中的图像
3:49
看起来很逼真的场景
3:52
也衡量我们之间的差异
3:53
重新生成的初始图像和
3:56
原创一帮模特
3:57
迭代地更好地重建
3:59
在这里由 L Rick 代表
4:03
我们简单地重复这个过程多次
4:05
生成我们新颖的框架的时间和
4:07
创建这些类型的视频有一个
4:10
在得到那些之前要调整的最后一件事
4:12
他们看到了惊人的结果
4:14
接近天空,因为它是无限的
4:17
自然与地面的变化相比
4:19
太快无法解决他们使用的问题
4:21
另一个细分模型来找到
4:24
天空中自动生成
4:26
图像并使用智能修复它
4:28
生成之间的混合系统
4:31
天空和我们初始图像中的天空
4:33
以免变化太快
4:35
并且在训练之后不切实际
4:38
这两个步骤的过程和规模
4:40
精炼无限自然0让你
4:42
拥有稳定的远程轨迹
4:44
对于自然场景以及准确
4:47
生成高贵的观点是
4:49
几何连贯,瞧,这是
4:52
你如何拍照并潜入
4:54
就好像你是一只鸟,我邀请你
4:56
阅读他们的论文以获取更多详细信息
4:58
他们的方法和限制
5:00
特别是关于他们如何实现
5:02
以如此聪明的方式训练他们的模型
5:05
因为我省略了一些技术细节
5:07
通过以下方式使 Simplicity 成为可能
5:09
代码可用和链接的方式
5:11
下面如果你想试试让我
5:13
知道你是否这样做并把结果发给我
5:15
我很想看到他们谢谢你
5:17
看着,我希望你喜欢这个
5:19
视频我下周见
5:21
另一篇惊人的论文