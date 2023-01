Trop long; Pour lire Avez-vous déjà imaginé pouvoir prendre une photo et y plonger comme par magie comme s'il s'agissait d'une porte vers un autre monde ? Eh bien, que vous y ayez pensé ou non, certaines personnes l'ont fait, et grâce à elles, c'est désormais possible avec l'IA ! Ce n'est qu'à un pas de la téléportation et de pouvoir être là physiquement. Peut-être qu'un jour l'IA aidera à cela et résoudra également un problème réel ! Je plaisante, c'est vraiment cool, et je suis content que certaines personnes y travaillent. C'est InfiniteNature… Zéro ! Il s'appelle ainsi car il s'agit d'un suivi d'un article que j'ai précédemment couvert et intitulé InfiniteNature. Quelle est la différence? Qualité!

Références

►Lire l'article complet : https://www.louisbouchard.ai/infinitenature-zero/

►Li, Z., Wang, Q., Snavely, N. et Kanazawa, A., 2022.

InfiniteNature-Zero : Apprentissage Perpetual View Generation of Natural

Scènes à partir d'images uniques. Dans Conférence européenne sur la vision par ordinateur

(pp. 515-534). Springer, Cham, https://arxiv.org/abs/2207.11148

► Site du code et du projet : https://infinite-nature-zero.github.io/

►Ma Newsletter (Une nouvelle application d'IA expliquée chaque semaine à vos mails !) : https://www.louisbouchard.ai/newsletter/

Transcription vidéo

0:00

avez-vous déjà imaginé pouvoir

0:02

prenez une photo et plongez comme par magie

0:04

dedans comme si ce serait une porte vers

0:06

un autre monde bien si vous pensiez

0:08

à ce sujet ou non, certaines personnes l'ont fait et

0:11

grâce à eux c'est désormais possible avec l'IA

0:13

ce n'est qu'à un pas de

0:16

téléportation et pouvoir être là

0:18

physiquement peut-être qu'un jour l'IA aidera

0:21

avec cela et résoudre un problème réel aussi

0:23

Je plaisante, c'est vraiment cool et

0:25

Je suis content que certaines personnes y travaillent

0:27

c'est la nature infinie zéro ça s'appelle

0:31

de cette façon parce que c'est un suivi d'un

0:33

article que j'ai précédemment couvert appelé

0:35

nature infinie quelle est la différence

0:37

la qualité regarde ça c'est tellement

0:40

mieux dans un seul papier c'est incroyable

0:43

vous pouvez réellement vous sentir comme si vous étiez

0:45

plonger dans l'image et c'est seulement

0:47

nécessite une image d'entrée à quel point c'est cool

0:50

que la seule chose encore plus cool est de savoir comment

0:53

ça marche plongeons dedans mais d'abord

0:56

accordez-moi 10 secondes de votre temps pour un

0:58

sponsor de cette vidéo moi-même oui seulement 10

1:01

secondes je ne pense pas que je mérite plus

1:02

par rapport aux entreprises étonnantes qui

1:04

parrainez généralement mon travail si vous aimez le

1:06

vidéos d'abord je pense que vous devriez

1:08

abonne toi a la chaine mais moi aussi

1:10

pensez que vous allez adorer mes deux newsletters

1:12

où je partage des articles de recherche quotidiens et

1:15

news et l'hebdomadaire où je partage

1:17

ces vidéos et très intéressantes

1:19

discussions liées à ces documents et

1:21

Éthique de l'IA, vous devriez probablement me suivre

1:24

sur Twitter ainsi qu'à quoi sert l'IA si vous voulez

1:26

aime rester au courant de l'actualité

1:28

et des tonnes de papiers sur le terrain arrivent

1h30

avec les délais cvpr qui viennent

1:32

passé et vous ne voulez pas manquer

1:34

ceux-là alors comment la nature infinie zéro

1:37

travailler tout commence par une seule image

1:40

vous envoyez en entrée oui une seule image

1:43

ne nécessite pas de vidéo ou plusieurs

1:44

vues ou toute autre chose c'est différent

1:47

de leur article précédent que j'ai aussi

1:49

couvert là où ils avaient besoin de vidéos pour les aider

1:51

le modèle comprend les scènes naturelles

1:53

pendant la formation, c'est aussi pourquoi ils

1:55

appelons ce modèle la nature infinie zéro

1:58

car il ne nécessite aucune vidéo ici

2:01

leur travail est divisé en trois méthodes

2:03

utilisé pendant la formation afin d'obtenir

2:05

ces résultats pour démarrer le modèle

2:07

échantillonne au hasard deux caméras virtuelles

2:10

des trajectoires qui vous diront où

2:12

tu vas dans l'image pourquoi aussi

2:14

parce que la force est nécessaire pour

2:16

générer une nouvelle vue vous indiquant où

2:19

voler dans l'image pour générer une seconde

2:21

image c'est la trajectoire réelle que vous

2:24

prendra le deuxième virtuel

2:25

trajectoire est utilisée pendant l'entraînement pour

2:28

plonger et revenir à l'image d'origine pour

2:31

apprendre au modèle à apprendre la géométrie consciente

2:33

affinement de la vue lors de la génération de la vue

2:36

d'une manière auto-supervisée comme nous l'enseignons

2:39

pour revenir à une image que nous avons déjà

2:42

dans notre ensemble de données d'entraînement, ils se réfèrent à

2:44

cette approche en tant que caméra virtuelle cyclique

2:46

trajectoire comme début et fin

2:48

les vues sont les mêmes que notre image d'entrée

2:51

faites cela en allant à un virtuel ou un faux

2:54

exemple de point de vue et retour au

2:56

vue originale après juste pour enseigner

2:58

la partie Reconstruction au modèle

3:01

points de vue sont échantillonnés à l'aide d'un

3:03

algorithme appelé l'algorithme du pilote automatique

3:05

trouver le ciel et non sauter dedans

3:08

les rochers ou le sol comme personne ne le voudrait

3:10

pour ce faire, pendant la formation, nous utilisons un

3:13

approche de type pistolet utilisant un discriminateur

3:15

pour mesurer combien la nouvelle vue

3:17

généré ressemble à une image réelle

3:19

représenté par L contradictoire ou ladv

3:23

alors oui les armes ne sont pas encore mortes c'est un

3:26

application très cool d'entre eux pour

3:28

guider la formation quand vous n'avez pas

3h30

n'importe quel toit au sol par exemple lorsque vous

3:32

n'ont pas d'images infinies dans ce cas

3:34

en gros ils utilisent un autre modèle a

3:37

discriminateur formé sur notre formation

3:39

ensemble de données qui peut voir si une image semble

3:42

en faire partie ou pas si en fonction de son

3:44

répondre vous pouvez améliorer la génération à

3:46

le faire ressembler à une image de nos données

3:49

ensemble qui semble soi-disant réaliste nous

3:52

aussi mesurer la différence entre nos

3:53

l'image initiale régénérée et la

3:56

l'original pour aider le modèle

3:57

améliorer itérativement la reconstruction

3:59

agissant représenté par L Rick ici et

4:03

nous répétons simplement ce processus plusieurs fois

4:05

fois pour générer nos nouveaux cadres et

4:07

créer ce genre de vidéos il y en a une

4:10

dernière chose à peaufiner avant de les obtenir

4:12

des résultats étonnants qu'ils ont vus avec leur

4:14

s'approcher du ciel en raison de son infini

4:17

la nature par rapport au sol change

4:19

beaucoup trop rapidement pour réparer qu'ils utilisent

4:21

un autre modèle de segmentation pour trouver

4:24

ciel automatiquement dans le généré

4:26

images et corrigez-les à l'aide d'un

4:28

système de mélange entre les produits générés

4:31

ciel et le ciel de notre image initiale

4:33

pour que ça ne change pas trop vite

4:35

et irréaliste après l'entraînement avec

4:38

ce processus et cette échelle en deux étapes

4:40

raffinement infini nature 0 vous permet

4:42

avoir des trajectoires stables à longue distance

4:44

pour les scènes naturelles ainsi qu'avec précision

4:47

générer des vues Noble qui sont

4:49

géométriquement cohérent et le tour est joué

4:52

comment prendre une photo et plonger dans

4:54

c'est comme si tu étais un oiseau je t'invite à

4:56

lire leur article pour plus de détails sur

4:58

leur méthode et en limitation

5:00

surtout en ce qui concerne la façon dont ils parviennent à

5:02

former leur modèle d'une manière si intelligente

5:05

car j'ai omis quelques détails techniques

5:07

rendre cela possible pour Simplicity en

5:09

la façon dont le code est disponible et lié

5:11

ci-dessous si vous voulez essayer laissez-moi

5:13

savoir si vous le faites et envoyez-moi les résultats

5:15

j'aimerais bien les voir merci pour

5:17

regarder et j'espère que vous avez apprécié cela

5:19

vidéo je vous verrai la semaine prochaine avec

5:21

un autre papier incroyable