Avez-vous déjà imaginé pouvoir prendre une photo et y plonger comme par magie comme s'il s'agissait d'une porte vers un autre monde ?  Eh bien, que vous y ayez pensé ou non, certaines personnes l'ont fait, et grâce à elles, c'est désormais possible avec l'IA ! Ce n'est qu'à un pas de la téléportation et de pouvoir être là physiquement. Peut-être qu'un jour l'IA aidera à cela et résoudra également un problème réel ! Je plaisante, c'est vraiment cool, et je suis content que certaines personnes travaillent dessus.  C'est InfiniteNature… Zéro ! Il s'appelle ainsi car il s'agit d'un suivi d'un article que j'ai précédemment couvert et intitulé InfiniteNature. Quelle est la différence? Qualité!  En savoir plus dans la vidéo...   Références  ►Lire l'article complet :   ►Li, Z., Wang, Q., Snavely, N. et Kanazawa, A., 2022.  InfiniteNature-Zero : Apprentissage Perpetual View Generation of Natural  Scènes à partir d'images uniques. Dans Conférence européenne sur la vision par ordinateur  (pp. 515-534). Springer, Cham,   ► Site du code et du projet :   ►Ma Newsletter (Une nouvelle application d'IA expliquée chaque semaine à vos mails !) :  https://www.louisbouchard.ai/infinitenature-zero/ https://arxiv.org/abs/2207.11148 https://infinite-nature-zero.github.io/ https://www.louisbouchard.ai/newsletter/  Transcription vidéo ﻿0:00  avez-vous déjà imaginé pouvoir  0:02  prenez une photo et plongez comme par magie  0:04  dedans comme si ce serait une porte vers  0:06  un autre monde bien si vous pensiez  0:08  à ce sujet ou non, certaines personnes l'ont fait et  0:11  grâce à eux c'est désormais possible avec l'IA  0:13  ce n'est qu'à un pas de  0:16  téléportation et pouvoir être là  0:18  physiquement peut-être qu'un jour l'IA aidera  0:21  avec cela et résoudre un problème réel aussi  0:23  Je plaisante, c'est vraiment cool et  0:25  Je suis content que certaines personnes y travaillent  0:27  c'est la nature infinie zéro ça s'appelle  0:31  de cette façon parce que c'est un suivi d'un  0:33  article que j'ai précédemment couvert appelé  0:35  nature infinie quelle est la différence  0:37  la qualité regarde ça c'est tellement  0:40  mieux dans un seul papier c'est incroyable  0:43  vous pouvez réellement vous sentir comme si vous étiez  0:45  plonger dans l'image et c'est seulement  0:47  nécessite une image d'entrée à quel point c'est cool  0:50  que la seule chose encore plus cool est de savoir comment  0:53  ça marche plongeons dedans mais d'abord  0:56  accordez-moi 10 secondes de votre temps pour un  0:58  sponsor de cette vidéo moi-même oui seulement 10  1:01  secondes je ne pense pas que je mérite plus  1:02  par rapport aux entreprises étonnantes qui  1:04  parrainez généralement mon travail si vous aimez le  1:06  vidéos d'abord je pense que vous devriez  1:08  abonne toi a la chaine mais moi aussi  1:10  pensez que vous allez adorer mes deux newsletters  1:12  où je partage des articles de recherche quotidiens et  1:15  news et l'hebdomadaire où je partage  1:17  ces vidéos et très intéressantes  1:19  discussions liées à ces documents et  1:21  Éthique de l'IA, vous devriez probablement me suivre  1:24  sur Twitter ainsi qu'à quoi sert l'IA si vous voulez  1:26  aime rester au courant de l'actualité  1:28  et des tonnes de papiers sur le terrain arrivent  1h30  avec les délais cvpr qui viennent  1:32  passé et vous ne voulez pas manquer  1:34  ceux-là alors comment la nature infinie zéro  1:37  travailler tout commence par une seule image  1:40  vous envoyez en entrée oui une seule image  1:43  ne nécessite pas de vidéo ou plusieurs  1:44  vues ou toute autre chose c'est différent  1:47  de leur article précédent que j'ai aussi  1:49  couvert là où ils avaient besoin de vidéos pour les aider  1:51  le modèle comprend les scènes naturelles  1:53  pendant la formation, c'est aussi pourquoi ils  1:55  appelons ce modèle la nature infinie zéro  1:58  car il ne nécessite aucune vidéo ici  2:01  leur travail est divisé en trois méthodes  2:03  utilisé pendant la formation afin d'obtenir  2:05  ces résultats pour démarrer le modèle  2:07  échantillonne au hasard deux caméras virtuelles  2:10  des trajectoires qui vous diront où  2:12  tu vas dans l'image pourquoi aussi  2:14  parce que la force est nécessaire pour  2:16  générer une nouvelle vue vous indiquant où  2:19  voler dans l'image pour générer une seconde  2:21  image c'est la trajectoire réelle que vous  2:24  prendra le deuxième virtuel  2:25  trajectoire est utilisée pendant l'entraînement pour  2:28  plonger et revenir à l'image d'origine pour  2:31  apprendre au modèle à apprendre la géométrie consciente  2:33  affinement de la vue lors de la génération de la vue  2:36  d'une manière auto-supervisée comme nous l'enseignons  2:39  pour revenir à une image que nous avons déjà  2:42  dans notre ensemble de données d'entraînement, ils se réfèrent à  2:44  cette approche en tant que caméra virtuelle cyclique  2:46  trajectoire comme début et fin  2:48  les vues sont les mêmes que notre image d'entrée  2:51  faites cela en allant à un virtuel ou un faux  2:54  exemple de point de vue et retour au  2:56  vue originale après juste pour enseigner  2:58  la partie Reconstruction au modèle  3:01  points de vue sont échantillonnés à l'aide d'un  3:03  algorithme appelé l'algorithme du pilote automatique  3:05  trouver le ciel et non sauter dedans  3:08  les rochers ou le sol comme personne ne le voudrait  3:10  pour ce faire, pendant la formation, nous utilisons un  3:13  approche de type pistolet utilisant un discriminateur  3:15  pour mesurer combien la nouvelle vue  3:17  généré ressemble à une image réelle  3:19  représenté par L contradictoire ou ladv  3:23  alors oui les armes ne sont pas encore mortes c'est un  3:26  application très cool d'entre eux pour  3:28  guider la formation quand vous n'avez pas  3h30  n'importe quel toit au sol par exemple lorsque vous  3:32  n'ont pas d'images infinies dans ce cas  3:34  en gros ils utilisent un autre modèle a  3:37  discriminateur formé sur notre formation  3:39  ensemble de données qui peut voir si une image semble  3:42  en faire partie ou pas si en fonction de son  3:44  répondre vous pouvez améliorer la génération à  3:46  le faire ressembler à une image de nos données  3:49  ensemble qui semble soi-disant réaliste nous  3:52  aussi mesurer la différence entre nos  3:53  l'image initiale régénérée et la  3:56  l'original pour aider le modèle  3:57  améliorer itérativement la reconstruction  3:59  agissant représenté par L Rick ici et  4:03  nous répétons simplement ce processus plusieurs fois  4:05  fois pour générer nos nouveaux cadres et  4:07  créer ce genre de vidéos il y en a une  4:10  dernière chose à peaufiner avant de les obtenir  4:12  des résultats étonnants qu'ils ont vus avec leur  4:14  s'approcher du ciel en raison de son infini  4:17  la nature par rapport au sol change  4:19  beaucoup trop rapidement pour réparer qu'ils utilisent  4:21  un autre modèle de segmentation pour trouver  4:24  ciel automatiquement dans le généré  4:26  images et corrigez-les à l'aide d'un  4:28  système de mélange entre les produits générés  4:31  ciel et le ciel de notre image initiale  4:33  pour que ça ne change pas trop vite  4:35  et irréaliste après l'entraînement avec  4:38  ce processus et cette échelle en deux étapes  4:40  raffinement infini nature 0 vous permet  4:42  avoir des trajectoires stables à longue distance  4:44  pour les scènes naturelles ainsi qu'avec précision  4:47  générer des vues Noble qui sont  4:49  géométriquement cohérent et le tour est joué  4:52  comment prendre une photo et plonger dans  4:54  c'est comme si tu étais un oiseau je t'invite à  4:56  lire leur article pour plus de détails sur  4:58  leur méthode et en limitation  5:00  surtout en ce qui concerne la façon dont ils parviennent à  5:02  former leur modèle d'une manière si intelligente  5:05  car j'ai omis quelques détails techniques  5:07  rendre cela possible pour Simplicity en  5:09  la façon dont le code est disponible et lié  5:11  ci-dessous si vous voulez essayer laissez-moi  5:13  savoir si vous le faites et envoyez-moi les résultats  5:15  j'aimerais bien les voir merci pour  5:17  regarder et j'espère que vous avez apprécié cela  5:19  vidéo je vous verrai la semaine prochaine avec  5:21  un autre papier incroyable

Watch more on YouTube: https://www.youtube.com/c/WhatsAI

I explain Artificial Intelligence terms and news to non-experts.

2021 - HackerNoon Contributor of the Year - FACEBOOK

2022 - Best Data Science Newsletter

2022 - HackerNoon Contributor of the Year - Artificial Intelligence

2022 - HackerNoon Contributor of the Year - Computer Vision

2022 - HackerNoon Contributor of the Year - Data Science

2022 - HackerNoon Contributor of the Year - Google

2022 - HackerNoon Contributor of the Year - Innovation

2022 - HackerNoon Contributor of the Year - Machine Learning

2022 - HackerNoon Contributor of the Year - Natural Language Processing

2022 - Top Tech Youtuber

2021 - HackerNoon Contributor of the Year - DEEP-LEARNING

Nominated for 2022 - Best Data Science Newsletter

Nominated for 2022 - HackerNoon Contributor of the Year - Artificial Intelligence

Nominated for 2022 - Top Tech Youtuber

Nominated for 2022 - HackerNoon Contributor of the Year - Innovation

Nominated for 2022 - HackerNoon Contributor of the Year - Data Science

Nominated for 2022 - HackerNoon Contributor of the Year - Natural Language Processing

Qu'est-ce que le modèle d'IA InfiniteNature-Zero ?

About Author

COMMENTAIRES

ÉTIQUETTES

CET ARTICLE A ÉTÉ PARU DANS

Related Stories

Des forums aux flux : comment les algorithmes des réseaux sociaux façonnent l'interaction numérique

Appuyez pour gagner : Telegram pourrait intégrer les 10 prochains milliards d'utilisateurs de crypto avant Solana

HackerNoon Decoded: The Top 10 Countries Where HackerNoon Is the Most Active

Naviguer sur les eaux : développer des applications RAG de qualité production avec des lacs de données

Des forums aux flux : comment les algorithmes des réseaux sociaux façonnent l'interaction numérique

Appuyez pour gagner : Telegram pourrait intégrer les 10 prochains milliards d'utilisateurs de crypto avant Solana

HackerNoon Decoded: The Top 10 Countries Where HackerNoon Is the Most Active

Naviguer sur les eaux : développer des applications RAG de qualité production avec des lacs de données

Light-Mode

Classic

Newspaper

Minty

Dark-Mode

Neon Noir

Minty

HN StartUps