El periódico de esta semana puede ser su próximo modelo favorito hasta la fecha. Si cree que los modelos de generación de imágenes recientes como o son geniales, no podrá creer lo increíble que es este. DALLE Stable Diffusion "Este" es Imagic. Imagic toma un modelo basado en difusión capaz de tomar texto y generar imágenes a partir de él y adapta el modelo para editar las imágenes. Solo mira eso... Puedes generar una imagen y luego enseñarle al modelo a editarla como quieras. Obtenga más información en el siguiente video... Referencias: ►Lea el artículo completo: ►Kawar, B., Zada, S., Lang, O., Tov, O., Chang, H., Dekel, T., Mosseri, I. and Irani, M., 2022. Imagic: imagen real basada en texto Edición con modelos de difusión. preimpresión de arXiv arXiv:2210.09276. ► Úselo con difusión estable: ►My Newsletter (¡Una nueva aplicación de IA explicada semanalmente en sus correos electrónicos!): https://www.louisbouchard.ai/imagic/ https://github.com/justinpinkney/stable-diffusion/blob/main/notebooks/imagic.ipynb https://www.louisbouchard.ai/newsletter/ Transcripción del vídeo 0:24 mira que puedes generar una imagen 0:26 y luego enséñele al modelo a editarlo 0:29 como quieras, este es un gran paso 0:31 hacia tener tu propio Photoshop 0:33 diseñador gratis el modelo no solo 0:36 entiende lo que quieres mostrar pero 0:38 también es capaz de mantenerse realista 0:41 manteniendo las propiedades de la inicial 0:43 imagenes solo mira como se queda el perro 0:46 lo mismo en todas las imagenes aqui esta tarea es 0:49 llamada edición de imagen condicionada por texto 0:51 esto significa editar imágenes usando solo 0:54 texto y una imagen inicial que fue 0:57 casi imposible ni siquiera un año 0:59 hace ahora mira lo que puede hacer sí esto 1:03 todo se hace desde una sola imagen de entrada 1:05 y una frase corta donde ves lo que 1:07 te gustaría tener lo increíble que es eso 1:09 lo único aún más genial es cómo 1:12 funciona, profundicemos en ello, pero primero si 1:15 actualmente estás aprendiendo IA o quieres 1:17 Empieza a aprenderlo, te encantará. 1:19 oportunidad Sé lo difícil que puede ser 1:22 hacer un progreso real al aprender IA 1:24 a veces estructura extra y 1:26 la responsabilidad puede ser lo que te proponga 1:29 el siguiente nivel si eso suena como usted 1:31 únete al patrocinador de este video Delta 1:33 Academy en Delta Academy se aprende 1:36 Aprendizaje por refuerzo construyendo un juego. 1:38 AIS en una cohorte en vivo va de cero a 1:41 alphago a través de la exportación hecha a mano 1:43 tutoriales interactivos discusiones en vivo 1:46 con estos expertos y la IA semanal 1:48 concursos de construcción no es sólo 1:51 otro sitio web de spam de curso es intenso 1:53 práctico y centrado en la alta calidad 1:56 diseñado por expertos de deepmind Oxford 1:58 y Cambridge es donde van los codificadores 2:01 A prueba de futuro su portador desde el 2:03 Avance de la IA y diviértase más con un 2:06 comunidad en vivo de pares y expertos para 2:08 empujarte hacia adelante escribirás icónico 2:10 algoritmos en Python que van desde dqn a 2:13 alphago uno de los mejores programas de la historia 2:16 Hice unirse a ellos ahora a través de mi enlace a continuación 2:18 y use el código de promoción ¿Qué es AI para obtener? 2:21 10% de descuento 2:23 Entonces, ¿cómo funciona iMagic como lo dijimos? 2:26 toma una imagen y un título para editar el 2:29 establece la imagen e incluso puedes generar 2:31 múltiples variaciones de este modelo 2:33 como la gran mayoría de los periódicos 2:35 que se publican estos días se basa en 2:38 modelos de difusión más específicamente 2:41 toma un modelo generador de imágenes que fue 2:43 ya capacitado para generar imágenes a partir de 2:45 texto y lo adapta a la edición de imágenes en 2:48 su caso usa Imogen que yo 2:51 cubierto en un video anterior es un 2:53 modelo generativo basado en difusión capaz de 2:55 crear imágenes de alta definición después 2:57 siendo entrenado en un enorme conjunto de datos de 3:00 pares de pies de imagen en el caso de 3:02 iMagic simplemente toman este pre-entrenado 3:05 modelo de imagen como línea de base y hacer 3:08 modificaciones al mismo con el fin de editar el 3:10 imágenes enviadas como entrada manteniendo la imagen 3:13 apariencia específica como la del perro 3:16 raza e identidad y editarlo 3:18 siguiendo nuestro texto así que para empezar tenemos 3:21 para codificar tanto el texto como la inicial 3:23 borde de la imagen para que se pueda entender 3:25 por nuestro modelo de imagen cuando esto se hace 3:28 optimizamos nuestro texto codifica nuestro texto 3:31 incrustaciones para adaptarse mejor a nuestra inicial 3:33 imagen básicamente tomando nuestro texto 3:35 representación y optimizarla para nuestros 3:38 imagen inicial llamada e optimizar para ser 3:41 seguro que entiende que en este ejemplo 3:43 queremos generar el mismo tipo de 3:45 imagen con un pájaro de aspecto similar y 3:48 fondo entonces tomamos nuestro pre-entrenado 3:51 generador de imágenes para afinar su significado 3:53 que volveremos a entrenar la imagen y el modelo 3:55 manteniendo las incrustaciones de texto optimizadas que 3:58 acaba de producir lo mismo por lo que estos dos 4:01 Los pasos se utilizan para obtener el texto incrustado. 4:03 más cerca de la imagen incrustada por 4:06 congelar uno de los dos y obtener el 4:08 otro más cercano que asegurará que 4:10 optimizar tanto para el texto como para la inicial 4:12 imagen no solo uno de los dos ahora que 4:15 nuestro modelo entiende la imagen inicial 4:17 en nuestro texto y entiende que ellos 4:19 son similares tenemos que enseñárselo a 4:21 generar nuevas variaciones de imagen para este 4:24 texto esta chispa es super simple nuestro texto 4:27 incrustaciones e imagen optimizada 4:29 las incrustaciones son muy similares pero aún así 4:32 no es exactamente lo mismo lo único que hacemos 4:34 aquí es que tomamos la imagen incrustada 4:36 en nuestro espacio codificado y moverlo un poco 4:39 hacia el texto incrustado en este momento 4:42 si le pide al modelo iMagic que genere 4:45 una imagen usando el texto optimizado 4:47 debe darle la misma imagen que su 4:49 imagen de entrada por lo que si mueve la incrustación 4:52 un poco hacia su texto lo incrusta 4:55 también editará la imagen un poco hacia 4:58 lo que quieres cuanto más lo mueves adentro 5:00 este espacio, más grande será la edición 5:02 y cuanto más te alejes de 5:05 tu imagen inicial por lo que lo único que 5:07 necesita averiguar ahora es el tamaño de 5:10 este paso que quieres dar hacia tu 5:12 envía un mensaje de texto y listo cuando encuentres tu 5:15 equilibrio perfecto tienes un modelo nuevo 5:17 capaz de generar tantas variaciones como 5:20 quieres conservar la imagen importante 5:22 vistas de atributos mientras se edita la forma 5:25 quieres por supuesto que los resultados no son 5:27 perfecto todavía como se puede ver aquí donde 5:30 el modelo tampoco se edita correctamente 5:32 o hace modificaciones de imagen aleatorias a 5:35 la imagen inicial como recortar o 5:37 haciendo zoom inapropiadamente aún permanece 5:40 bastante impresionante si me preguntas, encuentro 5:42 el ritmo de la generación de imágenes 5:44 progreso increíble y eso es tanto 5:47 increíble y aterrador al mismo tiempo 5:50 Me encantaría saber tu opinión sobre este tipo 5:52 de generación y edición de imágenes 5:54 modelos crees que son buenos o 5:57 cosa mala que tipo de consecuencias tu 5:59 puede pensar en que tales modelos se conviertan en 6:02 cada vez más poderoso puedes encontrar más 6:04 detalles sobre los parámetros específicos que 6:06 utilizan para lograr estos resultados en sus 6:08 paper al que definitivamente los invito 6:10 lee también te invito a ver mi imagen 6:13 y video si desea más información 6:14 sobre la parte de generación de imágenes y 6:17 entender cómo funciona enorme gracias a 6:20 mis amigos en Delta Academy por trabajar 6:22 sobre hacer que aprender IA sea divertido, algo que soy 6:26 apasionado por favor pruébalo 6:28 y déjame saber lo que piensas 6:30 personalmente amo esta forma de enseñar y 6:33 Estoy seguro de que usted también se lo agradecerá 6:35 apoyando mi trabajo revisando sus 6:37 sitio web y viendo el video completo 6:39 y espero que les haya gustado nos vemos 6:42 la próxima semana con otro artículo increíble