paint-brush
ByteDance apuesta a lo grande: ¿una salida estratégica del circo de las redes sociales con vídeos de inteligencia artificial?por@bigmao
Nueva Historia

ByteDance apuesta a lo grande: ¿una salida estratégica del circo de las redes sociales con vídeos de inteligencia artificial?

por susie liu7m2024/09/27
Read on Terminal Reader

Demasiado Largo; Para Leer

ByteDance presentó dos modelos de gran impacto, PixelDance y Seaweed, con la gran promesa de revolucionar el panorama de la generación de videos con IA. No se trata de un truco de IA, sino de un cambio estratégico. El futuro de ByteDance no reside en los hashtags efímeros y los ingresos por publicidad, sino en los brazos sólidos y confiables de una producción seria: un modelo centrado en la empresa y diseñado para el crecimiento y la innovación. Esto es lo que necesita saber sobre sus últimos modelos.
featured image - ByteDance apuesta a lo grande: ¿una salida estratégica del circo de las redes sociales con vídeos de inteligencia artificial?
susie liu HackerNoon profile picture
0-item
1-item
2-item


Justo cuando pensabas que podías tomarte un respiro de la IA, ByteDance aparece en el centro de atención , pero no con la interminable saga de TikTok. En una deslumbrante exhibición de innovación en IA en Shenzhen, Volcano Engine de ByteDance presentó dos modelos de gran impacto, PixelDance y Seaweed , con la gran promesa de revolucionar el panorama de la generación de videos . PixelDance se enfoca en generar videos dinámicos y de alta calidad a partir de indicaciones textuales y visuales; piensa en él como el genio que concede deseos a los creadores de videos. Seaweed se adentra en los reinos de la animación 3D y la representación artística, y atiende a aquellos que quieren que sus imágenes destaquen como confeti en una fiesta.


Estos modelos incorporan una tecnología muy importante, y eso se debe a que su público objetivo real no es su vecino influyente de la Generación Z, sino creadores y productoras serios.


Bytedance nos trae una interesante actualización. Siga leyendo para descubrir por qué.


Que son No Te lo digo


ByteDance lleva mucho tiempo cortejando a la IA. Cuando empezaron a desarrollar recomendaciones algorítmicas, la mayoría de nosotros asociamos la abreviatura “IA” con “Adobe Illustrator”. Uno podría suponer que están perfeccionando la IA para operaciones de cara al consumidor, pero eso es lo que quieren que creamos.


Están apostando a que la IA los llevará de ser una plataforma descartable (propensa a demandas, escrutinio de datos y mucha burocracia) a una herramienta indispensable .


El futuro de ByteDance no reside en los hashtags efímeros y los ingresos por publicidad, sino en los brazos sólidos y confiables de una producción seria: un modelo centrado en la empresa diseñado para el crecimiento y la innovación. Mediante un cambio estratégico en el enfoque hacia las aplicaciones profesionales, ByteDance no solo sobrevivirá a la tormenta; prosperará redefiniendo su papel en el ecosistema tecnológico .


PixelDance: De la mente a la magia


PixelDance promete ser la agencia que puede tomar tus frases a medio formar y tu parloteo semi-coherente y crear exactamente lo que tenías en mente . Sus principales características incluyen:


Entrada combinada de texto e imagen

  • A diferencia de los modelos de generación de videos tradicionales, PixelDance permite a los usuarios proporcionar tanto texto como imágenes (específicamente el primer y el último fotograma). Esto significa que obtienes un video que comienza y termina exactamente como lo imaginaste.
  • Resumen para el público general : Es un director que realmente escucha tus ideas y las hace realidad. Y no te responde.

Arquitectura del modelo de difusión latente

  • Este bebé se ejecuta en un modelo de difusión latente, que utiliza codificadores automáticos variacionales (VAE) previamente entrenados y un codificador de texto . Las entradas de imágenes se alimentan a través de un VAE, combinado con variables latentes de video para garantizar un movimiento uniforme y consistente.
  • Resumen para legos: Es una licuadora de alta tecnología que bate tus sueños en video sin dejar grumos.

Segmentos de video continuos

  • PixelDance puede generar videoclips continuos manteniendo la coherencia temporal . Utiliza el último fotograma de un segmento como el primer fotograma del siguiente.
  • Resumen para legos: Dígale adiós a esos cortes incómodos.

Edición de video sin tomas

  • Esta función permite a los usuarios editar vídeos sin necesidad de formación específica. Puedes guiar la creación del vídeo modificando solo el primer y el último fotograma.
  • Resumen para profanos: Se puede reeditar una película taquillera entera simplemente ajustando las escenas iniciales y finales: pura magia cinematográfica.

Amplio soporte de estilos

  • Desde animación en blanco y negro hasta animación 3D y estilos de pintura china tradicional, PixelDance admite una amplia gama de estéticas, incluidas relaciones de aspecto como 1:1 y 3:4.
  • Resumen para profanos: No se trata de Anna Wintour ni de ningún otro esnob de estilo. Este objeto no tiene preferencias artísticas, solo un arsenal de herramientas.

Conjuntos de datos de entrenamiento

  • PixelDance se entrenó en WebVid-10M , un conjunto de datos de aproximadamente 10 millones de videos cortos (duración promedio: 18 segundos) con una resolución de 336 x 596. Además, utilizaron 500 000 videoclips sin marca de agua para garantizar un resultado de alta calidad.
  • Resumen para legos: He visto más vídeos de los que verás nunca. Es la enciclopedia de referencias cinematográficas. Confía en su profesionalismo.


Algas marinas: el alquimista de la edición


Seaweed es la respuesta de ByteDance a los problemas de edición que afectan a los creadores. Diseñado para complementar a PixelDance , Seaweed utiliza IA para optimizar el proceso de edición con características impresionantes:


Representación 3D

  • Seaweed utiliza técnicas de renderizado avanzadas para generar imágenes que no solo son planas sino que tienen profundidad y realismo, lo que las hace adecuadas para animaciones y expresiones artísticas de alta calidad.
  • Resumen para legos: Tienes el estudio de animación Pixar a tu alcance.


Detección de corte inteligente

  • Utilizando algoritmos sofisticados, Seaweed identifica momentos clave en su metraje , lo que permite cortes rápidos sin perder la narrativa.
  • Resumen para legos: Un editor personal que puede identificar los momentos clave en su metraje original. Rápido. Muy rápido.


Gradación de color y efectos mejorados

  • Esta herramienta automatiza la corrección de color y aplica efectos estilísticos para garantizar que su video se vea impecable sin los tediosos ajustes manuales.
  • Resumen para el público general: Puedes conseguir colores y estilos que hasta el mismísimo Baz Luhrmann aprobaría, incluso si eres daltónico.


Interfaz fácil de usar con asistencia de IA

  • Seaweed combina capacidades avanzadas de inteligencia artificial con una interfaz sencilla, lo que la hace accesible incluso para aquellos que no son expertos en tecnología.
  • Resumen para legos: Es como adquirir un Ferrari pero con permiso de aprendizaje: conducción suave para todos.


Reflexiones finales: Construyendo para la élite tecnológica


PixelDance y Seaweed no son solo herramientas; son el boleto de entrada de ByteDance a un nuevo y más sofisticado campo de juego donde hay mucho en juego y la competencia es feroz. Mientras que la mayoría se conforman con atender a los creadores ocasionales que buscan plantillas y crear contenido "suficientemente bueno" para la presentación de diapositivas de la boda de su primo, ByteDance apunta a los más destacados.


ByteDance está dando señales de que no está interesado en convertirse en el Canva de los videos con IA. Su objetivo es algo más parecido a un híbrido Pixar-ILM impulsado por IA. Esto significa que priorizan la calidad de sus usuarios por sobre la cantidad , y se centran en cineastas, animadores, agencias de marketing y empresas que necesitan videos sofisticados y muy pulidos que se destaquen en un mercado de contenido saturado.


Es inteligente. Muy inteligente. Pero no está exento de riesgos.


Estrategia de precios agresiva: ¿un arma de doble filo?


Su agresiva estrategia de precios, de 0,002 dólares por token (en comparación con los 0,03 dólares por token de OpenAI) , está diseñada para revolucionar el mercado. Es un llamado de atención para las pequeñas y medianas empresas (pymes) y los creadores independientes, que ahora pueden acceder a herramientas de vanguardia que antes consideraban fuera de su alcance.


Pero el bajo costo por token es una apuesta arriesgada. ByteDance puede permitirse jugar a este juego ahora, pero mantener estos precios a largo plazo podría ser un desafío , especialmente si el costo de adquisición de datos e infraestructura aumenta desproporcionadamente. Si bien el precio inicial puede atraer a los clientes, mantenerlo sin sacrificar la calidad o la innovación podría ser un camino de equilibrismo.


Competencia de Unity y Unreal Engine


ByteDance se adentra en un campo de batalla que ya está dominado por gigantes como Unity y Unreal Engine , pioneros en los campos de la renderización 3D, la animación e incluso la realización de películas en tiempo real, con comunidades grandes y leales y amplios recursos. Unity ha avanzado mucho en la producción virtual y la narración de historias en tiempo real, mientras que las actualizaciones recientes de Unreal Engine han llamado la atención con sus capacidades de renderización hiperrealista. Ambos están integrando ahora funciones de IA para mejorar sus ofertas, lo que los convierte en competidores directos de las capacidades de renderización 3D y vídeo interactivo de Seaweed.


Los ecosistemas establecidos de Unity y Unreal Engine también les dan una ventaja crucial: la base de usuarios y el apoyo de la comunidad . El desafío de ByteDance será convencer a los creadores de que PixelDance y Seaweed ofrecen algo que estas plataformas no pueden, ya sea una mejor integración con las herramientas existentes, flujos de trabajo más rápidos o una calidad de salida superior. Pero ¿puede la superioridad técnica ser suficiente para convencer a los usuarios de que Unity y Unreal han estado cultivando durante años?


Posibles trampas: alta ambición, mucho en juego


Las elevadas ambiciones de ByteDance para PixelDance y Seaweed traen consigo una brillante variedad de riesgos. Poner el listón muy alto con promesas de herramientas de nivel profesional para competir con los titanes de la industria es una jugada audaz, pero si estas plataformas no cumplen , corren el riesgo de enfrentarse a la ira de los mismos profesionales a los que pretenden cortejar. Si a esto le sumamos el escrutinio regulatorio (porque ¿a quién no le gusta una buena auditoría gubernamental cuando se juega con IA?), tenemos una receta para la tensión, especialmente con las preocupaciones por la privacidad de los datos que se avecinan y TikTok como su descendencia. Y aunque apuntar a los profesionales es una jugada inteligente, Peter Thiel probablemente preguntaría: ¿hay espacio para construir un monopolio aquí?


El panorama general: Apuntando a las estrellas, ¿lograrán aterrizar?


Mientras PixelDance y Seaweed se preparan para su lanzamiento más amplio, ByteDance está haciendo una declaración audaz: no se conforman con ser simplemente un gigante de las redes sociales . Apuntan a la cima de la creación de contenido digital , y su enfoque en creadores de alta calidad en lugar de en el volumen es una decisión audaz, especialmente en un mundo en el que todas las plataformas se esfuerzan por ser lo más accesibles posible.


¿Podrán transformar el mundo del video generado por IA y acercarse al Trono de Hierro de la tecnología? ¿O se convertirá en otro ambicioso experimento en los anales de la historia de la tecnología?


Es un proyecto ambicioso y, como sabe cualquier aficionado a la tecnología, no siempre resulta del todo satisfactorio. Pero una cosa es segura: están haciendo que el panorama de la generación de vídeos sea mucho más interesante.


Así que, prepara tus palomitas de maíz. Este espectáculo recién comienza.


Nota: Ambas plataformas se encuentran actualmente en una fase de prueba solo por invitación (puede intentar postularse a través de Volcano Engine), y se anticipa un acceso más amplio pronto, aunque la fecha exacta es tan esquiva como su señal de Wi-Fi durante una llamada de Zoom).