paint-brush
ByteDance katta tikish: AI video bilan ijtimoiy media sirkidan strategik chiqishmi?tomonidan@bigmao
Yangi tarix

ByteDance katta tikish: AI video bilan ijtimoiy media sirkidan strategik chiqishmi?

tomonidan susie liu7m2024/09/27
Read on Terminal Reader

Juda uzoq; O'qish

ByteDance AI video ishlab chiqarish landshaftini silkitishning katta va'dasi bilan PixelDance va Seaweed ikkita kuchli modellarini namoyish etdi. Bu sun'iy intellektning hiylasi emas - bu strategik siljishning bir qismi. ByteDance kelajagi o'tkinchi hashtaglar va reklama daromadlarida emas, balki jiddiy ishlab chiqarishning mustahkam, ishonchli qurollarida - o'sish va innovatsiyalar uchun mo'ljallangan korxonaga yo'naltirilgan modelda. Ularning so'nggi modellari haqida bilishingiz kerak bo'lgan narsalar.
featured image - ByteDance katta tikish: AI video bilan ijtimoiy media sirkidan strategik chiqishmi?
susie liu HackerNoon profile picture
0-item
1-item
2-item


Aynan siz sun'iy intellektdan nafas olaman deb o'ylaganingizda, ByteDance diqqat markazida bo'ladi - lekin hech qachon tugamaydigan TikTok dostonida emas. Shenchjendagi yorqin sun'iy innovatsiyalar ko'rgazmasida ByteDance kompaniyasining Volcano Engine ikkita kuchli modelini namoyish etdi, PixelDance va Seaweed , video yaratish manzarasini silkitishga katta va'da berdi . PixelDance matnli va vizual takliflardan dinamik, yuqori sifatli videolar yaratishga e'tibor qaratadi - buni video ishlab chiqaruvchilar uchun tilaklarni beruvchi jin deb o'ylang. Dengiz o'tlari 3D animatsiya va badiiy render sohalariga chuqur kirib boradi va o'z vizuallarini ziyofatda konfeti kabi ko'tarmoqchi bo'lganlar uchun xizmat qiladi.


Ushbu modellarga jiddiy texnologiyalar kiritilgan va bu ularning haqiqiy maqsadli auditoriyasi sizning ta'sir o'tkazuvchiga qo'shni Gen Z qo'shnisi emas - bu jiddiy ijodkorlar va ishlab chiqarish uylari.


Bu Bytedance-dan ajoyib yangilanish. Buning sababini bilish uchun o'qing.


Ular nima Yo'q Sizga aytaman


ByteDance uzoq vaqtdan beri AI bilan shug'ullanadi. Ular algoritmik tavsiyalarni ishlab chiqishni boshlaganlarida, ko'pchiligimiz "AI" qisqartmasini "Adobe Illustrator" bilan bog'ladik. Siz ular iste'molchiga qaratilgan operatsiyalar uchun sun'iy intellektni qo'llab-quvvatlayapti deb o'ylaysiz, ammo ular bunga ishonishingizni xohlashadi.


Ular sun'iy intellekt ularni bir martalik platformadan (da'volar, ma'lumotlarni tekshirish va ko'plab qog'ozbozliklarga moyil) ajralmas vositaga olib borishiga ishonmoqdalar.


ByteDance kelajagi o'tkinchi hashtaglar va reklama daromadlarida emas, balki jiddiy ishlab chiqarishning mustahkam, ishonchli qurollarida - o'sish va innovatsiyalar uchun mo'ljallangan korxonaga yo'naltirilgan modelda . Diqqatni professional ilovalarga strategik o'zgartirish orqali ByteDance shunchaki bo'rondan omon qolmaydi; u texnologik ekotizimdagi rolini qayta belgilash orqali rivojlanadi .


PixelDance: aqldan sehrga


PixelDance sizning yarim tuzilgan jumlalaringizni va yarim izchil g'iybatlaringizni qabul qila oladigan va siz o'ylagan narsalarni ayta oladigan agentlik bo'lishni va'da qiladi. Uning asosiy xususiyatlariga quyidagilar kiradi:


Birlashtirilgan matn va rasm kiritish

  • An'anaviy video yaratish modellaridan farqli o'laroq, PixelDance foydalanuvchilarga matn va tasvirlarni (ayniqsa, birinchi va oxirgi kadrlarni) taqdim etish imkonini beradi. Bu siz tasavvur qilganingizdek boshlanadigan va tugaydigan videoni olishingizni anglatadi.
  • Laymanning qisqacha mazmuni : Bu sizning g'oyalaringizni tinglaydigan va ularni hayotga tatbiq etadigan rejissyor. Va qaytib gapirmaydi.

Yashirin diffuziya modeli arxitekturasi

  • Bu chaqaloq oldindan o'rgatilgan Variatsion avtokoderlar (VAE) va matn kodlovchisidan foydalangan holda yashirin diffuziya modelida ishlaydi. Tasvir kiritishlari uzluksiz harakat va izchillikni ta'minlash uchun video yashirin o'zgaruvchilar bilan aralashgan VAE orqali beriladi.
  • Laymanning qisqacha mazmuni: Bu yuqori texnologiyali blender bo'lib, u sizning video orzularingizni hech qanday bo'laklarsiz amalga oshiradi.

Uzluksiz video segmentlari

  • PixelDance vaqtinchalik muvofiqlikni saqlab , uzluksiz videokliplar yaratishi mumkin. U bir segmentning oxirgi ramkasidan keyingisining birinchi ramkasi sifatida foydalanadi.
  • Laymanning qisqacha mazmuni: O'sha noqulay qisqartirishlar bilan xayrlashing.

Nol-shot video tahrirlash

  • Bu xususiyat foydalanuvchilarga maxsus treninglarsiz videolarni tahrirlash imkonini beradi. Siz faqat birinchi va oxirgi kadrlarni o'zgartirish orqali video yaratishga rahbarlik qilishingiz mumkin.
  • Laymanning qisqacha mazmuni: Siz butun blokbaster filmini faqat ochilish va yopilish sahnalarini sozlash orqali qayta tahrirlashingiz mumkin - sof kino sehri.

Keng qamrovli uslubni qo'llab-quvvatlash

  • Oq-qoradan 3D animatsiyasigacha va an'anaviy xitoy rasm uslublarigacha, PixelDance keng ko'lamli estetikani qo'llab-quvvatlaydi, jumladan 1:1 va 3:4 kabi tomonlar nisbati.
  • Laymanning qisqacha mazmuni: Bu Anna Vintur yoki boshqa uslubdagi snob emas. Bu narsaning badiiy afzalliklari yo'q, faqat asboblar arsenali.

Trening ma'lumotlar to'plami

  • PixelDance 336 x 596 o'lchamli taxminan 10 million qisqa video (o'rtacha uzunlik: 18 soniya) bo'lgan WebVid-10M ma'lumotlar to'plamida o'qitilgan. Bundan tashqari, ular yuqori sifatli chiqishni ta'minlash uchun 500 000 ta moybo'yoqsiz videokliplardan foydalanganlar.
  • Laymanning qisqacha mazmuni: Siz ko'rgan ko'proq videolarni tomosha qildingiz. Bu kinematografiyaga oid entsiklopediya. Uning professionalligiga ishoning.


Dengiz o'tlari: Tahrirlovchi kimyogar


Dengiz o'ti - ByteDance-ning ijodkorlarni qiynayotgan tahrirlash muammolariga javobidir. PixelDance-ni to'ldirish uchun mo'ljallangan Seaweed tahrirlash jarayonini ta'sirchan xususiyatlar bilan soddalashtirish uchun sun'iy intellektdan foydalanadi:


3D renderlash

  • Dengiz o'ti nafaqat tekis, balki chuqurlik va realizmga ega bo'lgan vizual tasvirlarni yaratish uchun ilg'or renderlash usullaridan foydalanadi, bu ularni yuqori sifatli animatsiyalar va badiiy ifodalar uchun mos qiladi.
  • Laymanning qisqacha mazmuni: Pixar animatsiya studiyasi sizning qo'lingizda.


Kesishni aqlli aniqlash

  • Murakkab algoritmlardan foydalangan holda, dengiz o'ti tasviringizdagi asosiy daqiqalarni aniqlaydi , bu esa hikoyani yo'qotmasdan tezda kesish imkonini beradi.
  • Laymanning qisqacha mazmuni: Xom suratlaringizdagi oltin daqiqalarni aniqlay oladigan shaxsiy muharrir. Tez. Haqiqatan ham tez.


Kengaytirilgan rang tasnifi va effektlar

  • Ushbu vosita ranglarni to'g'rilashni avtomatlashtiradi va zerikarli qo'lda sozlashlarsiz videongiz sayqallangan ko'rinishini ta'minlash uchun stilistik effektlarni qo'llaydi.
  • Laymanning qisqacha mazmuni: Siz hatto Baz Luhrmann ham ma'qullaydigan ranglar va uslublarni olishingiz mumkin. Agar siz rang ko'r bo'lsangiz ham.


AI Assistance bilan foydalanuvchilar uchun qulay interfeys

  • Dengiz o‘ti ilg‘or AI imkoniyatlarini oddiy interfeys bilan birlashtirib, undan hatto texnologiyadan bexabar bo‘lganlar uchun ham foydalanish mumkin.
  • Laymanning qisqacha mazmuni: Bu Ferrari olishga o'xshaydi, lekin o'quvchining ruxsati bilan - hamma uchun silliq haydash.


Yakuniy fikrlar: Tech Elite uchun qurilish


PixelDance va Seaweed shunchaki vositalar emas; ular ByteDance-ning yangi, yanada murakkab o'yin maydonchasiga chiptasi bo'lib, unda stavkalar yuqori va raqobat shiddatli bo'ladi. Aksariyat oddiy ijodkorlarga shablon izlayotgan va qarindoshingizning to‘y slayd-shousi uchun “etarli darajada yaxshi” kontent yaratishdan mamnun bo‘lsa-da, ByteDance A-listlar uchun tayyorlanmoqda.


ByteDance qat'iy ravishda sun'iy intellekt videosining Canvasiga aylanishdan manfaatdor emasligini bildiradi. Ular sun'iy intellekt yordamida boshqariladigan Pixar-ILM gibridiga o'xshash narsani ko'zlamoqda. Bu shuni anglatadiki, ular o'z foydalanuvchilarining sifatini miqdoridan ko'ra birinchi o'ringa qo'yishadi, kino ijodkorlari, animatorlar, marketing agentliklari va to'yingan kontent bozorida ajralib turadigan yuqori darajada sayqallangan, murakkab videolarga muhtoj bo'lgan bizneslarga e'tibor berishadi.


Bu aqlli. Haqiqatan ham aqlli. Ammo xavf-xatarsiz emas.


Agressiv narx strategiyasi: ikki qirrali qilichmi?


Ularning agressiv narxlash strategiyasi, har bir token uchun $ 0,002 (OpenAI $ 0,03 bilan solishtirganda ) bozorni buzish uchun mo'ljallangan. Bu kichik va o'rta korxonalar (KO'B) va hind ijodkorlari uchun sirena qo'ng'irog'i bo'lib, ular endi o'zlari uchun imkoni yo'q deb hisoblagan zamonaviy vositalardan foydalanishlari mumkin.


Ammo har bir tokenning arzonligi xavfli garovdir. ByteDance hozir bu o'yinni o'ynashga qodir, lekin bu narxlarni uzoq muddatda ushlab turish qiyin bo'lishi mumkin , ayniqsa ma'lumotlarni yig'ish va infratuzilma narxi nomutanosib ravishda o'zgarsa. Dastlabki narxlar mijozlarni o'ziga jalb qilishi mumkin bo'lsa-da, sifat yoki innovatsiyalarni yo'qotmasdan buni saqlab qolish arqon bilan yurish bo'lishi mumkin.


Unity va Unreal Engine dan raqobat


ByteDance 3D renderlash, animatsiya va hatto real vaqtda film yaratish sohalarida kashshof bo'lgan, katta, sodiq jamoalar va keng resurslarga ega Unity va Unreal Engine kabi gigantlar hukmronlik qiladigan jang maydoniga qadam qo'ymoqda. Unity virtual ishlab chiqarish va real vaqt rejimida hikoya qilish sohasida muvaffaqiyatlarga erishmoqda, Unreal Enginening so'nggi yangilanishlari esa o'zlarining giperrealistik renderlash imkoniyatlari bilan boshlarini aylantirdi. Endi ikkalasi ham o‘z takliflarini yaxshilash uchun sun’iy intellekt xususiyatlarini birlashtirib, ularni Seaweed-ning 3D renderlash va interaktiv video imkoniyatlariga bevosita raqobatchilarga aylantirmoqda.


Unity va Unreal Engine-ning o'rnatilgan ekotizimlari ham ularga muhim ustunlikni beradi: foydalanuvchi bazasi va hamjamiyatni qo'llab-quvvatlash . ByteDance-ning vazifasi ijodkorlarni PixelDance va Seaweed ushbu platformalar qila olmaydigan narsani taklif qilishiga ishontirishdan iborat bo'ladi - xoh mavjud vositalar bilan yaxshiroq integratsiya, tezroq ish oqimlari yoki yuqori sifatli chiqish. Ammo texnik ustunlik foydalanuvchilarni Unity va Unreal yillar davomida rivojlantirib kelayotganiga ishontirish uchun etarli bo'lishi mumkinmi?


Potentsial tuzoqlar: yuqori ambitsiya, yuqori stavkalar


ByteDance-ning PixelDance va Seaweed-ga bo'lgan yuksak ambitsiyalari ular bilan bir qator xavf-xatarlarni olib keladi. Raqobatchi sanoat titanlariga professional darajadagi asboblar va'dalari bilan barni osmonga ko'tarish - jasoratli harakat, ammo agar bu platformalar bajarilmasa , ular o'zlari jalb qilmoqchi bo'lgan professionallarning g'azabiga duchor bo'lishlari mumkin. Normativ tekshiruvni qo'shing - chunki siz sun'iy intellekt bilan o'ynaganingizda yaxshi davlat auditini kim yoqtirmaydi? - va sizda keskinlik retsepti bor, ayniqsa ma'lumotlar maxfiyligi bilan bog'liq muammolar va ularning avlodi TikTok bilan. Mutaxassislarni maqsad qilib qo'yish aqlli o'yin bo'lsa-da, Piter Til ehtimol so'raydi: bu erda monopoliya qurish uchun joy bormi?


Katta rasm: Yulduzlarni nishonga olish, lekin ular qo'nishga yopishib olishadimi?


PixelDance va Seaweed kengroq ishga tushirishga tayyorlanar ekan, ByteDance dadil bayonot bermoqda: ular shunchaki ijtimoiy media giganti bo'lish bilan kifoyalanmaydilar . Ular raqamli kontent yaratish bo‘yicha yuqori pog‘onani egallashga intilmoqda va ularning katta hajmdagi yuqori sifatli ijodkorlarga e’tibor qaratishlari, ayniqsa, har bir platforma imkon qadar qulay bo‘lishga intilayotgan dunyoda jasoratli harakatdir.


Ular sun'iy intellekt tomonidan yaratilgan video olamini qayta shakllantira oladimi va o'zlarini texnologiyaning Temir taxtiga yaqinlasha oladimi? Yoki bu texnologiya tarixidagi navbatdagi ambitsiyali tajribaga aylanadimi?


Bu oy zarbasi va har qanday texnologiyachi biladiki, ular har doim ham chiroyli tarzda qo'nmaydi. Ammo bir narsa aniq: ular video yaratish manzarasini yanada qiziqarli qilishmoqda.


Shunday qilib, popkorningizni tayyorlang. Bu shou endi boshlanmoqda.


Eslatma: Hozirda ikkala platforma faqat taklifnomalar uchun sinov bosqichida (Vulcano Engine orqali ariza topshirishga urinib ko‘rishingiz mumkin), tez orada kengroq kirish imkoniyati kutilmoqda, ammo aniq sanani Zoom qo‘ng‘irog‘i paytida Wi-Fi signalingiz kabi tushunib bo‘lmaydi).