Миний нэр Сэм юм, Би MIT-ийн AI / робототехникийн бодистай, 2021-д миний анхны AI-ийн эх үүсвэр худалдан аваад, миний алдартай хоёр дахь AI-ийн эх үүсвэр Нөхцөл үнэгүй браузер хэрэгсэл дэмжлэгдсэн байна, би жилийн өмнө эхлүүлсэн бөгөөд одоо хүртэл уншсан байна. Хөгжлийн Үйлчлэх OK Хөгжлийн Үйлчлэх OK Ямар ч хэлж байна. Би үүнийг хэрхэн олж авсан Би их сургуулийн төгссөн үед ~2012 би програм хангамж руу олохыг хүссэн боловч технологийн ажил авч чадахгүй, учир нь энэ үед хүн AI-ийг байлгахгүй (Энэ нь 2 hype циклийн өмнө байсан юм) Энэ нь дараагийн харьцуулахад гайхамшигтай байж болох боловч энэ үед хүмүүс гар утасны апп-ийг харуулсан байсан бөгөөд би бүх тусламжтай байсан бол хүмүүс апп-ийг хөгжүүлэх чадна уу, би чадахгүй байна. Би ажил хайж байгаа бол би миний анхны эх үүсвэр, Энэ нь эхний эхлэлд миний анхны эхлэл юм, байгалийн анхны санаа ажилласангүй, би бүх зүйлийг алдаатай байсан ( хэрэглэгчидтэй хэлэх өмнө бий болгох, мөнгө авч, бүтээгдэхүүний зах зээлд тохиромжтой өмнө баг бий болгох), гэхдээ хэд хэдэн амархан жилийн турш би хэрэглэгчидтэй хэлэх, хэлэх талаар сурах. E-learning програм Бид зүйлс хуваалцахын тулд хэмжээгээр багасгахын тулд (да, энэ нь маш сайн биш юм) болон 5 жилийн турш 10 удаа хуваалцсан, эцэст нь амжилттай санаатай өмнө - Бид видео конференц хэрэглээнд AI шинж чанартай SDK (виртуал фолк, фолк шугам элсүүлэх) бий болгосон. Энэ нь супер амжилттай байсан бөгөөд бид хэрэглэгчийн худалдан авах. Зүрхний хавтгай дэх AI шүүлтүүр Одоо би мэдэхийг мэдэхийг хүсэж байна уу: AI шүүлтүүр худалдан авах? Ямар ч? - Та, магадгүй? AI шүүлтүүр худалдан авах? Ямар ч? - Та, магадгүй? Хэрэв та үүнийг хүсэж байгаагүй бол, гэхдээ хэлбэрийн хувьд, би та, найз нөхөд, зарим нь сонирхолтой, алдартай техникийн өгөгдлийг хэлбэрийг хэлбэрийг хэлбэрийг хэлбэрийг хэлбэрийг хэлбэрийг хэлбэрийг хэлбэхийг хүсэж байна. Видеоконференц (ямар ч WebRTC) програмуудыг үүсгэх үед хамгийн том техникийн асуултуудын нэг нь хэрэглэгчдийн CPU-ийг удирдах юм. 20 оролцогчтай видео чанарын хувьд хэрэглэгчдийн төхөөрөмж нь видео бичлэгийг шифрлэдэг бөгөөд бусад 20 видео бичлэгийг харьцуулах болно. Virtual Backgrounds гэх мэт AI шүүлтүүрэд хамгийн их шийдэл нь TensorflowJS эсвэл Google-ийн Mediapipe гэх мэт библиотекарыг ашиглахыг хүссэн бөгөөд энэ нь серверийн ML ажиллуулах хугацаа (Pytorch, Tensorflow гэх мэт) браузер руу дамжуулдаг. Zoom болон Google Meet нь виртуал хэв маягтай бөгөөд бусад webrtc-ийн апп нь тэдгээрийг олж чаддаг боловч нээлттэй эх сурвалж зүйл супер үр дүнтэй бөгөөд тэднийг ашиглах нь MMN-ийг нэмэгдүүлэх болно. Би WebGL-ийн дамжуулан график боловсруулах суралцаж байсан бөгөөд бид мэдэгдсэн байна, WebGL браузер дээр нейрон сүлжээг бичлэхийн тулд юу вэ? Энэ нь TensorflowJS-ийн шиг Runtime-ийг ашиглаж байгаагүй, бид график shaders дээр нэрийн сүлжээг ручной бичлэхийн тулд бидний өөрийн, илүү хурдан Runtime-ийг бий болгосон бөгөөд Netbooks дээр WebGL shaders-ийн хязгаарлалыг харахын тулд нейрон сүлжээг хамгийн хурдан ажиллуулахын тулд сургалт, optimizing. Тиймээс Google-ийн сервер AI-ийн ажиллуулах хугацааг браузер руу хуваалцаж, вэб хөгжүүлэгчид Google-ийн AI-ийн судлаачид нь тавтай морилно уу, бид AI-ийн загварууд нь нарийн вэб сайтын орчинд ажиллахад тохируулахын тулд AI-ийн судалгаа хийж байна. Тиймээс бид үйлчлүүлэгчид (ийг худалдан авах санал) байсан, учир нь бид бидний зүйл нь 10x илүү сайн байсан (ийг Google Meet байсан). Google Харин тэд үүнийг эхлүүлсэнгүй. Өнгөрсөн дараа нь шулуун шилжих Сайтын төсөл Бид худалдан авах дараа бидний 5-ийн баг нь 2000 хүнтэй 5 бүтээгдэхүүний компанийн "AI баг" байсан. 2021-ээс 2024-ээс бид одоогийн AI шүүлтүүрүүд нь худалдан авагчдын бүтээгдэхүүнд нэгтгэх, шинэ хэрэглээг бий болгохын тулд ажиллаж байсан (жишээ нь 2022-ийн ChatGPT хавтгай дараа), би CEO-ээс бүтээгдэхүүний менежер руу хүрсэн. 2023-д WebGPU (WebGL-ийн дараагийн) гарч ирсэн Би WebGPU-д нейрон сүлжээг бичлэхийн тулд шийдсэн (пандемийг эвдэж байсан боловч би энэ нь хэзээ ч ашигтай боловч маш алдартай техникийн багц байсан). AI Upscaling нь нейрон сүлжээг бичлэхийн тулд хамгийн хялбар AI-ийн ажил юм (Энэ нь зүгээр л ухаалаг шилжих шүүлтүүр юм). 2023-ийн Аялал жуулчлалын үед би сүүлд хакердах үед сүүлд хакердсан Браузер дээр видео үзэх. Татаж авах SDK import WebSR from '@websr/websr'; const gpu = await WebSR.initWebGPU(); if(!gpu) return console.log("Browser/device doesn't support WebGPU"); const websr = new WebSR({ source: // An HTML Video Element network_name: "anime4k/cnn-2x-s", weights: await (await fetch('./cnn-2x-s.json')).json() //found in weights/anime4k folder gpu, canvas: //A canvas, with 2x the width and height of your input video }); await websr.start(); // Play the video SDK-ийн демонстрац гэж, энэ нь хэрхэн ашиглахын тулд бодит ажлын жишээг харуулахын тулд, би браузер дээр видеог шилжих нь хурдан хэрэгсэл бий. Би "Free AI Video Upscaler" гэж нэрлэдэг, бүртгэгдсэн , Reddit дээр бичсэн бөгөөд энэ тухай уншсан. үнэгүй.upscaler.video Өнгөрсөн мэдээ » Real Project Олон бүтээгдэхүүний 2,000-ийн эх үүсвэрэд AI-ийн удирдагч, 2023-ийн Gen AI буудлын эхлэхэд би өөр өөр бүтээгдэхүүний багтуудын шинж чанарыг санал болгож байна. Бид Streamyard-ийг зориулсан AI-ийн редактийн боломжуудыг приоритеттай болгохын тулд эхэлсэн. Зохиогчийн ажиллагаанд үзсэн дараа би "AI-ийн редактийн эх үүсвэрүүд" нь видеог транскрипт, ChatGPT-ийг редактийг санал болгож байна. "Real AI" -д жилийн турш ажилласан дараа, би танд илүү сайн, өөрчилсөн AI-ийг бий болгож чадна, аудио, визуал, транскрипт мэдээллийг мэдэж чадна, видеог 10x сайн, хурдан, үнэ төлбөргүй боловсруулах боломжтой. Би PoC үүсгэсэн бөгөөд энэ нь бүрэн ажиллаж байсан, гэхдээ бид энэ нь бүтээгдэхүүнд үүсгэх боломжтой өмнө компани нь PE компанид амархан борлуулагдсан бөгөөд бүхэн олдсон эсвэл хуваалцсан. Тиймээс би миний хоёр дахь эх үүсвэр эхэлсэн ( ) видео редактийг суурилсан загвар бий болгох санаатай, урт хэлбэртэй агуулгыг хурдан, хямд, найдвартай, амар ч чанарын видео редактор редактийг редактийг чадна, Podcasts-ийг эхлэхэд сонгоно (баруун Podcasters Streamyard-ийг ашигладаг). Katana Миний анхны эх үүсвэрний алдааны талаар суралцаж, би өөрсдийн эхлэхыг сонгож, дэлгэрэнгүй дэлхий даяар ажиллуулахын өмнө юу хийж чадна, энэ нь би супер үнэ цэнэтэй гэж хэлсэн боловч багтай илүү хялбар байх болно. Би 2025 оны зургадугаар сард эхлүүлсэн бөгөөд энэ нь гайхамшигтай биш юм, R & D, барилгын шинж чанарыг, нунтаглах, хэрэглэгчидтэй хэлэх, бүрэн ажиллаж байгаа AI видео редактор цуврал бий болгох, өөрчилсөн, автоматаар боловсруулсан AI загваруудтай, гэхдээ хэд хэдэн эхлүүлсэн, өөрчилж дамжуулан энэ нь хэрэглэгчид, ~10 хэрэглэгчид, маркетингийн ямар ч бүх хэрэглэгчид & хэрэглэгчид нь органик хайлштай авсан юм. Үнэндээ найдвартай үйл явдлыг харин Би АИ-ийн редактийн хэрэгсэл дээр алдартай байсан боловч би үүнийг мэдэгдэж чадахгүй байсан бөгөөд миний утасгүй утасгүй шилжүүлэгч демо нь 15% -ийг сар бүр бүрэн органик хэлбэрээр нэмэгдэж байна. Ямар ч тоо шалгахгүй, зөвхөн хүмүүс миний апп ашигладаг гэж мэдэж байгаа нь хэрэглэгчид бутлуур талаар Reddit-д менейлчладаг бөгөөд хатуу хэрэглэгчид Github-ийг бүртгүүлэх, Github-ийн репо дээр асуултууд нээж байсан. Жишээ нь, би эх сурвалж, гэр бүлийн байна, би үүнийг үүсгэх, AI судалгаа хийх, AI Video Editing програм хангамж нь соло байгуулагч гэж борлуулах, борлуулахыг туршиж байна. Би үнэгүй AI-ийг үүсгэсэн видео, торент киног нэмэгдүүлэх боломжтой зарим хатуу хэрэглэгчдэд зориулагдсан хэрэгсэл нь видео боловсруулах асуудлуудыг борлуулах нь тавтай морилно уугүй. Маяар 2025-д апп-ийн ажиллуулах талаар долоо хоногт 15 бичлэг авах дараа (хром шинэчлэл нь видео боловсруулах хоолой буцаж байгаа үед) би урт урт урт урт буцаж, асуултыг тохируулахын тулд сонгосон байсан. the traffic had grown 10x, by itself, to 30k Monthly Users, despite the bugs. Энэ нь хязгаарлагдмал үнэгүй хэрэгсэл нь 100x морилно уу морилно уу морилно уу морилно уу морилно уу морилно уу "Энэ нь ямар ч төлбөргүй байх болно" Миний найзууд нь сервер дээр ажиллуулсан том AI загвартай төлбөргүй хувилбар бий болгохыг санал болгож байна, би энэ нь дуртай санаа гэж бодож байна, учир нь би ч байтугай pay.upscaler.video-д ирдэггүй байсан боловч би бас мэдэгдэж байна, энэ нь хамгийн бага үнэ цэнэтэй юм, Тиймээс би 2 цагийн дотор галт тэрэгний хувилбар кодировал, үнэ цэнэгийн загвар ($ 5 / видео цаг) миний ***-ээс авч, дараа нь "$ 1 нь $ 20 кредит" гэж хэлсэн санал болгож байна. Өнгөрсөн сард 103 хүн 1 доллар зарласан, энэ нь би мэдэгдсэнээс дээш 4x байсан, Тиймээс би энэ зүйлийг хэзээ ч мэдэгдэж байна. Би төлбөргүй хувилбар бий болгосон Ямар ч учир нь би "Энэ үйлчилгээ 10 сарын 1-ээс өмнө эхлэх болно эсвэл та орд авах болно" хуудсууд дээр байрлуулсан бөгөөд би үүнийг үүсгэхийн тулд ямар ч даралттай байсан. Та найдвартай арга хэрэгсэл нь зүгээр л AI Resesearch-ийн (RealESRGAN гэх мэт) боловсруулсан нээлттэй эх сурвалж загвар нь хавхлага юм. Энгийн хөгжүүлэгч нь нээлттэй эх сурвалж загвар үзэх, GPU тоног төхөөрөмж дээр ажиллуулах үнэ цэнэтэй, боловсруулах үнэ цэнэээс үнэ цэнэтэй бүтэц олж болно. Би $ 5 / цаг нь бүрэн алдаатай сонгосон (Энэ нь зөв мэдэгдсэн), би өөрчилсөн R & D-ийг сонгосон үнэ төлбөрт тохиромжтой AI загварууд бий болгосон бөгөөд $ 1 хадгаламжийн хувьд бэлэн байх ёстой. Энд үнэхээр AI туршлага хэрэгтэй байсан - нээлттэй эх сурвалж зүйлс, шинжлэх ухааны судалгааны ямар ч зүйлс нь үнэ цэнэтэй ажил хийхэд хялбар байдаггүй, гэхдээ ялангуяа хэрэглээний тохиолдолд өөрчилсөн зүйлсийг бий болгохын тулд газар нь хялбар баазтай байсан: Худалдах хэрэглэгчид AI-ийг үүсгэсэн видеог ашигладаг Аматор Torrenting Long-Form кино Видео редакторууд нь 1080p видеог 4K-д үзэхыг хүсэж байна Геймерүүд 4K-д дэлгэц бичлэг үзүүлэхыг хүсч байна Энэ нь R & D-ийн 6 долоо хоногийн тухай шаардлагатай байсан юм (Энэ бүх "актив цаг" гэж бодож байсангүй, би сургалтын үйл явцыг тохируулах, үр дүнд үзэхын тулд 2 хоногийн дараа ирж байна). 100 гаруй сургалтын үйл явцыг, 5k + сервер сургалтын зардалтай, энэ нь зарим үйл явцад хэрэглэнэ, гэхдээ оны зургадугаар сарын долоо хоногт загварууд дууссан байна. Дараа нь би Vibe-ийг нэг долоо хоногт (frontend + backend) бусад апп-ийг шифрлэгдсэн, 30 Есдүгээр сард эхлүүлсэн бөгөөд 20 кредиттай и-мэйлүүд эхний хандалтын бүртгүүлэгчдэд долоо хоногийн өмнө төлбөр төлдөг байх ёстой. Үнэгүй хувилбар дээр унтраах R & D sprint-ээс оюутнуудын ашиглан, би үнэгүй апп нь маш сайн AI загварыг шинэ багц боловсруулсан бөгөөд LLM-ийн туслах нь UI-ийг сайжруулах, энэ нь мобиль ач холбогдолтой болгох, <title> болон <description> гэх мэт үндсэн металл өгөгдлийг сайжруулдаг. Энэ нь үнэгүй хувилбар дахь хэрэглээ нь 1 сарын дотор хоёр удаа нэмэгдсэн бөгөөд November-д өдөрт 2.3k хэрэглэгчдэд хүрч байна. Би энэ нь ямар ч газруулсангүй, би энэ хэрэгсэл ашиглахыг хүсэж байгаагүй, гэхдээ зүгээр л үндсэн тохируулга (багчийг тохируулах, мета өгөгдлийг сайжруулах) болон би үндсэн бүтээгдэхүүний Katana-д зүгээр л сонсож чадах өсөлтийн үзсэн. Үнэлгээгүй үнэ төлбөр Үнэгүй хувилбар дахь гол хуудас руу төлбөргүй хувилбар руу холбоос дараа би өдөр бүр төлбөргүй хувилбар руу оюутнуудыг оюутнуудыг олж авахын тулд 50%, 8% -ийг хувиргахын тулд оюутнуудыг олж авсан. Month Revenue September $0 October $1400 November $2800 Арваннэгдүгээр Үнэгүй Аравдугаар сар 400 доллар Арваннэгдүгээр 2800 Үнэгүй Сайн байна, энэ нь маш их биш юм, гэхдээ (1) Би хялбар хязгаарлагдмал зардалтай байдаг, болон (2) энэ нь маркетингийн ямар ч байдаг. Би хэн нэгнийг миний програм хангамжийг ашиглахыг хүсэж байгаагүй, би зүгээр л бүтээгдэхүүнийг эхлүүлсэн, хүмүүст харуулсан, зайлсхийж, ашиглаж байна. Би Katana-ийн байгуулагч борлуулалтын загварууд руу хүрч, хүйтэн и-мэйл илгээх, түлхүүргүй зүйлсийг хийхын тулд бүрэн тоглоом байсан, гэхдээ ямар ч хэлбэрээр би суралцаж буй нээлттэй эх сурвалж SDK-ийн демо хуудсууд нь бүтээгдэхүүний зах зээлд тохиромжтой байдаг. Би Katana-ийн хувьд зүгээр л сонсож чадахгүй, би анхны эхлэн биднийг олж авсан AI Filters SDK-ийг эхлүүлсэн. Би ямар ч маркетинггүйгээр үнэ цэнэтэй байна, энэ нь зүгээр л миний зүрх, эх үүсвэр, аж ахуйн нэгжийн талаарх миний бүх мэдрэмжийг хуваалцах болно. Би одоо юу хийх вэ? Энэ шилжүүлэх хэрэгсэл нь ямар ч нэг том компанид байх болно, энэ нь би хийхыг хүссэн биш юм, гэхдээ энэ нь органик өсөлтийн бөгөөд энэ нь орчуулах нь маш хялбар байж болох юм. Техникийн байгуулагч гэж, би амбициоз, техникийн хувьд хязгаарлагдмал төслүүд дээр ажиллахад хүсч байна, видео шилжих хэрэгсэл нь энэ нь биш юм, Гэхдээ би хурдан чадварыг мэдэгдэх, приоритеттай болгохын тулд маш их бүтээгдэхүүний мэдрэмж байна. Би бас хязгаарлагдмал техникийн юм. Бидгээр тохиолдолд, би үүнийг мэдэж байна: Inputs ≠ Outputs Зарим төслүүд боулдер дээр орох гэж мэддэг, зарим нь зүгээр л доош орох Үнэгүй + Open Source төсөл нь бүрэн зардал үүсгэдэг Би энэ нь илүү уян хатан зүйл дээр ажиллаж болно, энэ нь ямар ч хариугүй гэж бодож байна, гэхдээ энэ туршлага нь би Katana-ийг хийхыг хүсэж байгаа зүйлийг шинэчлэгддэг. Би хайж буй бусад маш техникийн бодит / нээлттэй эх үүсвэр төсөлтай (транскрипцийн загварын нарийвчлал, хурд, Open Source AI Filters SDK нь WebGPU-ийг сайжруулахын тулд техникийг сайжруулахын тулд), би аль хэдий ч тэдний санааг хязгаарлагдмал, эсвэл ач холбогдолгүй гэж нэрлэдэг боловч магадгүй энэ нь алдааны бодит төсөл юм. уншихын тулд хялбар! Энд upscaling хэрэгсэл нь холболт байна: https://free.upscaler.video Энд эх үүсвэр код: https://github.com/sb2702/free-ai-video-upscaler Албан ёсны SDK: https://github.com/sb2702/websr/ Тэгээд би та авторуудын био дээр миний нийгмийн олох болно. Сайн унших нь маш их баярлалаа!