Moje ime je Sam, imam pozadinu u AI / robotici iz MIT-a, prodao sam svoj prvi AI start-up 2021. godine, a moj hrabri i ambiciozni drugi AI start-up je , financira besplatan alat za preglednik koji sam pokrenuo prije nekoliko godina i zaboravio do sada. Razbiti ga Raditi OK Razbiti ga Raditi OK Dozvoli mi da objasnim. Kako sam ušao u ovo Kada sam završio osnovnu školu ~2012 stvarno sam želio otići u softver, ali nisam mogao dobiti posao u tehnologiji jer nitko nije brinuo o AI-u u to vrijeme (to je bilo prije 2 hype ciklusa) što se čini smiješnim u pozadini, ali u to vrijeme ljudi su bili opsjednuti mobilnim aplikacijama, a svi intervjui koje sam imao, ljudi su pitali mogu li razviti aplikacije, a ja nisam mogao. Umjesto da tražim posao, pokrenuo sam svoj prvi startup, a To je bio moj prvi prebacivanje u startupe, i, naravno, prva ideja nije uspjela, i učinio sam sve pogrešno (izgraditi prije razgovora s korisnicima, prikupiti novac i izgraditi tim prije nego što se tržište proizvoda uklapa), ali tijekom nekoliko bolnih godina naučio sam pitch i razgovarati s kupcima. e-learning aplikacija Smanjili smo veličinu kako bismo stvari održali vitkim (da, to nije bilo sjajno) i okrenuli 10 puta tijekom 5 godina, prije nego što smo konačno sletjeli na uspješnu ideju - izgradili smo SDK s AI funkcijama (virtualne pozadine, uklanjanje buke pozadine) za video konferencijske aplikacije tijekom pandemije. Kupio ga je klijent. Dolje do zecne rupe s AI filtrima Sada znam što misliš: Biti kupljen za AI filtere? stvarno? - Vi, možda (možda?) Biti kupljen za AI filtere? stvarno? - Vi, možda (možda?) Možda to ne mislite, ali zbog pripovijedanja, pretpostavljam da vi, dragi čitatelj, valjate oči 🙄, kao izgovor za objašnjenje nekih pomalo zanimljivih i arkanih tehničkih detalja. Prilikom izgradnje aplikacija za video konferencije (osobito WebRTC), jedan od najvećih tehničkih izazova bio je upravljanje korisničkim CPU-om, jer za video poziv s 20 sudionika, uređaj korisnika kodira video tok i paralelno dekodira 20 drugih video tokova, a kada se korisnici pridružuju netbookovima za 200 dolara koje su kupili prije 10 godina, aplikacija za video pozive može otopiti njihov računalo, što nije dobro za zadržavanje. Većina rješenja za AI filtere kao što su Virtual Backgrounds zahtijevala je korištenje knjižnica kao što su TensorflowJS ili Googleov Mediapipe, koji su u osnovi prenijeli vrijeme rada servera ML (kao što je Pytorch, Tensorflow) u preglednik, ali to je dovelo do tona neučinkovitosti (posebno CPU-a na GPU komunikaciju) što je dovelo do super visoke upotrebe CPU-a. Budući da su Zoom i Google Meet imali virtualne pozadine, očekuje se da će ih imati i svaka druga webrtc aplikacija, ali stvari otvorenog koda su super neučinkovite, a njihova upotreba dovest će do pike u MMN-u (mjesečno rastopljenim netbookovima). Za jednu od naših neuspjelih ideja za pokretanje, naučio sam grafičku obradu putem WebGL-a, i shvatili smo, zašto ne napisati neuralne mreže u WebGL pregledniku? To ne koristi vrijeme rada poput TensorflowJS-a, u osnovi smo izgradili vlastito, mnogo brže vrijeme rada ručnim pisanjem neuralnih mreža u grafičkim shaderima, te obuku i optimizaciju neuralnih mreža da rade što je brže moguće s obzirom na ograničenja WebGL shadera na netbookovima. Dakle, dok je Google bio zauzet prijenosom vremena rada AI servera u preglednik, čime se web developeri prilagođavaju onome s čime su Google AI istraživači bili ugodni, proveli smo istraživanje AI-a kako bismo prilagodili modele AI-a kako bi radili u nativnom web okruženju, a rezultati su govorili sami za sebe. Dakle, imali smo klijente (i ponude za stjecanje) jer smo dokazali da je naša stvar 10 puta bolja od stvari otvorenog koda (i što je Google Meet imao). Međutim, oni ga nikada nisu otvorili. Kasnije je tiho kopirao pristup Stranački projekt Od 2021. do 2024. bili smo zauzeti integracijom naših postojećih AI filtera u proizvode kupaca i izgradnjom novih (osobito nakon vala ChatGPT 2022.), a ja sam otišao od izvršnog direktora do menadžera proizvoda. Godine 2023. izašao je WebGPU (nasljednik WebGL-a) Odlučio sam vježbati pisanje Neuralnih mreža u WebGPU-u (pandemija je prošla, ali sam mislio da je to još uvijek korisna, ali vrlo niška vještina). AI Upscaling upravo se dogodilo da je najjednostavniji mogući AI zadatak za pisanje Neuralne mreže (to je samo pametan filter za oštrenje). Upscale videozapise u pregledniku. Tipični SDK import WebSR from '@websr/websr'; const gpu = await WebSR.initWebGPU(); if(!gpu) return console.log("Browser/device doesn't support WebGPU"); const websr = new WebSR({ source: // An HTML Video Element network_name: "anime4k/cnn-2x-s", weights: await (await fetch('./cnn-2x-s.json')).json() //found in weights/anime4k folder gpu, canvas: //A canvas, with 2x the width and height of your input video }); await websr.start(); // Play the video Doslovno kao demo za SDK, da pokažem pravi radni primjer kako ga koristiti, izgradio sam brz alat za korisnike kako bi povećao videozapise u pregledniku. Napisao sam ga na Redditu i zaboravio. slobodno.upscaler.video Sljedeći članak“Pravi projekt” Kao šef umjetne inteligencije za start-up od 2000 ljudi s višestrukim proizvodima, kao što je 2023 Gen AI boom započeo, bio sam poplavljen zahtjevima za značajkama od različitih timova proizvoda. Nakon što smo pogledali što su konkurenti radili, bio sam zbunjen kada sam vidio val "AI Editing startupa" koji su se spustili na transkripciju videa i potaknuti ChatGPT za prijedloge za uređivanje. Nakon što sam proveo godine u "Real AI", pomislio sam da možete izgraditi mnogo bolju, prilagođenu AI koja bi mogla razumjeti, audio, vizualne i transkripcijske informacije, koja bi mogla obrađivati i uređivati video 10 puta bolje, brže i jeftinije nego što je svatko drugi radio. Izgradio sam PoC i to je u potpunosti funkcioniralo, ali prije nego što smo ga zapravo mogli izgraditi u proizvod, tvrtka je iznenada prodana PE tvrtki, a svi su ili napustili ili otpustili. Stoga sam pokrenuo svoj drugi startup ( ) s idejom izgradnje osnovnog modela za uređivanje videa, koji bi mogao brzo, jeftino i pouzdano uređivati sadržaj dugog oblika, kao i umjereno kvalificirani video urednik, i odlučio početi s podcastovima (mnogi podcasteri koriste Streamyard). Katana Učeći od pogrešaka mog prvog pokretanja, odlučio sam početi sam, i shvatiti što će raditi prije nego što pokušam proširiti, što znači da sam super troškovno učinkovit, ali se krećem sporije nego što bih sigurno mogao imati s timom. Pokrenuo sam ga u srpnju 2025. godine, a to ne ide strašno, potrebno je mjesecima istraživanja i razvoja i izgradnje značajki, debugging i razgovor s korisnicima, kako bi se izgradila punopravna AI video editing suite, pohranjena na dućan prilagođenih, samostalno osposobljenih AI modela, ali kroz nekoliko lansiranja i iteracija Dobio je nekoliko desetaka korisnika koji ga koriste, kao i oko ~10 klijenata, sve bez marketinga (svi korisnici i klijenti do sada su došli iz organskog pretraživanja). Uspjeh unatoč najgorim naporima Dok sam bio rob moj AI uređivanje alat, nisam shvatio da je moj bacanje upscaler demo je bio tiho raste na 15% Mjesec preko Mjeseca u potpunosti organski. Nikada nisam provjerio brojeve, međutim, jedini način na koji sam znao da ljudi koriste moju aplikaciju bio je zato što su mi korisnici poručili na redditu o pogreškama, a redoviti korisnici su se prijavili za github i otvorili probleme na github repo. Kao, imam start-up, obitelj i već sam ga gurnuo pokušavajući izgraditi, raditi AI istraživanje za, debug i tržište AI Video Editing aplikacije kao solo osnivač. Tek nakon što sam u svibnju 2025. dobio 15 poruka u nizu tjedana o aplikaciji koja više ne radi (kada je ažuriranje Chromea prekinulo procesiranje videa) odlučio sam provesti vikend debugiranja i popravljanja problema, kada sam se onda prvi put u godinu dana prijavio u Google Analytics. the traffic had grown 10x, by itself, to 30k Monthly Users, despite the bugs. Budući da je ovaj slučajni besplatan alat imao 100x promet za glavni proizvod mog stvarnog starta, odlučio sam ga ozbiljno uzeti, prije svega popravljanjem bugova "Nitko ne bi platio za to" Moj prijatelj je predložio izgradnju plaćene verzije s većim modelima AI-a koji se pokreću na poslužitelju, a ja sam mislio da je to glupa ideja jer sam bio prilično siguran da nitko neće ići na paid.upscaler.video, ali također sam shvatio, barem je vrijedno pokušati odredišnu stranicu, tako da sam kodirao odredišnu stranicu za 2 sata, izvukao model cijena ($ 5 / sat videa) iz mog ***, a zatim stavio ponudu koja kaže "$ 1 za $ 20 u kreditima", i stavio sam vezu na ovo na početnoj stranici besplatnog alata za povećanje. U jednom mjesecu 103 osobe su mi platile 1 dolar, što je oko 4 puta više nego što sam očekivao, pa sam sumnjičavo odlučio shvatiti ovu stvar ozbiljno. Izgradio sam plaćenu verziju iz obveze Samo zato što sam stavio na stranicu "Ova usluga će se pokrenuti prije 1. listopada ili dobijete svoj depozit natrag" da sam imao pritisak da ga stvarno krenem graditi. Morate razumjeti da su većina alata za povećanje veličine samo obloge za modele otvorenog koda koje je razvio AI Resesearch (kao što je RealESRGAN). Odabrao sam 5 dolara / sat potpuno proizvoljno (to se činilo ispravnim), a ja sam napravio prilagođeni R & D kako bih došao do modela AI koji odgovaraju cijenama koje sam odabrao i bio je dužan poštovati zbog depozita od 1 dolara. Evo gdje je bilo potrebno stvarno iskustvo AI-a - nijedno od otvorenih izvora ili akademskih istraživanja nigdje nije bilo dovoljno uspješno da bi ta točka cijena radila, ali imao sam dovoljno pozadine s područjem da izgradim nešto prilagođeno specifičnim slučajevima korištenja i osobama: Trgovci koji koriste AI generirane videozapise Amateri torrenting filmova dugog oblika Video urednici koji žele povećati 1080p snimke na 4K Igrači pokušavaju uvećati snimke zaslona na 4K Trebalo je oko 6 tjedana istraživanja i razvoja (mislio sam da nije sve to "aktivno vrijeme", postavio sam trening i vratio se 2 dana kasnije da vidim rezultate). Zatim sam samo kodirao ostatak aplikacije (frontend + backend) tijekom vikenda, pokrenut 30. rujna, i poslao e-pošte s 20 dolara kredita pretplatnicima ranog pristupa posljednjeg mogućeg dana prije nego što sam bio obvezan pružiti povrat novca. Povratak na besplatnu verziju Korištenjem onoga što sam naučio iz R & D sprinta, obučio sam cijeli novi skup puno boljih modela AI za besplatnu aplikaciju, a također sam dobio pomoć od LLM-ova kako bih poboljšao UI, učinio ga mobilnim, poboljšao osnovne metapodatke kao što su <title> i <description>, zajedno s odjeljkom FAQ. Te vrlo male promjene udvostručile su korištenje besplatne verzije u jednom mjesecu, dostižući oko 2.3k korisnika dnevno do studenog. Nisam to nigdje prodavala, nisam pokušavala nikoga natjerati da koristi ovaj alat, a ipak sam samo popravila osnove (ispravljanje bugova, poboljšanje meta podataka) i vidjela sam rast o kojem sam mogla samo sanjati za moj glavni proizvod Katana. Neprimjerena profitabilnost Nakon što sam stavio link na plaćenu verziju natrag na glavnu stranicu besplatne verzije, odjednom sam imao stotine ljudi koji dolaze na plaćenu verziju svaki dan, s oko 50% pretplate i 8% konverzije. Month Revenue September $0 October $1400 November $2800 rujna 0 dolara listopad 1400 dolara studenog 2800 milijuna U redu, to nije toliko, ali (1) imam dovoljno niske troškove da sam samo oko profitabilan, i (2) to je bilo bez ikakvog marketinga. nisam pokušavao dobiti bilo koga da koristi moj softver, samo sam pokrenuo proizvod, ljudi su se pojavili, platili za to i koristili ga. Bio sam u potpunosti u igri da uđem u način prodaje osnivača za Katanu, šaljem hladne e-pošte i radim stvari koje se ne razmjenjuju, a ipak je na neki način demo stranica za napušteni SDK otvorenog koda koji sam izgradio kao projekt za učenje dosegla tržište proizvoda na način o kojem sam mogao samo sanjati za Katanu, a što nisam vidio otkako je moj prvi start-up pokrenuo AI Filters SDK koji nas je stekao. Ja sam profitabilan bez ikakvog marketinga, a to samo slomi moj mozak i sve koncepte koje sam imao o startupima i poduzetništvu. Što radim sada? Ovaj rastući alat nikada neće biti velika tvrtka, to nije ono što sam se odlučio učiniti, ali poput, organski rast i prihod od njega čini se previše teško zanemariti. Kao tehnički osnivač, želim raditi na ambicioznim i tehnički teškim projektima, a alat za povećanje razmjera videa nije to, ali imam dovoljno smisla za proizvod kako bih prepoznao i prioritetirao brze pobjede. U oba slučaja, naučio sam to: Ulazi ≠ Izlazi Neki projekti osjećaju se kao da se valja na brdo, a neki jednostavno valjaju dolje. Free + Open Source projekti mogu u potpunosti generirati prihode Idem raditi na ovoj stvari još malo, čini se neodgovorno ne, ali ovo iskustvo me je ponovno procijenilo što želim učiniti s Katanom. Imam neke druge visoko tehničke / projekte otvorenog koda koje sam želio istražiti (tehnika za znatno poboljšanje točnosti i brzine transkripcijskih modela, SDK otvorenog koda za AI filtere s WebGPU-om), inače bih te ideje nazvao distraccijama ili neodgovornim, ali možda je to slučajni strani projekt koji završava kao stvar koja radi. Hvala na čitanju! Ovdje je link na alat za upscaling: https://free.upscaler.video Evo izvornog koda: https://github.com/sb2702/free-ai-video-upscaler Otvoreni izvorni SDK: https://github.com/sb2702/websr/ I mislim da možete pronaći moje socijalne u autorskom biu. Hvala puno na čitanju!