Moving from theory to a tangible, working system that turns AI mistakes into high-quality training data. V tejto , hovorili sme o chaotickom prostredí vývoja AI, ktorý je frustrujúcou medzerou medzi sľubným 85% prototypom a pripraveným na výrobu 99% systémom. Prvá časť tejto série Dnes sa budeme dostať naše ruky špinavé a vybudovať jednoduchú, fungujúcu webovú aplikáciu, ktorá demonštruje jadrovú slučku dátového kolesa.Na konci tohto článku budete mať opravenú chybu AI a vytvorili perfektnú, jemne nastavenú databázu z vašej práce. Budeme používať na príklad z nášho open-source rámca, Tento príklad je samostatný, nevyžaduje externé služby ako Docker alebo Redis a dokazuje, aký silný môže byť základný vzor. correction_deck_quickstart Foundry Foundry Scenár: chybná faktúra AI Predstavte si, že sme vybudovali AI na extrahovanie štruktúrovaných údajov z faktúr. Podávame mu obraz faktúry a chceme, aby vrátil čistý objekt JSON. Na svojom prvom priechode AI robí slušnú prácu, ale nie je dokonalá. { "supplier_name": "Lone Star Provisins Inc.", // <-- TYPO! "invoice_number": "785670", "invoice_date": "2025-08-20", "inventory_items": [ { "item_name": "TAVERN HAM WH", "total_quantity": 15.82, "total_unit": "LB", "total_cost": 87.80 }, { "item_name": "ONIONS YELLOW JBO", "total_quantity": 5, // <-- WRONG QUANTITY! Should be 50. "total_unit": "LB", "total_cost": 35.50 } ] } Naším cieľom je vybudovať systém, ktorý umožní človeku ľahko opraviť tieto dve chyby a čo je najdôležitejšie, zachytiť tieto opravy na preškolenie. Tri základné komponenty nášho Flywheel Na tento účel sa náš framework Foundry spolieha na tri jednoduché, ale silné Python abstrakcie: Je to databázový model, ktorý predstavuje jednu jednotku práce pre AI. To drží input_data (obrázok faktúry), initial_ai_output (chybný JSON vyššie), a miesto na uloženie corrected_output akonáhle ho človek opraviť. CorrectionRecord: Toto je zlatý lístok. Keď človek uloží svoju korekciu, nielenže aktualizujeme prácu. Vytvoríme samostatnú, samostatnú korekciu CorrectionRecord. Tento záznam je určený na jemné nastavenie. Ukladá čistú kópiu pôvodného vstupu, zlého pokusu AI a korekcie ľudskej "zemnej pravdy". Je to dokonalý, prenosný príklad školenia. CorrectionHandler: Toto je obchodná logika. Je to jednoduchá trieda, ktorá organizuje proces: odoberá odoslané údaje formulára z webového používateľského rozhrania, overuje ich, aktualizuje úlohu, vytvára CorrectionRecord a zaoberá sa exportovaním všetkých záznamov do školiaceho súboru. Tieto tri kusy pracujú spoločne, aby vytvorili chrbticu nášho kolesa. Let's Build It: Rýchly štart v akcii Ak budete nasledovať, klonovať Navigujte na Inštalácia a inštalácia závislostí. Foundry Repository examples/correction_deck_quickstart Krok 1: Spustite Quickstart Script Z vášho terminálu jednoducho spustite: python quickstart.py Zobrazí sa hlásenie, že lokálny webový server spustil . http://localhost:8000 --- Foundry Quickstart Server running at http://localhost:8000 --- --- Open the URL in your browser to use the Correction Deck. --- --- Press Ctrl+C to stop the server and complete the flywheel. --- Krok 2: Použite korekčnú dosku UI Otvorte túto adresu URL vo vašom prehliadači. UI korekcie Deck je jednoduché. Na ľavej strane je zdrojový obrázok faktúry. Na pravej strane je webový formulár, ktorý je vopred vyplnený chybnými údajmi AI. Vašou úlohou je byť človekom v kruhu. Urobte tieto dve korekcie: Opraviť typ: Zmeniť Lone Star Provisins Inc. na Lone Star Provisions Inc. Oprava množstva: Zmeňte množstvo pre ONIONS YELLOW JBO z 5 na 50. kliknúť Save Correction. Krok 3: Dokončiť Flywheel Teraz sa vráťte do svojho terminálu a zastavíte server stlačením Skript automaticky spúšťa posledný krok letu: exportovanie vašej práce. uvidíte tento výstup: Ctrl+C --- Server stopped. --- --- Exporting approved corrections to fine-tuning format... --- --- Data successfully exported to 'corrected_data.jsonl' --- --- QUICKSTART COMPLETE --- Práve ste dokončili jeden plný krúžok dátového kolesa. Výplata: Dokonalý tréningový súbor Otvorte si Zobrazí sa nový súbor: Toto je hmatateľný výsledok vašej práce, zachytený a formátovaný dokonale pre jemné nastavenie moderného modelu AI. examples/correction_deck_quickstart corrected_data.jsonl Pozrime sa dovnútra. obsahuje jediný riadok štruktúrovaného JSON: {"contents": [{"role": "user", "parts": [{"fileData": {"mimeType": "image/jpeg", "fileUri": "/static/example_invoice.jpeg"}}, {"text": "Extract the key business data from the provided input."}]}, {"role": "model", "parts": [{"text": "{\"supplier_name\": \"Lone Star Provisions Inc.\", \"invoice_number\": \"785670\", \"invoice_date\": \"2025-08-20\", \"inventory_items\": [{\"item_name\": \"TAVERN HAM WH\", \"total_quantity\": 15.82, \"total_unit\": \"LB\", \"total_cost\": 87.8}, {\"item_name\": \"ONIONS YELLOW JBO\", \"total_quantity\": 50.0, \"total_unit\": \"LB\", \"total_cost\": 35.5}]}"}]}]}``` To sa môže zdať zložité, ale je to presne konverzačný formát, ktorý modely ako Google Gemino a OpenAI GPT série očakávajú pre jemné nastavenie. "role": "user": Toto je výzva. Obsahuje vstupný obrázok (fileUri) a pokyn, ktorý sme dali AI. "role": "model": Toto je perfektná odpoveď. Obsahuje reťazec JSON s aplikovanými opravami. Úspešne sme premenili niekoľko sekúnd ľudského úsilia na vysoko kvalitný, strojovo čitateľný príklad školenia. Teraz si predstavte, že to robíte pre 100 opráv. alebo 1000. Už nie ste len opravou chýb; aktívne a efektívne budujete databázu, ktorá odstráni celú túto triedu chýb v ďalšej verzii vášho modelu. Čo je nasledujúce? Preukázali sme základnú slučku flywheel: Correct -> Capture -> Format for Training. Toto je silný začiatok, ale je to offline proces. Čakali sme, kým AI dokončí svoju dávku, a potom sme opravili svoju prácu. Ale čo ak by sme mohli byť interaktívnejší? Čo ak by mohol plynovod bežať, stretnúť sa s niečím, čo nerozumie, a inteligentne sa zastaviť, aby požiadal človeka o pomoc v reálnom čase? Budeme stavať odolný, Human-in-the-Loop potrubie, ktoré vie, kedy je v probléme a nebojí sa požiadať o objasnenie.