Moving from theory to a tangible, working system that turns AI mistakes into high-quality training data. में , हमने एआई विकास की गड़बड़ी के बारे में बात की, जो एक आशाजनक 85% प्रोटोटाइप और उत्पादन के लिए तैयार 99% प्रणाली के बीच एक निराशाजनक अंतर है. हमने स्थापित किया कि कुंजी न केवल एक बेहतर मॉडल है, बल्कि एक प्रणाली है जो हर गलती से सीखती है। इस श्रृंखला का पहला भाग आज, हम अपने हाथों को गंदे करने जा रहे हैं और एक सरल, काम करने वाली वेब एप्लिकेशन का निर्माण करेंगे जो एक डेटा फ्लाईवेल के कोर लूप को दर्शाता है। हम इसका उपयोग करेंगे उदाहरण के लिए, हमारे ओपन-सॉर्ड फ्रेमसेट, यह उदाहरण स्वतंत्र है, Docker या Redis जैसे बाहरी सेवाओं की आवश्यकता नहीं है, और यह साबित करता है कि कोर पैटर्न कितना शक्तिशाली हो सकता है। correction_deck_quickstart Foundry फंडिंग The Scenario: A Flawed Invoice AI के बारे में जानें कल्पना कीजिए कि हमने आंकड़ों से संरचित डेटा निकालने के लिए एक एआई का निर्माण किया है। हम इसे एक आंकड़े की छवि के रूप में खिलाते हैं, और हम चाहते हैं कि यह एक साफ जेएसओएन ऑब्जेक्ट वापस करे। अपने पहले पास पर, एआई एक सभ्य काम करता है, लेकिन यह सही नहीं है. यह इस दोषपूर्ण उत्पादन का उत्पादन करता है: { "supplier_name": "Lone Star Provisins Inc.", // <-- TYPO! "invoice_number": "785670", "invoice_date": "2025-08-20", "inventory_items": [ { "item_name": "TAVERN HAM WH", "total_quantity": 15.82, "total_unit": "LB", "total_cost": 87.80 }, { "item_name": "ONIONS YELLOW JBO", "total_quantity": 5, // <-- WRONG QUANTITY! Should be 50. "total_unit": "LB", "total_cost": 35.50 } ] } हमारा लक्ष्य एक प्रणाली का निर्माण करना है जो एक इंसान को इन दो गलतियों को आसानी से ठीक करने की अनुमति देता है और, महत्वपूर्ण रूप से, उन सुधारों को फिर से प्रशिक्षित करने के लिए कैप्चर करता है। हमारे Flywheel के तीन मुख्य घटक इसे बनाने के लिए, हमारा Foundry फ्रेमवर्क तीन सरल लेकिन शक्तिशाली पायथन अवलोकन पर भरोसा करता है: नौकरी: एक ट्रैकिंग सिस्टम में यह एक टिकट के रूप में सोचें. यह एक डेटाबेस मॉडल है जो एआई के लिए काम की एक इकाई का प्रतिनिधित्व करता है. इसमें input_data (फॉक्चर छवि), initial_ai_output (उत्तर में दोषपूर्ण JSON) और एक जगह है जहां एक बार एक इंसान इसे ठीक करने के बाद corrected_output को संग्रहीत करने के लिए। CorrectionRecord: यह सोने का टिकट है. जब एक इंसान अपनी सुधार को सहेजता है, तो हम सिर्फ नौकरी को अपडेट नहीं करते हैं. हम एक अलग, स्व-आधारित CorrectionRecord बनाते हैं. यह रिकॉर्ड फिनिश टूनिंग के लिए उद्देश्य से बनाया गया है. यह मूल इनपुट का एक साफ प्रति संग्रहीत करता है, एआई की बुरी कोशिश, और इंसान की "जमीन की सच्चाई" सुधार है. यह एक सही, पोर्टेबल प्रशिक्षण उदाहरण है. CorrectionHandler: यह व्यवसाय तर्क है. यह एक सरल वर्ग है जो प्रक्रिया को संगठित करता है: यह वेब यूआई से प्रस्तुत फॉर्म डेटा लेता है, इसे सत्यापित करता है, नौकरी को अपडेट करता है, CorrectionRecord बनाता है, और सभी रिकॉर्ड को एक प्रशिक्षण फ़ाइल में निर्यात करता है। इन तीन टुकड़ों को एक साथ काम करने के लिए हमारे flywheel के रीढ़ का गठन. अब, हम उन्हें कार्रवाई में देखते हैं. Let's Build It: गति में त्वरित शुरुआत यदि आप आगे बढ़ रहे हैं, तो क्लोन करें Navigate करने के लिए प्रबंधक, और निर्भरताओं को स्थापित करें। फाउंडरी रिकॉर्ड examples/correction_deck_quickstart चरण 1: Quickstart Script को चलाएं अपने टर्मिनल से, बस चलाएं: python quickstart.py आपको एक संदेश दिखाई देगा कि एक स्थानीय वेब सर्वर ने शुरू किया है . http://localhost:8000 --- Foundry Quickstart Server running at http://localhost:8000 --- --- Open the URL in your browser to use the Correction Deck. --- --- Press Ctrl+C to stop the server and complete the flywheel. --- चरण 2: Correction Deck UI का उपयोग करें अपने ब्राउज़र में उस URL को खोलें. आप एक सरल Correction Deck UI देखेंगे. बाईं ओर स्रोत बिल छवि है. दाईं ओर एक वेब फॉर्म है जो एआई के दोषपूर्ण डेटा के साथ पहले से भर गया है। आपकी जिम्मेदारी यह है कि चक्र में इंसान बनें. इन दो सुधारों को करें: टाइप को ठीक करें: Lone Star Provisins Inc. को Lone Star Provisions Inc. में बदलें। Quantity Fix: ONIONS YELLOW JBO के लिए Quantity को 5 से 50 में बदलें। क्लिक करें Save Correction. चरण 3: Flywheel को पूरा करें अब, अपने टर्मिनल पर वापस जाएं, और सर्वर को दबाकर बंद करें . स्क्रिप्ट स्वचालित रूप से flywheel के अंतिम चरण को सक्रिय करता है: अपने काम को निर्यात. आप इस आउटपुट देखेंगे: Ctrl+C --- Server stopped. --- --- Exporting approved corrections to fine-tuning format... --- --- Data successfully exported to 'corrected_data.jsonl' --- --- QUICKSTART COMPLETE --- आपने इसे किया. आपने डेटा flywheel का एक पूर्ण मोड़ पूरा किया है. भुगतान: सही प्रशिक्षण फ़ाइल खोलते हैं आपको एक नया फ़ाइल मिलेगा: यह आपका काम का भौतिक परिणाम है, जो एक आधुनिक एआई मॉडल को अच्छी तरह से समायोजित करने के लिए कैप्चर और प्रारूपित किया गया है। examples/correction_deck_quickstart corrected_data.jsonl आइए अंदर देखते हैं. इसमें संरचित JSON का एक ही पंक्ति शामिल है: {"contents": [{"role": "user", "parts": [{"fileData": {"mimeType": "image/jpeg", "fileUri": "/static/example_invoice.jpeg"}}, {"text": "Extract the key business data from the provided input."}]}, {"role": "model", "parts": [{"text": "{\"supplier_name\": \"Lone Star Provisions Inc.\", \"invoice_number\": \"785670\", \"invoice_date\": \"2025-08-20\", \"inventory_items\": [{\"item_name\": \"TAVERN HAM WH\", \"total_quantity\": 15.82, \"total_unit\": \"LB\", \"total_cost\": 87.8}, {\"item_name\": \"ONIONS YELLOW JBO\", \"total_quantity\": 50.0, \"total_unit\": \"LB\", \"total_cost\": 35.5}]}"}]}]}``` यह जटिल लग सकता है, लेकिन यह सटीक वार्तालाप प्रारूप है जो गूगल के जेमिनो और ओपनएआई के जीपीटी श्रृंखला जैसे मॉडल फिनिश ट्यूनिंग के लिए उम्मीद करते हैं। "रॉल": "उपयोगकर्ता": यह निर्देश है. इसमें इनपुट छवि (fileUri) और हमने एआई को दिया निर्देश शामिल हैं. "रॉल": "मॉडल": यह सही जवाब है. इसमें आपके सुधारों के साथ JSON श्रृंखला शामिल है। हमने सफलतापूर्वक मानव प्रयास के कुछ सेकंड को एक उच्च गुणवत्ता वाले, मशीन-पढ़ने योग्य प्रशिक्षण उदाहरण में बदल दिया है। अब, 100 सुधारों के लिए ऐसा करने की कल्पना करें. या 1,000. आप अब केवल त्रुटियों को ठीक नहीं कर रहे हैं; आप सक्रिय रूप से और कुशलता से एक डेटासेट का निर्माण कर रहे हैं जो आपके मॉडल के अगले संस्करण में इस पूरे प्रकार की त्रुटियों को खत्म करेगा। अगला क्या है? हमने flywheel के कोर लूप को साबित किया है: Correct -> Capture -> Format for Training. यह एक शक्तिशाली शुरुआत है, लेकिन यह एक ऑफ़लाइन प्रक्रिया है. हमने एआई को अपने बैच को खत्म करने के लिए इंतजार किया, और फिर हमने इसके काम को ठीक किया. लेकिन अगर हम अधिक इंटरैक्टिव हो सकते हैं? इस श्रृंखला में अगले लेख में, हम वास्तव में ऐसा बनाने जा रहे हैं. हम एक प्रतिरोधी, मानव-आधारित पाइपलाइन का निर्माण करेंगे जो जानता है कि जब यह समस्या में है और स्पष्टता के लिए पूछने से डरता नहीं है।