Χτίζουμε λάθος συστήματα AI. Ουσιαστικά, θεμελιωδώς, δομικά και καταστροφικά λάθος. Το μοτίβο είναι πάντα το ίδιο. Μια ομάδα ανακαλύπτει τη μαγεία ενός μεγάλου μοντέλου γλώσσας. Το τυλίγουν σε ένα σενάριο Python. Του δίνουν πρόσβαση στη βάση δεδομένων, την πύλη API και τα αρχεία καταγραφής υποστήριξης πελατών. Βάζουν τρία gigabytes τεκμηρίωσης στο παράθυρο πλαισίου, επειδή «1 εκατομμύριο tokens» ακούγονται σαν άπειρη αποθήκευση. Τον αποκαλούν «πράκτορα». Ένας μονολιθικός, παντογνώστης, αδιαφοροποίητος τύπος λογικής που προσπαθεί να είναι ταυτόχρονα ο Διευθύνων Σύμβουλος, ο Υπεύθυνος και ο διαχειριστής της βάσης δεδομένων. Και αυτό αποτυγχάνει. Είναι ψευδαισθήσεις. γίνεται μπερδεμένος. Κοστίζει μια περιουσία στη χρήση token. Η καθυστέρηση αναβοσβήνει μέχρι την εμπειρία του χρήστη να αισθάνεται σαν να περιμένει μια σύνδεση κλήσης το 1999. Όταν σπάει (και πάντα σπάει) οι μηχανικοί δεν μπορούν να το ξεγελάσουν επειδή η λογική δεν είναι στον κώδικα. Έχω περάσει το τελευταίο έτος σπάζοντας αυτά τα συστήματα.Η λύση δεν είναι καλύτερη.Δεν είναι ένα μεγαλύτερο μοντέλο.Η λύση είναι η αρχιτεκτονική. Πλήρης τεχνική ανάλυση με κώδικα και δείκτες αναφοράς Πλήρης τεχνική ανάλυση με κώδικα και δείκτες αναφοράς Γιατί αντιμετωπίζουμε 1 εκατομμύριο tokens σαν άπειρη RAM; Η τρέχουσα ορθοδοξία στην ανάπτυξη της τεχνητής νοημοσύνης προσελκύεται από τον «Μύθο περί παραθύρου πλαισίου». Έχουμε πουληθεί ένα ψέμα. Το ψέμα είναι ότι αν δώσετε ένα μοντέλο αρκετό πλαίσιο, μπορεί να λύσει οποιοδήποτε πρόβλημα. Οι προμηθευτές πιέζουν το "αόριστο πλαίσιο" ως το απόλυτο χαρακτηριστικό. 128k. 1 εκατομμύριο. 2 εκατομμύρια μάρκες. Η σημασία είναι δελεαστική. Μην ανησυχείτε για την αρχιτεκτονική. Μην ανησυχείτε για την επεξεργασία δεδομένων. Απλά πετάξτε τα όλα μέσα. Το μοντέλο θα το καταλάβει. Αυτό οδήγησε στην άνοδο του παραδείγματος του θεού πράκτορα. Σε αυτή την κοσμοθεωρία, ένας «Πράκτορας» είναι μια μοναδική οντότητα. Διατηρεί ολόκληρη την κατάσταση της εφαρμογής. Έχει πρόσβαση σε κάθε εργαλείο στη βιβλιοθήκη. Όταν ένας χρήστης κάνει μια ερώτηση, ο Θεός-Πράκτορας λαμβάνει το ερώτημα, εξετάζει το τεράστιο πλαίσιο (το οποίο περιέχει ολόκληρη την ιστορία του σύμπαντος) και προσπαθεί να σκεφτεί το δρόμο του προς μια απάντηση. Μοιάζει με το όνειρο της επιστημονικής φαντασίας ενός μοναδικού, συνειδητού AI. Αλλά στην παραγωγή, αυτό είναι ένας εφιάλτης. Ζητάμε από έναν νεαρό προγραμματιστή να απομνημονεύσει ολόκληρη τη βάση κώδικα, το εγχειρίδιο της εταιρείας και τα νομικά αρχεία και στη συνέχεια να τους ζητήσει να διορθώσουν ένα σφάλμα CSS σε 30 δευτερόλεπτα. Δεν θα διορθώσουν το σφάλμα.Θα έχουν μια επίθεση πανικού. Γιατί ο πράκτορας μου κοστίζει 50 δολάρια για να πει "Δεν ξέρω"; Οι ρωγμές στην αρχιτεκτονική του God Agent είναι ορατές σε όποιον ωθήσει τον κώδικα στην παραγωγή. Όσο περισσότερες πληροφορίες παρέχετε, τόσο λιγότερη προσοχή δίνει το μοντέλο στα κρίσιμα κομμάτια. Αυτό δεν είναι απλώς ένα συναίσθημα. Είναι ένα αρχιτεκτονικό ελάττωμα. Η έρευνα δείχνει ότι τα μοντέλα αγωνίζονται να ανακτήσουν πληροφορίες από τη μέση των μακρών πλαισίων. Με την αποτυχία της επιτροπής, βλάπτουμε ενεργά την απόδοση. Δημιουργούμε συστήματα όπου ο «φωνός» της άσχετης τεκμηρίωσης υπερβαίνει το «σήμα» της συγκεκριμένης πρόθεσης του χρήστη. 1. Context Pollution (The Needle in the Haystack) Κάθε token κοστίζει χρήματα. Κάθε token παίρνει χρόνο για να επεξεργαστεί. Ένας θεϊκός πράκτορας που ξαναδιαβάζει ένα πλαίσιο token 50k για κάθε στροφή της συνομιλίας καίει μετρητά. Είναι υπολογιστική σπατάλη. τρέχουμε έναν υπερυπολογιστή για να απαντήσουμε "ναι" ή "όχι" επειδή δεν είχαμε πρόβλημα να φιλτράρουμε τις εισροές. 2. Latency and Cost Όταν ένας θεϊκός πράκτορας αποτυγχάνει, γιατί απέτυχε; Ήταν η ειδοποίηση; Το βήμα ανάκτησης; Η έξοδο εργαλείου; Ή απλά αποσπούν την προσοχή από ένα άσχετο κομμάτι κειμένου από τη σελίδα 405 της τεκμηρίωσης; Δεν μπορείτε να δοκιμάσετε μια ειδοποίηση που αλλάζει τη συμπεριφορά της με βάση την μεταβλητή σούπα ενός τεράστιου παραθύρου πλαισίου. 3. The Debugging Black Hole Ένας ενιαίος πράκτορας με πρόσβαση σε όλα είναι ένας εφιάλτης ασφαλείας. Εάν η έγκαιρη ένεση λειτουργεί, ο επιτιθέμενος κατέχει το κάστρο. Δεν υπάρχουν χύμα. Δεν υπάρχει "μηδενική εμπιστοσύνη" επειδή η αρχιτεκτονική βασίζεται στη μέγιστη εμπιστοσύνη σε ένα μοντέλο πιθανότητας. 4. The Governance Void Είναι η λύση μόνο microservices (και πάλι); Ναι ναι είναι. Ο δρόμος προς τα εμπρός είναι Και η . Aggressive Context Curation Agentic Mesh Πρέπει να το αντικαταστήσουμε με ένα δίκτυο μικρών, εξειδικευμένων, ιδιαίτερα περιορισμένων πράκτορων που επικοινωνούν μέσω τυποποιημένων πρωτοκόλλων. Σε μια αρχιτεκτονική δικτύου, κανένας πράκτορας δεν ξέρει τα πάντα. Ο πράκτορας του δρομολογητή ξέρει πώς να ταξινομήσει την πρόθεση. Ο υπάλληλος υποστήριξης γνωρίζει την πολιτική επιστροφής. Ο κωδικοποιητής γνωρίζει την Python. Ο SQL Agent γνωρίζει το σχήμα της βάσης δεδομένων. Δεν μοιράζονται ένα παράθυρο περιβάλλοντος. μοιράζονται μηνύματα. Αυτή είναι η μετάβαση από ένα μονολίθιο σε μικροεξυπηρέτηση. Είναι ο μόνος τρόπος για να κλιμακωθεί η πολυπλοκότητα. Όταν ο πράκτορας υποστήριξης λειτουργεί, δεν χρειάζεται να γνωρίζει το σχήμα της βάσης δεδομένων. Δεν χρειάζεται τις βιβλιοθήκες Python. Το πλαίσιο του είναι πρωτόγονο. Ας δούμε τη διαφορά στη δομή του κώδικα. The Old Way: Ο Θεός Γρήγορος Αυτό είναι που γράφουν οι περισσότεροι σήμερα, είναι ένα χάος. # GOD AGENT - ANTI-PATTERN # We dump everything into one system prompt. system_prompt = """ You are an omniscient AI assistant for Acme Corp. You have access to: 1. The User Database (Schema: users, orders, items...) 2. The Codebase (Python, React, TypeScript...) 3. The Company Handbook (HR policies, returns, holidays...) 4. The Marketing Style Guide Instructions: - If the user asks about SQL, write a query. - If the user asks for a refund, check the handbook policy then query the DB. - If the user asks for code, write Python. Current Context: {entire_rag_retrieval_dump} {last_50_messages} """ # Result: The model gets confused. # It tries to apply HR policies to SQL queries. # It hallucinates tables that don't exist. Πυθώνιος Ο νέος τρόπος: Το πλέγμα του πράκτορα Εδώ, χωρίζουμε τη λογική. Ο δρομολογητής δεν κάνει τη δουλειά. # MESH ARCHITECTURE - PATTERN # Step 1: The Router Agent # Its only job is to classify and route. It has NO domain knowledge. router_prompt = """ You are a routing system. Analyze the user input and route to the correct agent. Available Agents: 1. billing_agent (Refunds, invoices, payments) 2. tech_support_agent (Python, SQL, Bug fixes) 3. general_chat_agent (Casual conversation) Output JSON only: {"target_agent": "name", "reasoning": "string"} """ # Step 2: The Specialist Agent (Billing) # This agent loads ONLY when called. # It has zero knowledge of Python or SQL. billing_agent_prompt = """ You are a Billing Specialist. You handle refunds and invoices. Tools available: [stripe_api, invoice_db] Context: {user_transaction_history_only} {refund_policy_summary} """ Πυθώνιος Βλέπετε τη διαφορά; Η Δεν μπορεί να ψευδαισθήσει τη σύνταξη SQL επειδή δεν γνωρίζει τι είναι η SQL. Το σύμπαν του είναι μικρό. billing_agent Πώς μιλούν οι πράκτορες χωρίς ψευδαισθήσεις; Είμαι σκεπτικός για τα μεγάλα τεχνολογικά πλαίσια. Συνήθως προσθέτουν bloat. Αλλά το Google Agent Development Kit (ADK) και το πρωτόκολλο Agent-to-Agent (A2A) είναι διαφορετικά. Η Google έχει συνειδητοποιήσει ότι αν θέλουμε οι πράκτορες να δουλεύουν, πρέπει να μιλούν μεταξύ τους σαν λογισμικό, όχι σαν chatbots. Το πρωτόκολλο A2A Το πρωτόκολλο A2A είναι ένα ουδέτερο από τον προμηθευτή πρότυπο για τους πράκτορες για να ανακαλύψουν και να μιλήσουν μεταξύ τους. Χρησιμοποιεί "Κάρτες πράκτορα". Αυτά είναι τυποποιημένα αρχεία μεταδεδομένων JSON που περιγράφουν τι μπορεί να κάνει ένας πράκτορας. Σκεφτείτε το έτσι: { "agent_id": "billing_specialist_v1", "capabilities": ["process_refund", "check_invoice_status"], "input_schema": { "type": "object", "properties": { "transaction_id": {"type": "string"}, "user_intent": {"type": "string"} } }, "output_schema": { "type": "object", "properties": { "status": {"type": "string", "enum": ["success", "failed"]}, "refund_amount": {"type": "number"} } } } Τζόνσον Όταν ένας πράκτορας δρομολογητή χρειάζεται να επεξεργαστεί μια επιστροφή χρημάτων, δεν προσπαθεί να ψευδαισθήσει την κλήση API. , χειροκροτεί μέσω A2A, περνά το δομημένο φορτίο χρήσης και περιμένει μια δομημένη απάντηση. billing_specialist Αυτό είναι πρότυπο, μας επιτρέπει να δημιουργήσουμε ένα όπου οι πράκτορες από διαφορετικές ομάδες, ή ακόμα και διαφορετικές εταιρείες, μπορούν να συνεργαστούν. Agentic Mesh Σήμερα, ένας πράκτορας OpenAI δεν μπορεί να μιλήσει με έναν πράκτορα Vertex AI. Με το A2A, μοιράζονται ένα πρωτόκολλο. Τι σημαίνει αυτό στην πραγματικότητα Η υιοθέτηση μιας αρχιτεκτονικής πλέγματος αλλάζει τα πάντα για το πώς χτίζουμε. Η παραδοσιακή παρατηρησιμότητα (ημερολόγια, μετρήσεις, ίχνη) είναι ανεπαρκής. Πρέπει να δούμε το Γιατί ο δρομολογητής παρέδωσε στον πράκτορα χρέωσης; Γιατί ο πράκτορας χρέωσης απέρριψε το αίτημα; Πρέπει να εντοπίσουμε το κόστος και την καθυστέρηση ανά κόμβο στο δίκτυο. 1. Observability is Mandatory Agentic Observability Λογική αλυσίδα Σε ένα μοντέλο God Agent, η ασφάλεια είναι ένας δυαδικός διακόπτης. Ο πράκτορας χρέωσης δεν εμπιστεύεται σιωπηρά τον πράκτορα δρομολογητή. Ελέγχει το φορτίο χρήσης. Ελέγχει την πολιτική. Περιορίζει την ακτίνα έκρηξης. 2. Zero Trust Security Zero Trust Η άμεση μηχανική ως ανεξάρτητη πειθαρχία πεθαίνει. Η πραγματική δουλειά είναι στη λογική δρομολόγησης, στον ορισμό του σχήματος και στη στρατηγική επιλογής του πλαισίου. 3. The End of "Prompt Engineering" System Engineering Πρέπει να γίνουμε αδίστακτοι συντάκτες. Ο στόχος δεν είναι να γεμίσουμε το παράθυρο του πλαισίου. Ο στόχος είναι να το αδειάσουμε. Πρέπει να συμπιέσουμε. Πρέπει να συνοψίσουμε. Πρέπει να εγχέουμε μόνο ακριβώς αυτό που χρειάζεται για το επόμενο άμεσο βήμα. Εάν ένας πράκτορας έχει καθήκον να γράψει SQL, χρειάζεται το σχήμα. Χρειάζεται η δήλωση αποστολής της εταιρείας. 4. Aggressive Context Curation Όχι (Ακούγεται προφανές, αλλά το βλέπω να αγνοείται στο 90% των βάσεων κώδικα.) Διαβάστε την πλήρη τεχνική κατάρρευση → Διαβάστε την πλήρη τεχνική κατάρρευση → TL;DR για τους Scrollers Ο θεός πράκτορας αποτυγχάνει: Η απομάκρυνση του παραθύρου πλαισίου οδηγεί σε σύγχυση, υψηλό κόστος και αδυναμία εκκαθάρισης. Διαχωρισμός ανησυχιών: Δημιουργήστε εξειδικευμένους πράκτορες (Φορολόγηση, SQL, Chat) που κάνουν ένα πράγμα καλά. Χρησιμοποιήστε πρωτόκολλα: Οι πράκτορες θα πρέπει να επικοινωνούν μέσω