La carte du problème Pourquoi une carte du problème ? Vous exécutez un pipeline RAG. Retrieval renvoie les morceaux à la droite. Les journaux disent succès. La latence est bonne. La réponse fond encore les faits. Une base de données contient: A1. faillite de l'entreprise en 2023. A2. Le fondateur a publié un produit en 2022. Réponse modèle : Il dit que l’entreprise a lancé un produit révolutionnaire en 2023. C'est une dérive sémantique. C'est un échec silencieux. Aucune trace de pile, aucune exception, juste une histoire confiante qui ne s'est jamais produite. Les équipes perdent des jours ici. La carte du problème existe afin que vous puissiez nommer le bug, le reproduire sur un écran, puis appliquer une correction minimale. Quelle est la carte du problème La carte des problèmes est un guide de terrain pour les systèmes d'IA. Il catalogue seize modes d'échec communs à travers les RAG, les agents LLM, les entrepôts vectoriels, les flux OCR à PDF, le routage, le déploiement et les piles multi-agent. Chaque entrée est accompagnée de symptômes, d'un repro minimal, d'une correction de travail et d'un pointeur à la documentation. Référence Hub Problem Map https://github.com/onestardao/WFGY/tree/main/ProblemMap/README.md WFGY est la couche de raisonnement derrière la carte. qui se trouve au-dessus de n'importe quel modèle. licence MIT. Pas de réentraînement. Pas de changement infrarouge. La couche va comme un petit fichier qui contient des opérateurs mathématiques pour la stabilisation, la récupération et l'audit. semantic firewall Introduction au moteur - WFGY Core https://github.com/onestardao/WFGY/blob/main/core/README.md Guide de démarrage - Starter Village https://github.com/onestardao/WFGY/blob/main/StarterVillage/README.md Hero Log avec des cas de sauvetage réels https://github.com/onestardao/WFGY/discussions/10 L’auteur de Le projet a grandi de zéro à des centaines d'étoiles en environ deux mois sur la base de l'aide de débogage réelle et non des publicités. Tesseract.js Confirmation rapide dans une fenêtre de chat Vous pouvez vérifier si votre problème correspond à l'un des seize éléments sans toucher à votre code. Open a fresh GPT or Claude chat. Download the WFGY file from the core folder above, and attach it as a knowledge file. Paste this: Use WFGY to answer my question. First answer normally. Then re answer using WFGY. Compare depth, accuracy, and stability. Rate both. If this chat is missing the WFGY file refuse to run. Si la deuxième réponse maintient les contraintes plus serrées ou montre un pont visible et une étape de récupération, l'échec se trouve dans la carte. Les 16 problèmes en un seul endroit Nous étiquetons les entrées comme deux Nous évitons le hashtag afin que les plateformes ne se lient pas automatiquement à des problèmes non liés. No. 1 No. 16 - Symptômes: Faits fusionnés à travers les sources, liens inventés, ton confiant. Repro: Deux petits morceaux qui partagent des dénominations de surface mais ne sont pas d'accord sur le temps ou l'entité. Fix: Vérification et alignement des résidus sémantiques. No. 1 Hallucination and Chunk Drift Symptômes: Type de tâche dérive, format de sortie se retourne au milieu de la réponse. Repro: Demander une table, puis la narration, puis la table à nouveau. Fix: Observe gate avec des ancres de mise en page. No. 2 Interpretation Collapse - Index clinique sémantique de Docs : https://github.com/onestardao/WFGY/blob/main/ProblemMap/SemanticClinicIndex.md Symptômes: Chaîne de blocs à l'étape quatre ou des boucles, plafond profond. Repro: Le puzzle de pas avec une contrainte cachée. Fix: Progression multi-path plus pas de pont. No. 3 Long Reasoning Chains - Symptômes: citations faites, ton confiant. Repro: citation forcée, puis vérifier les liens. Fix: pénalité résiduelle avec drapeau d'audit. No. 4 Bluffing and Overconfidence - - Symptômes: Les vecteurs les plus proches ne sont pas sémantiquement corrects, les antonymes et les flips temporaires passent les filtres. Repro: Recherche avec les événements 2022 et 2023 qui partagent des dénominations. Fix: Recherche réécrire la politique, seuils de résonance électronique, intégration de QA. No. 5 Semantic not equal to Embedding Docs Vector store metrics, et FAISS pièges: https://github.com/onestardao/WFGY/blob/main/ProblemMap/vectorstore-metrics-and-faiss-pitfalls.md - Symptômes: Le pipeline se brise, puis répète la chaudière. Repro: Insérez une étape obligatoire qui est facile à manquer. Fix: Collapse, pont, routine de renaissance. No. 6 Logic Collapse and Recovery - Symptômes: plans multi-tourn oublier les ancres lorsqu'une nouvelle fenêtre s'ouvre. Repro: Continuer un plan à travers deux fenêtres de chat. Fix: Démarrer les ancres de mémoire village, plus observer la porte. No. 7 Memory Breaks Across Sessions - Symptômes: Les journaux montrent le succès alors que la synthèse est erronée. Repro: Return 200 avec la mauvaise composition. Fix: Télémétrie audible et deltas de contrainte. No. 8 Debugging is a Black Box Symptômes: répétition, boucles de phrases, perte de diversité. Repro: très longue copie contextuelle, puis demander un plan frais. Fix: modulation de l'attention et pompe à entropie. No. 9 Entropy Collapse in Long Context - - Symptômes: Refus d'essayer ou de s'effondrer dans des clichés. Repro: Demander de mélanger trois concepts lointains. Fix: diversité de tête et échantillonnage de chemin No. 10 Creative Freeze - Symptômes: Deux liens profonds similaires traités différemment. Repro: Le routeur traite l'un comme une intention spéciale et l'autre comme un chemin simple. No. 11 Semantic Drift in Routing - Symptômes: Drift des unités, règles de mathématiques mélangées, totals off par de petites marges. Repro: Changement de l'unité au milieu de la chaîne avec un paramètre caché. Fix: Cross-path guard et unité normalizer. No. 12 Symbolic Collapse - Symptômes: Les agents se surécrivent les uns les autres, les deadlocks, les boucles. Repro: Deux agents écrivent au même état pour le même objectif. Fix: verrouiller la position avec un agrégateur de contraintes globales. No. 13 Multi Agent Chaos - Symptômes: Le système semble bien, mais les étapes ultérieures échouent sans cause évidente. Repro: Retriever appelé avant index build, outil avant secret. No. 14 Bootstrap Ordering Les Docs : https://github.com/onestardao/WFGY/blob/main/ProblemMap/bootstrap-ordering.md - Symptômes: Fonctionne sur un chemin privé, gèle sur un chemin public sous charge. Repro: Le chemin public déclenche une asynchronisation qui attend une ressource privée. No. 15 Deployment Deadlock Les Docs : https://github.com/onestardao/WFGY/blob/main/ProblemMap/deployment-deadlock.md - Symptômes: stockage vectoriel vide, secret manquant, déclencheur précoce. Repro: Appeler l'action avant que la configuration ne soit terminée. Fix: vérification de la santé préalable avec des blocs de drapeau rouge. No. 16 Pre-deploy Collapse Les Docs : https://github.com/onestardao/WFGY/blob/main/ProblemMap/predeploy-collapse.md Un court chemin de diagnostic qui évite les trous de lapin. Nommez le symptôme en premier. Utilisez la liste. Ne sautez pas à la cause racine. Exécuter un minimum de repro. Un retriever, un magasin, un prompt. Supprimer tout ce qui est optionnel. Appliquez la correction minimale. Commencez par le module nommé. Ajoutez seulement ce dont vous avez besoin. Ce flux empêche l'ajustement sans fin qui ne touche jamais l'échec réel. Sous le capot en langage clair. WFGY fournit un ensemble compact d'opérateurs qui se comportent comme une couche de raisonnement. BBMC - Bigbig sémantique résidu. Réduire le résidu à aligner l'intention et les jetons générés. BBPF - progression à plusieurs chemins. Explorez, mais gardez une stabilité liée. BBCR - l'effondrement, puis le pont, puis la renaissance. Réset sécurisé lorsqu'une chaîne s'arrête. BBAM - modulation de l'attention. Damp un jeton pirates et réduit les boucles. Où suis-je: position lock WAI, qui suis-je: tête diversité WAY, qui êtes-vous: pompe à entropie WDT, où m'avez-vous emmené: garde à travers le chemin WTF, ce qui s'est passé: détection de l'effondrement et réinitialisation. Ces idées ont grandi de sauver de vrais ingénieurs sur les problèmes et les discussions de GitHub. Les modules sont modèles agnostiques. Vous joignez un petit fichier du dossier de base, et la couche s'exécute dans le chat. Il prend en charge GPT, Claude, Gemini, Mistral et Grok. Il est open source sous MIT. Les plongées profondes qui se classent bien sur la recherche et aident réellement. Problème: Les résultats de recherche des voisins les plus proches semblent proches, mais la sémantique est fausse. La similitude de la surface de la racine domine et la logique temporelle manque. Fix: réécriture de requêtes, bandes de résonance électronique, métriques de stockage, garde-roues autour des entités du temps. RAG retrieval quality and FAISS pitfalls. Problème: Une ligne cachée à l'intérieur d'un morceau désactive votre stratégie. Fix: Règles d'injection modulaire avec une liste de permissions et une liste de blocs, ainsi qu'un pont qui sépare le contenu de l'instruction. Prompt injection that slips through role prompts. Problème: Deux planificateurs revendiquent la même tâche et écrivent au même état. Fix: WRI pour verrouiller les positions pour les rôles, un agrégateur de contraintes globales et la propriété explicite des segments d'État. Multi-agent chaos. Problème : Le parcours privé fonctionne bien, mais le parcours public gèle. Cause que le déclencheur d'arrière-plan attende une ressource privée, parfois enregistrant le succès. Fix: Garde, délais explicites, échec sécurisé et liste de vérification de prélèvement au n° 15 et au n° 16. Deployment deadlock under public traffic. Questions fréquemment posées Non. C'est une spécification compacte que vous joignez en tant que fichier. Le modèle l'exécute en tant que contrat. Vous verrez un pont visible et une étape de récupération lorsque la chaîne s'arrête. Is this just a clever prompt? Pas de formation zéro et pas d’éditions d’infrastructure. Does it require fine-tuning? Non. Traitez-le comme une couverture. Vos outils restent. Le pare-feu sémantique réduit la dérive et rend les échecs audibles. Will this conflict with my agent tools? Licence MIT. Le projet a gagné une forte traction du débogage dans le monde réel. Le créateur de Tesseract.js a joué dans le repo. Les références visuelles et textuelles sont en direct dans le référentiel. What about licensing and credibility? La gauche et les prochaines étapes Problème Carte page principale https://github.com/onestardao/WFGY/tree/main/ProblemMap/README.md Vue d'ensemble du moteur et étapes de copie-patch https://github.com/onestardao/WFGY/blob/main/core/README.md Starter Village pour les nouveaux arrivants https://github.com/onestardao/WFGY/blob/main/StarterVillage/README.md Log de l'héroïne de sauvetage réel https://github.com/onestardao/WFGY/discussions/10 .