En febreiro de 2026, participei nunha investigación colectiva baseada exclusivamente na intelixencia de código aberto (OSINT) para contextualizar as referencias vagas contidas nos rexistros xudiciais públicos publicados polo Departamento de Xustiza dos Estados Unidos (DOJ) en conexión co caso Epstein. Este lanzamento, un dos máis grandes xamais relacionados co financiador condenado Jeffrey Epstein, fixo dispoñibles ao público millóns de páxinas a partir de xaneiro de 2026, baixo o chamado "programa de financiamento". . Epstein rexistrou a Lei de Transparencia O que comezou como análise colaborativa dentro das comunidades en liña evolucionou, dentro de poucos días, en contribucións técnicas que apoiaron accións institucionais formais.O diferencial clave foi o traballo dun pequeno equipo de investigación que combina ferramentas modernas con rigorosa curación humana e comunicación altamente eficiente - na práctica, operando máis áxil que estruturas moito máis grandes. Esta configuración permitiu a colaboración directa co xornalismo investigativo, que ampliou o alcance e a contextualización dos datos públicos a través de informes en profundidade, e co Ministerio Público Federal (MPF). Estas interaccións demostraron ser esenciais para acelerar os procedementos oficiais, incluíndo a apertura dunha investigación administrativa e a súa posterior escalada a unha unidade nacional especializada en delitos transnacionais. A continuación, unha descrición cronolóxica do fluxo de traballo técnico adoptado. Metodoloxía técnica (paso a paso) Extracción inicial de entidades e curación humana (Días 1 a 3 de febreiro de 2026) Os documentos públicos -principalmente correos electrónicos e extractos dos rexistros xudiciais de 2011 publicados nos conxuntos de datos do DOJ- foron revisados manualmente e con ferramentas básicas de apoio. A maior parte do valor analítico inicial provén da curación humana: lectura coidadosa de descricións socioeconómicas, referencias xeográficas vagas e elementos loxísticos implícitos. Resolución de entidades e mapeamento OSINT con ferramentas especializadas (Ao redor do 4 de febreiro) Usando exclusivamente fontes públicas, realizamos correlacións de múltiples fontes que involucran rexistros empresariais, estruturas corporativas e conxuntos de datos de arquivo aberto. Maltego foi usado para mapear redes dixitais e conexións en liña asociadas.Técnicas de resolución de entidades priorizaron correspondencias contextuais, como: ligazóns xeográficas aproximadas, historia de migración ou relocalización, patróns loxísticos e temporais recorrentes, relacións indirectas pero persistentes. Redes sociais abertas e resultados Como resultado, unha entidade intermediaria clave resolveuse nunhas horas. Construción e visualización de gráficos con Neo4j e Mermaid.js As entidades e relacións resoltas foron importadas a Neo4j, permitindo a modelaxe de redes de investigación complexas e a execución de consultas gráficas centradas en: da centralidade, camiños e intermediarios, Hubs loxísticos e institucionais. Esta representación baseada en gráficos revelou patróns temporais e xeográficos que non eran evidentes a través da análise lineal de documentos. Todo o fluxo de traballo foi documentado visualmente usando Mermaid.js, adoptando un enfoque de diagramas como código integrado en Markdown. proceso de fluxo, os horarios, Gráficos de relacións entre entidades. Isto facilitou moito a revisión colaborativa, a trazabilidade e a transparencia metodolóxica. Soporte de IA (Grok) para cronoloxía e análise parcial Grok foi usado como unha ferramenta auxiliar para: Consolidación de horarios de eventos, Identificar as datas de mencións e publicacións de documentos, resumir os fragmentos de texto seleccionados, suxiren consultas optimizadas e ligazóns de candidatos entre entidades. A IA foi usada estritamente como un acelerador operativo.Toda validación e decisións críticas permaneceron baixo a responsabilidade humana e a verificación manual da fonte. Divulgación responsable, colaboración e impacto inmediato (do 4 ao 9 de febreiro) Día 4: divulgación pública controlada das entidades resoltas dentro de comunidades en liña especializadas, xunto coa referencia a unha comunicación formal presentada á autoridade fiscal competente (MPF). Días 4-6: amplificación por xornalistas investigadores independentes, que confiaron nos mesmos datos públicos para publicar informes en profundidade, ampliando a visibilidade e a presión institucional. Días 7-8: extensión do mapeo a referencias adicionais nos ficheiros publicados, incluíndo potenciais centros internacionais e entidades publicamente listadas. Os días 8 e 9: observouse a escalada do procedemento administrativo a unha unidade nacional especializada en delitos transnacionais, en liña coa rápida consolidación e documentación dos resultados do OSINT. Principios dirixentes A dependencia estrita só de fontes abertas e dispoñibles ao público. Non recoller nin divulgar información sensible máis aló do que xa era público. recoñecemento explícito da natureza colectiva e colaborativa do traballo (comunidades en liña, xornalismo investigativo e MPF); Enfoque continuo na curación humana para garantir a precisión, os estándares éticos e a responsabilidade. Leccións aprendidas e impacto Este caso demostra como un pequeno equipo ben coordinado -utilizando Neo4j para modelar gráficos, Maltego para mapear redes, Mermaid.js para documentación visual e Grok para soporte analítico e cronolóxico- pode producir resultados desproporcionados en investigacións de código aberto. O factor central non era a automatización, senón a rigorosa referencia transversal de datos públicos combinados con documentación estruturada e auditable.A colaboración directa co xornalismo investigativo e co Servizo Federal de Fiscalía Brasileiro permitiu converter a análise técnica en aportacións institucionais prácticas. Ofrece un exemplo concreto de uso ético e responsable de OSINT e AI nun contexto social de alto impacto como o caso Epstein. Para os profesionais que traballan con OSINT, bases de datos de gráficos, visualización de procesos investigativos ou análise asistida por IA, este fluxo de traballo pode adaptarse a escenarios como a conformidade, a dilixencia debida, as investigacións corporativas e a investigación independente. Fluxo de traballo de equipo, curado de datos e marcos lixeiros A investigación foi organizada usando un fluxo de traballo lixeiro e inspirado en Kanban para coordinar as tarefas, controlar a calidade dos datos e garantir a trazabilidade ao longo do proceso OSINT. Todos os resultados pasaron a través dun tubo estruturado de curación de datos humanos, no que as extraccións crúas foron revisadas, normalizadas e validadas antes de seren promovidas ás capas de gráficos e documentación compartidas.Cada tarxeta no fluxo de traballo representaba unha única hipótese de investigación ou clúster de entidades e seguía un ciclo de vida claro: descubrimento, validación preliminar, corroborado con múltiples fontes, integración de gráficos e documentación lista para a publicación. A curación desempeñou un papel central na prevención da confluencia de entidades, na xestión de referencias ambiguas e na evasión da atribución prematura.Foi dada especial atención ao nomeamento da ambigüidade, a incerteza xeográfica, a coherencia temporal e a procedencia da fonte. Esta combinación dun marco de equipo sinxelo (coordinación de estilo Kanban) cunha estrita capa de curación humana asegurou a velocidade operativa sen sacrificar o rigor metodolóxico, os estándares éticos e a audibilidade do proceso de investigación. Positive operational and institutional impacts A adopción dun fluxo de traballo de equipo lixeiro e inspirado en Kanban combinado cunha estrita capa de curación de datos humanos produciu beneficios operacionais e institucionais mensurables. visibilidade de tarefas e etapas de curación ben definidas reduciron a duplicación de esforzos, minimizaron as hipóteses contraditorias e aceleraron a converxencia cara a entidades de alta confianza. Desde unha perspectiva externa, a coherencia dos conxuntos de datos curados, a clara procedencia das fontes e o fluxo de decisións rastrexables permitiron unha reutilización máis rápida do material por parte dos xornalistas investigadores e polo Servizo Fiscal Federal Brasileiro (MPF).