En febrero de 2026, participé en una investigación colectiva basada exclusivamente en la inteligencia de código abierto (OSINT) para contextualizar referencias vagas contenidas en registros judiciales públicos publicados por el Departamento de Justicia de Estados Unidos (DOJ) en relación con el caso Epstein. Este lanzamiento, uno de los más grandes jamás relacionados con el financiero condenado Jeffrey Epstein, hizo que millones de páginas estuviesen disponibles para el público a partir de enero de 2026, bajo el llamado programa de financiación. . Epstein aprueba la Ley de Transparencia Lo que comenzó como análisis colaborativo dentro de las comunidades en línea evolucionó, en pocos días, en contribuciones técnicas que apoyaban las acciones institucionales formales.El diferencial clave fue el trabajo de un pequeño equipo de investigación que combinaba herramientas modernas con una curación humana rigurosa y una comunicación altamente eficiente – en la práctica, operando con más agilidad que estructuras mucho más grandes. Esta configuración permitió una colaboración directa con el periodismo investigativo, que amplió el alcance y la contextualización de los datos públicos a través de reportes en profundidad, y con el Ministerio Público Federal (MPF).Estas interacciones resultaron esenciales para acelerar los procedimientos oficiales, incluyendo la apertura de una investigación administrativa y su posterior escalada a una unidad nacional especializada en crímenes transnacionales. A continuación se muestra una descripción cronológica del flujo de trabajo técnico adoptado. Metodología técnica (paso a paso) Extracción inicial de entidades y curación humana (Días 1–3 de febrero de 2026) Los documentos públicos —principalmente correos electrónicos y extractos de registros judiciales de 2011 publicados en los conjuntos de datos del DOJ— fueron revisados manualmente y con herramientas básicas de apoyo. La mayor parte del valor analítico temprano provino de la curación humana: lectura cuidadosa de las descripciones socioeconómicas, referencias geográficas vagas y elementos logísticos implícitos. Resolución de entidades y mapeo OSINT con herramientas especializadas (alrededor del 4 de febrero) Utilizando exclusivamente fuentes públicas, realizamos una correlación de múltiples fuentes que involucra registros comerciales, estructuras corporativas y conjuntos de datos de archivos abiertos. Maltego se utilizó para mapear las redes digitales y las conexiones en línea asociadas.Técnicas de resolución de entidades priorizaron los ajustes contextuales, como: enlaces geográficos aproximados, historia de migración o de reubicación, los patrones logísticos y temporales recurrentes, Relaciones indirectas pero persistentes. Redes sociales abiertas y resultados Como resultado, una entidad intermediaria clave se resolvió en cuestión de horas. Construcción y visualización de gráficos con Neo4j y Mermaid.js Se importaron entidades y relaciones resueltas a Neo4j, permitiendo la modelización de redes de investigación complejas y la ejecución de consultas de gráficos centradas en: La centralidad, caminos y intermediarios, Hubs logísticos e institucionales. Esta representación basada en gráficos reveló patrones temporales y geográficos que no eran evidentes a través del análisis lineal de documentos. Todo el flujo de trabajo fue documentado visualmente utilizando Mermaid.js, adoptando un enfoque de diagramas como código integrado en Markdown. El proceso de fluctuación, los timelines, gráficos de relación entre entidades. Esto facilitó enormemente la revisión colaborativa, la trazabilidad y la transparencia metodológica. Soporte de IA (Grok) para cronología y análisis parcial Grok se utilizó como una herramienta auxiliar para: Consolidación de horarios de eventos, Identificar las fechas de menciones y publicaciones de documentos, resumir los fragmentos de texto seleccionados, sugieren consultas optimizadas y enlaces de candidatos entre entidades. La IA se utilizó estrictamente como un acelerador operativo.Toda la validación y las decisiones críticas permanecieron bajo responsabilidad humana y verificación manual de fuente. Divulgación responsable, colaboración y impacto inmediato (del 4 al 9 de febrero) Día 4: divulgación pública controlada de las entidades resueltas dentro de las comunidades en línea especializadas, junto con una referencia a una comunicación formal presentada a la autoridad fiscal competente (MPF). Días 4–6: amplificación por periodistas investigadores independientes, que se basaron en los mismos datos públicos para publicar informes en profundidad, ampliando la visibilidad y la presión institucional. Días 7-8: extensión del mapeo a referencias adicionales en los archivos publicados, incluyendo centros internacionales potenciales y entidades publicamente listadas. Días 8–9: se observó una escalada del procedimiento administrativo a una unidad nacional especializada en delitos transnacionales, en línea con la rápida consolidación y documentación de los hallazgos del OSINT. Principios Guía la dependencia estricta únicamente de fuentes abiertas y de acceso público; no recopilar o divulgar información sensible más allá de lo que ya era público; reconocimiento explícito del carácter colectivo y colaborativo del trabajo (comunidades en línea, periodismo investigativo y MPF); El énfasis continuo en la curación humana para garantizar la precisión, los estándares éticos y la responsabilidad. Lecciones aprendidas y impacto Este caso demuestra cómo un pequeño equipo bien coordinado – utilizando Neo4j para modelar gráficos, Maltego para mapear redes, Mermaid.js para documentación visual y Grok para soporte analítico y cronológico – puede producir resultados desproporcionados en investigaciones de código abierto. El factor central no fue la automatización, sino la rigurosa inter-referenciación de datos públicos combinados con documentación estructurada y auditable.La colaboración directa con el periodismo investigativo y con el Servicio Federal de Fiscalía Brasileño permitió convertir el análisis técnico en una aportación institucional práctica. Proporciona un ejemplo concreto de uso ético y responsable de OSINT y AI en un contexto social de alto impacto como el caso Epstein. Para los profesionales que trabajan con OSINT, bases de datos de gráficos, visualización de procesos investigativos o análisis asistido por IA, este flujo de trabajo se puede adaptar a escenarios como el cumplimiento, la diligencia debida, las investigaciones corporativas y la investigación independiente. Flujo de trabajo de equipo, curado de datos y marcos ligeros La investigación se organizó utilizando un flujo de trabajo ligero e inspirado en Kanban para coordinar tareas, controlar la calidad de los datos y garantizar la trazabilidad en todo el proceso OSINT. Todos los hallazgos pasaron a través de un tubo estructurado de curación de datos humanos, en el que las extracciones crudas fueron revisadas, normalizadas y validadas antes de ser promovidas a las capas compartidas de gráficos y documentación.Cada tarjeta en el flujo de trabajo representaba una única hipótesis de investigación o grupo de entidades y seguía un ciclo de vida claro: descubrimiento, validación preliminar, corroboracin multi-fonte, integracin gráfica y documentación listo para la publicación. La curación desempeñó un papel central en la prevención de la confusión de entidades, la gestión de referencias ambiguas y la evitación de la atribución prematura. Se prestó especial atención a nombrar la ambigüedad, la incertidumbre geográfica, la coherencia temporal y la procedencia de la fuente. Solo las entidades respaldadas por fuentes públicas independientes y la coherencia contextual se incorporaron a la documentación de Neo4j y Mermaid.js. Esta combinación de un marco de equipo simple (coordinación de estilo Kanban) con una estricta capa de curación humana aseguró la velocidad operativa sin sacrificar el rigor metodológico, los estándares éticos y la audibilidad del proceso de investigación. Positive operational and institutional impacts La adopción de un flujo de trabajo de equipo ligero e inspirado en Kanban combinado con una estrita capa de curación de datos humanos produjo beneficios operativos e institucionales mensurables. visibilidad de tareas y etapas de curación bien definidas redujeron la duplicación de esfuerzo, minimizaron hipótesis contradictorias y aceleraron la convergencia hacia entidades de alta confianza. Desde una perspectiva externa, la coherencia de los conjuntos de datos curados, la clara procedencia de las fuentes y el flujo de decisiones rastreable permitieron una reutilización más rápida del material por parte de los periodistas investigadores y por el Servicio Fiscal Federal Brasileño (MPF). Esto redujo significativamente el coste de la verificación, aumentó la confianza en los resultados OSINT y facilitó su incorporación directa a los procedimientos analíticos y administrativos formales.