En el mundo actual, tenemos acceso a una enorme cantidad de datos, gracias a potentes modelos de IA como   , así como modelos de visión y otras tecnologías similares. Sin embargo, no se trata solo de la cantidad de datos en los que se basan estos modelos, sino también de la calidad. Crear un buen conjunto de datos rápidamente y a escala puede ser una tarea desafiante y costosa. ChatGPT  Ahí es donde entra el aprendizaje activo.  En términos simples, el aprendizaje activo tiene como objetivo optimizar la anotación de su conjunto de datos y entrenar el mejor modelo posible utilizando la menor cantidad de datos de entrenamiento.  Es un enfoque de aprendizaje supervisado que involucra un proceso iterativo entre las predicciones de su modelo y sus datos. En lugar de esperar un conjunto de datos completo, puede comenzar con un pequeño lote de datos anotados seleccionados y entrenar su modelo con ellos.  Luego, mediante el aprendizaje activo, puede aprovechar su modelo para etiquetar datos no vistos, evaluar la precisión de las predicciones y seleccionar el siguiente conjunto de datos para anotar en función de las funciones de adquisición.  Una ventaja del aprendizaje activo es que puede analizar el nivel de confianza de las predicciones de su modelo.  Si una predicción tiene poca confianza, el modelo solicitará imágenes adicionales de ese tipo para etiquetarlas. Por otro lado, las predicciones con alta confianza no requerirán más datos. Al anotar menos imágenes en general, ahorra tiempo y dinero mientras logra un modelo optimizado. El aprendizaje activo es un enfoque muy prometedor para trabajar con conjuntos de datos a gran escala.   Hay algunos puntos clave para recordar sobre el aprendizaje activo.  Primero, involucra la anotación humana, lo que le da control sobre la calidad de las predicciones de su modelo. No es una caja negra entrenada con millones de imágenes. Usted participa activamente en su desarrollo y ayuda a mejorar su desempeño. Este aspecto hace que el aprendizaje activo sea importante e interesante, aunque puede aumentar los costos en comparación con los enfoques no supervisados. Sin embargo, el tiempo que se ahorra en la capacitación y la implementación del modelo a menudo supera estos costos.  Además, puede utilizar herramientas de anotación automática y corregirlas manualmente, reduciendo aún más los gastos.  En el aprendizaje activo, tiene un conjunto de datos etiquetados en los que se entrena su modelo, mientras que el conjunto sin etiquetar contiene datos potenciales que aún no se han anotado. Un concepto crucial son las estrategias de consulta, que determinan qué datos etiquetar. Hay varios enfoques para encontrar los subconjuntos más informativos en la gran cantidad de datos sin etiquetar. Por ejemplo, el muestreo de incertidumbre implica probar su modelo en datos no etiquetados y seleccionar los ejemplos clasificados con menos confianza para la anotación.     , donde varios modelos, cada uno entrenado en un subconjunto diferente de datos etiquetados, forman un comité. Estos modelos tienen distintas perspectivas sobre el problema de la clasificación, al igual que las personas con diferentes experiencias tienen una comprensión diferente de ciertos conceptos. Los datos a anotar se seleccionan en base a la discrepancia entre los modelos del comité, lo que indica complejidad. Este proceso iterativo continúa a medida que los datos seleccionados se anotan continuamente. Otra técnica de aprendizaje activo es Consulta por comité (QBC)  Esta es solo una explicación básica del aprendizaje activo, que muestra un ejemplo de una estrategia de consulta.  Si está interesado, puedo brindarle más información o videos sobre otras estrategias de aprendizaje automático. Un ejemplo de la vida real de aprendizaje activo es cuando responde captchas en Google. Al hacerlo, los ayuda a identificar imágenes complejas y crear conjuntos de datos con el aporte colectivo de múltiples usuarios, asegurando tanto la calidad del conjunto de datos como la verificación humana. Entonces, la próxima vez que encuentre un captcha, ¡recuerde que está contribuyendo al progreso de los modelos de IA!  Para obtener más información y ver un ejemplo práctico usando una excelente herramienta desarrollada por mis amigos de Encord, vea el video:   https://youtu.be/Zv6UzuwUBd4?embedable=true&transcript=true

The writer is smart, but don't just like, take their word for it. #DoYourOwnResearch before making any investment decisions or decisions regarding you health or security. (Do not regard any of this content as professional investment advice, or health advice)

Walkthroughs, tutorials, guides, and tips. This story will teach you how to do something new or how to do something better.

The is an opinion piece based on the author’s POV and does not necessarily reflect the views of HackerNoon.

This writer has a vested interested be it monetary, business, or otherwise, with 1 or more of the products or companies mentioned within.

Watch more on YouTube: https://www.youtube.com/c/WhatsAI

I explain Artificial Intelligence terms and news to non-experts.

2021 - HackerNoon Contributor of the Year - FACEBOOK

2022 - Best Data Science Newsletter

2022 - HackerNoon Contributor of the Year - Artificial Intelligence

2022 - HackerNoon Contributor of the Year - Computer Vision

2022 - HackerNoon Contributor of the Year - Data Science

Una introducción al aprendizaje activo

About Author

COMENTARIOS

ETIQUETAS

ESTE ARTÍCULO FUE PRESENTADO EN

Related Stories

Liberando el poder de la IA. Una revisión sistemática de técnicas de vanguardia: resumen e introducción

La fuga rápida del sistema Claude Sonnet 3.5: un análisis forense

Aumente su productividad con estas 18 herramientas para desarrolladores 🚀🔥

¿Quieres ganar un concurso de redacción de HackerNoon? Esto es lo que recomiendan los ganadores del concurso #crypto-api

Liberando el poder de la IA. Una revisión sistemática de técnicas de vanguardia: resumen e introducción

La fuga rápida del sistema Claude Sonnet 3.5: un análisis forense

Aumente su productividad con estas 18 herramientas para desarrolladores 🚀🔥

¿Quieres ganar un concurso de redacción de HackerNoon? Esto es lo que recomiendan los ganadores del concurso #crypto-api

Light-Mode

Classic

Newspaper

Minty

Dark-Mode

Neon Noir

Minty

HN StartUps