Primero suscríbete a mi Twitter , tuiteo cosas tecnológicas.
Un speedrun más en la serie , vamos
Acabo de usar el meme de aprendizaje de refuerzo (RL) en ti:
¡Qué cebo fue... Dios mío...!
Entonces, ¿por qué le resulta tan difícil a meme-Kelvin aprender qué es el RL? Porque quiere aprender la implementación del RL en lugar de comprender el concepto . ¡POR ESO meme-KELVIN!
Cuando aprendes algo nuevo, herramienta, tecnología o cualquier cosa, NO empiezas con sus implementaciones, empiezas con ideas, conceptos y problemas que la herramienta resuelve.
Wo Kelvin, aquí tienes: para entender el aprendizaje por refuerzo (RL), piensa en jugar un videojuego en el que ganas puntos por hacer los movimientos correctos.
El aprendizaje por refuerzo es así: un programa aprende tomando decisiones y obteniendo recompensas o penalizaciones en función de sus acciones.
Ese fue solo un ejemplo de la aplicación del principio de COMENZAR CON IDEAS al aprendizaje por refuerzo, pero prometí explicar cómo aprender todo el aprendizaje automático en 52 segundos...
Para aprender ML en 52 segundos, debes aprender los conceptos de ML, no las implementaciones , luego buscar en Google (o GPT) implementaciones en PyTorch o cualquier nombre de biblioteca que te guste; de todos modos, va a cambiar el próximo año y está bien, las ideas seguirán siendo las mismas durante mucho más tiempo: ¡ busca ideas!
En el aprendizaje supervisado, se enseña a un programa mediante ejemplos con respuestas (denominados datos etiquetados). Esto ayuda al programa a aprender la conexión entre los ejemplos y las respuestas, de modo que pueda adivinar las respuestas para nuevos ejemplos que no haya visto antes.
Algoritmos y problemas a resolver: predecir precios de viviendas (regresión lineal), decidir si un cliente comprará un producto (árboles de decisión)
Aquí, el programa analiza ejemplos sin respuestas (datos sin etiquetar) e intenta encontrar patrones o grupos dentro de ellos. Esto puede resultar útil en tareas como agrupar elementos similares o reducir la cantidad de información necesaria para describir los datos.
Algoritmos y problemas a resolver: agrupar personas con gustos musicales similares (agrupamiento k-means), comprimir imágenes sin perder demasiada información (análisis de componentes principales)
En el aprendizaje por refuerzo, el programa aprende a tomar decisiones probando cosas y recibiendo retroalimentación en forma de recompensas o penalizaciones. El objetivo es tomar mejores decisiones con el tiempo y resolver problemas de manera más eficaz.
Algoritmos y problemas a resolver: enseñar a un robot a caminar (Q-learning), entrenar a un programa para jugar ajedrez (métodos de gradiente de políticas)
Este es el proceso de seleccionar información importante (características) a partir de datos sin procesar para ayudar al programa a aprender mejor. A veces, esto incluye la creación de nuevas características utilizando conocimientos expertos y creatividad.
Ejemplo: utilizar el largo y el ancho de una hoja para ayudar a identificar una especie de planta
Es importante comprobar el rendimiento de un modelo de aprendizaje automático para saber si funciona bien. Para comprobar el rendimiento de un modelo se suelen utilizar mediciones como exactitud, precisión, recuperación, puntuación F1 y error cuadrático medio.
⏲️Quedan 24 segundos, ¡va bien!
¡Cubramos también el aprendizaje profundo!
Esto es realmente abstracto. Podemos imaginar una red neuronal como neuronas cerebrales ordenadas en columnas y que se envían señales entre sí de izquierda a derecha con diferente fuerza (a través de conexiones): la fuerza con la que se envía una señal a una neurona (en cada capa) define el próximo ping y, por lo tanto, el resultado final.
Algoritmos y problemas a resolver: reconocimiento de objetos en imágenes (redes neuronales feedforward), traducción de idiomas (redes de función de base radial)
Cuando cometes un error, aprendes de él y tratas de no repetirlo. La retropropagación es una forma en que un programa puede hacer lo mismo.
Ayuda al programa a comprender dónde salió mal y a encontrar mejor las respuestas correctas.
Las CNN son redes neuronales especiales que pueden comprender datos en forma de cuadrícula, como imágenes.
Tienen capas que les ayudan a aprender patrones y reconocer partes de la imagen, como líneas y formas.
Algoritmos y problemas a resolver: detección de rostros en fotografías (LeNet-5), identificación de diferentes tipos de animales en imágenes (AlexNet, VGG)
Las RNN están diseñadas para trabajar con datos que vienen en una secuencia, como una serie de números o palabras.
Pueden recordar entradas anteriores y usar esa información para tomar mejores decisiones.
Algoritmos y problemas a resolver: predicción de precios de acciones (Long Short-Term Memory, LSTM), generación de texto basado en un estilo determinado (Gated Recurrent Units, GRU)
Esto es cuando un modelo de programa que ya ha aprendido mucho se perfecciona para trabajar en una nueva tarea con datos limitados.
Ayuda al programa a aprender más rápido y a desempeñarse mejor porque ya sabe cosas útiles de su aprendizaje previo.
Ejemplo: utilizar un modelo entrenado con muchas razas de perros (como ResNet) para reconocer tipos específicos de gatos
Estas técnicas ayudan al programa a evitar aprender demasiado de los datos, lo que puede causar problemas como sobreajuste.
Terminado en: 0 min, 52 seg
Básicamente esto es todo, ahora ve y entrena a tus agentes Kelvin buscando en Google implementaciones de algoritmos y problemas que quieres resolver.
Para empezar a utilizar una herramienta, hay que empezar con un problema que la herramienta resuelve y aprender qué conceptos se utilizan para resolverlo. No hay que mantener la implementación en la cabeza, como "cómo hacer algo con una herramienta", es complicado y, de todos modos, no todo cabe en la cabeza.
Aprenda ideas, implementaciones de Google.
Después de buscar en Google una implementación entre 5 y 10 veces, la memorizarás, luego la tecnología se vuelve obsoleta y la olvidas, está bien, sucede todo el tiempo.
Las ideas son difíciles de olvidar, quedan en tu memoria durante mucho tiempo.
Adios y nos vemos en la próxima carrera de aceleración.
¡Espera un momento!
Piensa en seguir al pájaro twit si quieres ver sistemas educativos que prioricen la práctica y sean beneficiosos <3
De todos modos puedes seguir twitter si simplemente te gustó el texto y quieres más o eres adicto a la diversión en las redes sociales.
o no sigas a nadie y no escuches a nadie! haz tu propio camino!
En realidad quiero que sigáis mis twits, fue solo una venta.
Consulta mi artículo "Aprende REACT en 43 segundos"