primeiro inscreva-se no meu twitter , eu tuíto coisas de tecnologia
Mais uma speedrun na série , vamos lá
Acabei de usar o meme de aprendizagem por reforço (RL) em você:
Que isca era essa... meu Deus...
Então, por que é difícil para o meme-Kelvin aprender o que é RL? Porque ele quer aprender a implementação de RL em vez de entender o Conceito , É POR ISSO que o meme-KELVIN!
Quando você aprende uma coisa nova, ferramenta, tecnologia ou qualquer coisa — você NÃO começa com suas implementações, você começa com ideias, conceitos e problemas que a ferramenta resolve!
Olá Kelvin, aqui vai: Para entender o Aprendizado por Reforço (AR) — pense em jogar um videogame em que você ganha pontos por fazer os movimentos certos.
O aprendizado por reforço é assim: um programa aprende tomando decisões e obtendo recompensas ou penalidades com base em suas ações.
Esse foi apenas um exemplo de aplicação do princípio START-WITH-IDEAS ao Reinforcement Learning. Mas eu prometi contar como aprender o ML inteiro em 52 segundos...
Para aprender ML em 52 segundos, você aprende os conceitos de ML, não as implementações . Depois, você pesquisa no Google (ou no GPT) implementações em PyTorch ou qualquer nome de biblioteca que você goste. De qualquer forma, isso vai mudar no próximo ano e está tudo bem, as ideias permanecerão as mesmas por muito mais tempo — vá atrás das ideias!
No aprendizado supervisionado, um programa é ensinado usando exemplos com respostas (chamados de dados rotulados). Isso ajuda o programa a aprender a conexão entre os exemplos e as respostas, para que ele possa adivinhar as respostas para novos exemplos que não viu antes.
Algoritmos e problemas a resolver: previsão de preços de casas (regressão linear), decisão sobre se um cliente comprará um produto (árvores de decisão)
Aqui, o programa olha para exemplos sem respostas (dados não rotulados) e tenta encontrar padrões ou grupos dentro deles. Isso pode ajudar com tarefas como agrupar itens semelhantes ou reduzir a quantidade de informações necessárias para descrever os dados.
Algoritmos e problemas a resolver: agrupar pessoas com gostos musicais semelhantes (agrupamento k-means), comprimir imagens sem perder muita informação (análise de componentes principais)
No aprendizado por reforço, o programa aprende a tomar decisões ao tentar coisas e obter feedback na forma de recompensas ou penalidades. O objetivo é tomar melhores decisões ao longo do tempo e resolver problemas de forma mais eficaz.
Algoritmos e problemas para resolver: ensinar um robô a andar (Q-learning), treinar um programa para jogar xadrez (métodos de gradiente de política)
Este é o processo de escolher informações importantes (recursos) de dados brutos para ajudar o programa a aprender melhor. Às vezes, isso inclui criar novos recursos usando conhecimento especializado e criatividade.
Exemplo: usar o comprimento e a largura de uma folha para ajudar a identificar uma espécie de planta
Verificar o quão bem um modelo de machine learning está indo é importante para ver se ele está funcionando bem. Medidas como exatidão, exatidão, recall, pontuação F1 e erro quadrático médio são frequentemente usadas para verificar o desempenho de um modelo.
⏲️ Restam 24 segundos, você vai bem!
Vamos também abordar o Deep Learning!
Isso é realmente abstrato. Você pode imaginar uma NN como neurônios cerebrais ordenados em colunas e fazendo ping uns nos outros da esquerda para a direita com força diferente (por meio de conexões) — a força com que um neurônio (em cada camada) é pingado define o próximo ping e, portanto, o resultado final em si.
Algoritmos e problemas a resolver: reconhecimento de objetos em imagens (redes neurais feedforward), tradução de línguas (redes de funções de base radial)
Quando você comete um erro, você aprende com ele e tenta não repeti-lo. Backpropagation é uma maneira de um programa fazer a mesma coisa.
Ajuda o programa a entender onde errou e a melhorar sua capacidade de encontrar as respostas certas.
CNNs são redes neurais especiais que podem entender dados em forma de grade, como imagens.
Eles têm camadas que os ajudam a aprender padrões e reconhecer partes da imagem, como linhas e formas.
Algoritmos e problemas a resolver: detecção de rostos em fotos (LeNet-5), identificação de diferentes tipos de animais em imagens (AlexNet, VGG)
As RNNs são projetadas para trabalhar com dados que vêm em uma sequência, como uma série de números ou palavras.
Eles podem se lembrar de informações anteriores e usar essas informações para tomar melhores decisões.
Algoritmos e problemas a resolver: previsão de preços de ações (Long Short-Term Memory, LSTM), geração de texto com base em um determinado estilo (Gated Recurrent Units, GRU)
É quando um modelo de programa que já aprendeu muito é ajustado para trabalhar em uma nova tarefa com dados limitados.
Isso ajuda o programa a aprender mais rápido e a ter um desempenho melhor porque ele já sabe coisas úteis de seu aprendizado anterior.
Exemplo: usar um modelo treinado em muitas raças de cães (como o ResNet) para reconhecer tipos específicos de gatos
Essas técnicas ajudam o programa a evitar aprender muito com os dados, o que pode causar problemas como overfitting
concluído em: 0 min, 52 seg
É basicamente isso, agora vá e treine seus agentes pesquisando no Google implementações de algoritmos e problemas que você quer resolver!
Para começar a usar uma ferramenta, você começa com um problema que a ferramenta resolve e aprende quais Conceitos são usados para resolver o problema. Não mantenha a implementação na sua cabeça como "como fazer algo com uma ferramenta", é complicado e tudo não vai caber na sua cabeça de qualquer maneira.
Aprenda ideias, pesquise implementações no Google.
Depois de 5 a 10 vezes pesquisando uma implementação no Google, você a memorizará, então a tecnologia se tornará obsoleta e você a esquecerá, tudo bem, isso acontece o tempo todo
As ideias são difíceis de esquecer, elas ficam na sua memória por muito tempo
Tchau e até a próxima corrida de arrancada
Espere akshually!
Pense em seguir o pássaro do Twitter se você quiser ver sistemas educacionais que sejam práticos e benéficos <3
De qualquer forma, você pode seguir o Twitter se gostou do texto e quer mais ou se é viciado em diversão nas redes sociais
ou não siga ninguém e não dê ouvidos a ninguém! Faça seu próprio caminho!
Na verdade, eu quero que você siga meus twitts, foi só uma promoção.
Confira meu "Aprenda REACT em 43 segundos"