850 leituras

Uma introdução ao aprendizado ativo

por Louis Bouchard3m2023/06/18

Muito longo; Para ler

O aprendizado ativo visa otimizar a anotação do seu conjunto de dados e treinar o melhor modelo possível usando a menor quantidade de dados de treinamento. É uma abordagem de aprendizado supervisionado que envolve um processo iterativo entre as previsões de seu modelo e seus dados. Ao anotar menos imagens em geral, você economiza tempo e dinheiro enquanto obtém um modelo otimizado.

featured image - Uma introdução ao aprendizado ativo

No mundo de hoje, temos acesso a uma enorme quantidade de dados, graças a poderosos modelos de IA como o ChatGPT , bem como modelos de visão e outras tecnologias semelhantes. No entanto, não se trata apenas da quantidade de dados de que esses modelos dependem, mas também da qualidade. Criar um bom conjunto de dados rapidamente e em escala pode ser uma tarefa desafiadora e cara.

É aí que entra o aprendizado ativo.

Em termos simples, o aprendizado ativo visa otimizar a anotação do seu conjunto de dados e treinar o melhor modelo possível usando a menor quantidade de dados de treinamento.

É uma abordagem de aprendizado supervisionado que envolve um processo iterativo entre as previsões de seu modelo e seus dados. Em vez de esperar por um conjunto de dados completo, você pode começar com um pequeno lote de dados anotados selecionados e treinar seu modelo com eles.

Em seguida, usando o aprendizado ativo, você pode aproveitar seu modelo para rotular dados não vistos, avaliar a precisão das previsões e selecionar o próximo conjunto de dados para anotar com base nas funções de aquisição.

Uma vantagem do aprendizado ativo é que você pode analisar o nível de confiança das previsões do seu modelo.

Se uma previsão tiver baixa confiança, o modelo solicitará imagens adicionais desse tipo para serem rotuladas. Por outro lado, as previsões com alta confiança não exigirão mais dados. Ao anotar menos imagens em geral, você economiza tempo e dinheiro enquanto obtém um modelo otimizado. A aprendizagem ativa é uma abordagem altamente promissora para trabalhar com conjuntos de dados de grande escala.

Existem alguns pontos-chave a serem lembrados sobre o aprendizado ativo.

Primeiro, envolve anotação humana, dando a você controle sobre a qualidade das previsões do seu modelo. Não é uma caixa preta treinada em milhões de imagens. Você participa ativamente de seu desenvolvimento e auxilia na melhoria de seu desempenho. Esse aspecto torna o aprendizado ativo importante e interessante, embora possa aumentar os custos em comparação com abordagens não supervisionadas. No entanto, o tempo economizado no treinamento e na implantação do modelo geralmente supera esses custos.

Além disso, você pode usar ferramentas de anotações automáticas e corrigi-las manualmente, reduzindo ainda mais os gastos.

No aprendizado ativo, você tem um conjunto rotulado de dados no qual seu modelo é treinado, enquanto o conjunto não rotulado contém dados potenciais que ainda não foram anotados. Um conceito crucial são as estratégias de consulta, que determinam quais dados rotular. Existem várias abordagens para encontrar os subconjuntos mais informativos no grande conjunto de dados não rotulados. Por exemplo, a amostragem de incerteza envolve testar seu modelo em dados não rotulados e selecionar os exemplos classificados com menos confiança para anotação.

Outra técnica de aprendizado ativo é a Consulta por Comitê (QBC) , em que vários modelos, cada um treinado em um subconjunto diferente de dados rotulados, formam um comitê. Esses modelos têm perspectivas distintas sobre o problema de classificação, assim como pessoas com diferentes experiências têm entendimentos variados de certos conceitos. Os dados a serem anotados são selecionados com base na discordância entre os modelos de comitês, indicando complexidade. Este processo iterativo continua enquanto os dados selecionados são anotados continuamente.

Esta é apenas uma explicação básica do aprendizado ativo, mostrando um exemplo de estratégia de consulta.

Se você estiver interessado, posso fornecer mais informações ou vídeos sobre outras estratégias de aprendizado de máquina. Um exemplo real de aprendizagem ativa é quando você responde captchas no Google. Ao fazer isso, você os ajuda a identificar imagens complexas e a criar conjuntos de dados com a entrada coletiva de vários usuários, garantindo a qualidade do conjunto de dados e a verificação humana. Portanto, da próxima vez que encontrar um captcha, lembre-se de que está contribuindo para o progresso dos modelos de IA!