O BlobGAN permite a manipulação irreal de imagens, tornando o controle de blobs simples super fácil. Todas essas pequenas bolhas representam um objeto, e você pode movê-las ou aumentá-las, diminuí-las ou até removê-las, e terá o mesmo efeito no objeto que representa na imagem. Isso é tão legal! Como os autores compartilharam em seus resultados, você pode até criar novas imagens duplicando blobs, criando imagens invisíveis no conjunto de dados ! Corrija-me se eu estiver errado, mas acredito que é um dos, se não o primeiro, papel a tornar a modificação de imagens tão simples quanto mover blobs e permitir edições que não foram vistas no conjunto de dados de treinamento. como uma sala com dois ventiladores de teto E você pode realmente jogar com este em comparação com algumas empresas que todos conhecemos! Eles compartilharam seu código publicamente e uma demonstração do Colab que você pode experimentar imediatamente. Ainda mais empolgante é como o BlobGAN funciona. Saiba mais no vídeo! Assista o vídeo Referências ►Leia o artigo completo: ►Epstein, D., Park, T., Zhang, R., Shechtman, E. e Efros, AA, 2022. BlobGAN: Representações de cenas espacialmente desembaraçadas. pré-impressão do arXiv arXiv:2205.02837. ►Link do projeto: ►Código: ►Colab Demo: ►Meu boletim informativo (um novo aplicativo de IA explicado semanalmente para seus e-mails!): https://www.louisbouchard.ai/blobgan/ https://dave.ml/blobgan/ https://github.com/dave-epstein/blobgan https://colab.research.google.com/drive/1clvh28Yds5CvKsYYENGLS3iIIrlZK4xO?usp=sharing#scrollTo=0QuVIyVplOKu https://www.louisbouchard.ai/newsletter/ Transcrição de vídeo 0:00 se você acha que o progresso com armas 0:02 acabou você não poderia estar mais errado 0:04 aqui está a arma blob e este novo papel é 0:07 uma incrível arma de bolhas permite 0:09 manipulação irreal de imagens feitas super 0:12 controlando facilmente todos os blobs simples 0:14 essas pequenas bolhas representam um objeto 0:17 e você pode movê-los e torná-los 0:19 maior menor ou mesmo removê-los e 0:22 terá o mesmo efeito no 0:24 objeto que representa na imagem este 0:26 é tão legal quanto os autores compartilharam em 0:29 seus resultados, você pode até criar novos 0:31 imagens duplicando blubs criando 0:34 imagens não vistas no conjunto de dados como este 0:37 quarto com dois ventiladores de teto me corrija se 0:40 eu estou errado, mas eu acredito que é um dos se 0:42 não é o primeiro jornal a fazer o 0:44 modificação de imagens tão simples quanto 0:46 movendo bolhas ao redor e permitindo 0:49 edições que não foram vistas no treinamento 0:51 conjunto de dados e você pode realmente brincar com 0:53 esta em comparação com outras empresas que 0:55 todos sabem que compartilharam são chamados publicamente 0:58 e uma demonstração de colaboração que você pode experimentar imediatamente 1:00 ainda mais emocionante é como o bloggian funciona 1:03 no qual vamos mergulhar em alguns segundos 1:05 publicar um excelente artigo como 1:07 blobgun que os pesquisadores precisavam executar 1:09 muitos experimentos em várias máquinas 1:12 quem brincou com armas sabe quanto tempo 1:14 e doloroso este processo pode ser positivo 1:16 seu código está disponível no github e 1:18 colaboração do Google, isso significa que o código deles 1:21 para ser reproduzível, curiosamente, isso 1:24 também é um ponto muito forte disso 1:26 pesos e vieses do patrocinador do episódio 1:28 pesos e preconceitos mudam minha vida como um 1:30 pesquisador ele rastreia tudo que você precisa 1:32 para que seu código seja reproduzível, o 1:34 hiperparâmetros do github commit 1:36 métricas de uso de hardware e o python 1:38 versão te deixando sem dores de cabeça ok 1:41 alguns ainda podem aparecer por causa de 1:43 prazos ou bugs, mas nenhum de tentar 1:45 para reproduzir experimentos pesos e 1:47 preconceitos também é super útil quando 1:49 compartilhando os resultados de sua experiência com 1:51 seus colegas uma ótima ferramenta para isso é 1:53 relatórios, eles podem atuar como painéis para 1:56 supervisor pis ou gerentes para verificar como 1:59 experimentação está indo significando mais 2:01 tempo para pesquisa enquanto melhora seu 2:03 a qualidade do feedback, por favor, não seja como 2:06 a maioria dos pesquisadores que mantêm seu código 2:08 segredo e tente usar pesos e vieses 2:10 com o primeiro link abaixo 2:13 agora vamos voltar para nossa arma de papel blub 2:16 cena espacialmente desembaraçada 2:18 representações o título diz ital 2:21 blovkian usa bolhas para desembaraçar 2:23 objetos em uma cena, o que significa que o 2:25 modelo aprende a associar cada blob com 2:28 um objeto específico na cena como um 2:30 janela da cama ou ventilador de teto uma vez treinado 2:33 você pode mover os blobs e objetos 2:35 ao redor individualmente torná-los maiores ou 2:37 menor duplicá-los ou até mesmo remover 2:40 eles da foto, claro, o 2:42 resultados não são totalmente realistas, mas 2:44 como uma grande pessoa diria apenas imagine 2:47 o potencial desta abordagem mais dois 2:49 papéis abaixo da linha 2:51 o que é ainda mais legal é que esse treinamento 2:53 ocorre em um esquema não supervisionado este 2:55 significa que você não precisa de cada 2:57 exemplo de imagem para treiná-lo como você faria 3:00 no aprendizado supervisionado um exemplo rápido 3:02 é que o treinamento supervisionado exigirá 3:05 você tenha todos os desejados 3:06 manipulações em sua imagem que são definidas 3:08 ensinar blobs a aprender aqueles 3:10 transformações enquanto em não supervisionado 3:13 aprendendo que você não precisa deste extenso 3:15 dados e o modelo aprenderá a alcançar 3:17 esta tarefa por si só associando blefes 3:20 a objetos por conta própria sem explícito 3:22 rótulos treinamos o modelo com um 3:24 gerador e um discriminador em uma arma 3:27 moda vou simplesmente fazer um rápido 3:28 visão geral como eu cobri armas em 3:30 inúmeros vídeos antes como sempre em armas 3:33 a responsabilidade do discriminador é 3:35 treine o gerador para criar realista 3:38 imagens a parte mais importante do 3:40 arquitetura é o gerador com o nosso 3:42 blobs and a style gun 2 like decoder i 3:45 também cobriu geradores baseados em armas de estilo 3:48 em outros vídeos se você está curioso sobre 3:50 como funciona, mas em resumo, primeiro 3:52 criar nossos blobs isso é feito tomando 3:55 ruído aleatório como na maioria dos geradores 3:57 redes e mapeando-as em blobs usando 4:00 uma primeira rede neural isso será 4:02 aprendeu durante o treinamento, então você precisa 4:05 faça o impossível pegue esse blob 4:07 representação e criar uma imagem real 4:10 fora disso é onde a magia gan 4:12 acontece porque você ainda está ouvindo 4:14 considere se inscrever no 4:16 canal e curtir o vídeo significa um 4:18 muito e apóia meu trabalho de graça também 4:21 temos uma comunidade chamada aprender ai 4:23 juntos no discord para aprender troca 4:26 com outros entusiastas de IA, estou convencido 4:28 você vai adorar lá e eu ficarei feliz 4:30 para conhecê-lo 4:32 precisamos de uma arma estelar como arquitetura para 4:34 criar nossas imagens a partir dessas bolhas de 4:37 curso adicionamos a arquitetura para levar 4:39 os blobs que acabamos de criar como entradas 4:41 em vez do ruído aleatório usual 4:43 então viramos nosso modelo usando o 4:45 discriminador para aprender a gerar 4:47 imagens realistas assim que tivermos boas 4:50 resultados suficientes significa que nosso modelo pode 4:52 assumir a representação de blob em vez de 4:54 ruído e gerar imagens, mas ainda 4:57 tem um problema como podemos desemaranhar 4:59 esses blobs e fazê-los combinar objetos 5:02 bem, esta é a beleza do nosso 5:04 abordagem não supervisionada, o modelo irá 5:06 melhorar iterativamente e criar realistas 5:08 resultados enquanto aprende a 5:11 representam essas imagens na forma de um 5:13 número fixo de blobs que você pode ver aqui 5:15 como os blubs costumam ser usados para representar 5:17 os mesmos objetos ou objetos muito semelhantes 5:20 na cena aqui você também pode ver como 5:22 as mesmas luvas são usadas para representar 5:24 uma janela ou uma pintura que 5:26 faz muito sentido da mesma forma que você pode 5:29 veja que a luz é quase sempre 5:31 representado no forte blub de forma semelhante 5:33 você pode ver como os blubs são frequentemente 5:35 representando as mesmas regiões do 5:37 cena certamente leva você para o 5:39 semelhanças de imagens no conjunto de dados 5:42 usado para este experimento e pronto 5:45 é como o blobgan aprende a manipular 5:47 cenas usando um blob muito intuitivo 5:50 representação estou animado para ver o 5:52 realismo dos resultados melhoram mantendo uma 5:54 abordagem semelhante usando tal técnica 5:57 poderíamos criar aplicativos interativos simples 5:59 para permitir que designers e qualquer pessoa 6:01 manipular imagens facilmente, o que é bastante 6:04 emocionante é claro que isso foi apenas um 6:06 visão geral deste novo papel e eu 6:08 recomendo vivamente a leitura do seu papel 6:10 para uma melhor compreensão e muito 6:12 mais detalhes sobre sua abordagem 6:13 implementação e testes que eles fizeram como eu 6:16 disse anteriormente no vídeo eles também 6:18 compartilhou seu código publicamente e uma cor 6:20 demo você pode experimentar imediatamente todos os 6:22 os links estão na descrição abaixo 6:24 obrigado por assistir até o final e 6:27 vejo você na próxima semana com outro 6:28 papel incrível [Música]