paint-brush
Como usar o Hasdx para criar um livro de colorir adulto gerado por IApor@mikeyoung44
4,743 leituras
4,743 leituras

Como usar o Hasdx para criar um livro de colorir adulto gerado por IA

por Mike Young9m2023/08/02
Read on Terminal Reader

Muito longo; Para ler

Como usar IA para gerar um livro de colorir adulto usando o modelo Hasdx e um upscaler.
featured image - Como usar o Hasdx para criar um livro de colorir adulto gerado por IA
Mike Young HackerNoon profile picture
0-item

Os livros de colorir para adultos oferecem uma maneira relaxante e meditativa de descontrair que aumentou em popularidade nos últimos anos. Mas a seleção nas lojas tende a se concentrar em padrões e formas genéricas.


E, se você tem sua própria ideia para algum conteúdo interessante, não tem uma maneira fácil de fazer seu próprio livro de colorir, digamos, para seus amigos, a menos que esteja disposto a contratar um artista ou criar cada desenho detalhado sozinho.


Bem, e se eu dissesse que existe realmente uma maneira de contornar esse problema?


Se inscrever ou siga-me no Twitter para mais conteúdos como este!


Acontece que existe. Novos modelos de geração de imagens de IA, como DALL-E 2 , meio da jornada , e Difusão estável fornecem uma maneira fácil de criar infinitas páginas exclusivas de livros para colorir para adultos, personalizadas para qualquer tema ou interesse.


Com o modelo certo (ou cadeia de modelos... mais sobre isso depois) e o prompt certo, você pode obter imagens perfeitamente detalhadas para sua ideia de livro de colorir.


Neste artigo, exploraremos como aproveitar o poder da IA para criar livros de colorir personalizados que os adultos vão adorar.


Vamos dar uma olhada de perto no modelo hasdx para este aplicativo, explore alguns prompts de exemplo, estude as entradas e saídas do modelo, experimente-o usando uma IU da Web e veja como podemos acoplá-lo a um upscaler como Real-ESRGAN, GFPGAN ou Codeformer para obter resultados ainda melhores.


Também veremos como podemos modificar o prompt para variar o nível de complexidade da imagem, adaptando efetivamente nosso modelo ao nível de habilidade do adulto (ou criança) que estiver segurando os gizes de cera.


Vamos indo.


Visão geral e introdução ao Hasdx

Modelos recentes de IA, como DALL-E 2, Midjourney e Stable Diffusion, usam várias técnicas de IA para gerar imagens notavelmente realistas e diversas a partir de prompts de texto. Eles são treinados em enormes conjuntos de dados de imagens e texto para "aprender" associações entre palavras e conceitos visuais.


Ao inserir o prompt correto, você pode orientar esses modelos para criar ilustrações personalizadas adequadas para livros de colorir.


Para o nosso projeto de livro de colorir para adultos, usaremos Hasdx (originalmente no Civitai). Veremos especificamente uma implementação de Hasdx criada por cjwbw e hospedado em replicar .


Escolhi o Hasdx especificamente porque é uma versão aprimorada do Stable Diffusion, que permite produzir imagens variadas e de alta qualidade, perfeitas para livros de colorir.



Como Hasdx foi desenvolvido? Por que usá-lo?

Difusão estável , desenvolvido por meio de uma colaboração entre pesquisadores acadêmicos e organizações sem fins lucrativos, provocou uma revolução na geração de imagens de IA.


À medida que os criadores começaram a experimentar o Stable Diffusion, surgiram modelos especializados que buscavam aprimorar aspectos como qualidade de imagem e controle de treinamento.


Um desses modelos foi o HuggingFace Vintedois Diffusion V0 1 modelo por criador 22h , também disponível em replicar . Ao ajustar a difusão estável em um conjunto de dados diversificado, a 22h desenvolveu um modelo versátil de uso geral especializado na geração de imagens detalhadas.


Mais ou menos no mesmo período, dois modelos de checkpoint ganharam reconhecimento por suas capacidades artísticas - sxd-berrymix-merge e handas-3dkx10b . O Sxd-berrymix-merge, feito pelo artista de IA EMAD, combinou pontos de verificação de difusão estável anteriores e aplicou treinamento de precisão adicional focado em melhorar recursos faciais, iluminação e realismo de cores.


Como resultado, ele se destaca em imagens humanas fotorrealistas. Enquanto isso, o handas-3dkx10b, criado pelo artista digital handas2077, empregou técnicas de modelagem 3D para obter detalhes e precisão excepcionais.


Identificando uma oportunidade de sinergia, desenvolvedor bestjammer fundiu esses modelos. Ao combinar a versatilidade do Vintedois Diffusion com os talentos de retrato do sxd-berrymix-merge e a precisão do handas-3dkx10b, o bestjammer criou o Hasdx - um modelo de 7,2 GB que equilibra capacidade geral com arte especializada.


Ao contrário de seus predecessores complexos, o Hasdx enfatizou simplicidade, flexibilidade e resultados de alta fidelidade. Isso o tornou atraente para aplicações criativas, como a geração de ilustrações de livros para colorir para adultos, em que designs intrincados podem se beneficiar dos detalhes do Hasdx sem a necessidade de instruções demoradas.


Para usuários de todos os níveis de habilidade, o Hasdx trouxe a geração de imagens de nível profissional ao seu alcance.

Como interagir com o Hasdx usando a IU de demonstração de replicação

Se você quiser seguir as etapas deste guia e tentar gerar uma imagem de livro para colorir adulto com o Hasdx ao meu lado, a maneira mais rápida e simples de começar é usar para Replicar a IU de demonstração. Veja como acessá-lo:


  • Vá para a página de detalhes do modelo para Hasdx em AImodels.fyi


  • Na coluna à direita, encontre o link Replicar demonstração ( "Model Link" -> "View on Replicate" )


  • Crie uma conta Replicate e escolha a guia "Demo" na página Hasdx


  • Interaja diretamente com os campos de prompt conforme necessário e clique em "gerar" para testar suas entradas.


Você também pode ler mais sobre como interagir com o modelo no guia completo do modelo Hasdx .

Entradas e saídas Hasdx

Ao usar o Hasdx para um projeto de livro de colorir para adultos, existem algumas entradas importantes que você pode ajustar. Vamos nos concentrar no prompt na próxima seção, mas para sermos completos, aqui está uma lista de todos os parâmetros com os quais você pode brincar.


  • prompt - Aqui é onde você fornece o prompt de texto descrevendo o que deseja que o AI gere. Para um livro adulto, concentre-se em temas e detalhes intrincados.


  • negativa_prompt - Especifique qualquer coisa que você deseja que a imagem evite, como texto ou objetos de fundo que distraem.


  • largura/altura - Hasdx funciona melhor em altas resoluções como 768x768. Tamanhos maiores capturam mais detalhes.


  • num_inference_steps - Cerca de 80 etapas renderizam bem os detalhes sem demorar muito.


  • guidance_scale - Mantenha alto, como 9-10, para que as saídas sigam o prompt.


  • seed - Altere a seed para obter variação entre prompts idênticos.


As principais saídas do Hasdx serão imagens PNG de alta resolução correspondentes aos detalhes do prompt. Com os prompts corretos (mostrados abaixo), a IA gerará ilustrações nítidas e intrincadas, perfeitas para páginas imprimíveis de livros para colorir para adultos.


Se você estiver usando Replicate para interagir com o modelo (como faremos neste exemplo), a saída será semelhante a esta:


 { "type": "array", "items": { "type": "string", "format": "uri" }, "title": "Output" }

Criando o prompt

A chave para gerar ótimas imagens com IA é criar cuidadosamente o prompt de texto. Para livros de colorir, queremos desenhos simples em preto e branco com contornos grossos.


Aqui está uma estrutura rápida que funciona bem, inspirada no método de Chase Lean Tópico do Twitter sobre como criar desenhos de livros infantis usando Midjourney.


 adult coloring book, cartoon, [theme], intricate details, advanced patterns, black and white


Substitua [theme] por qualquer coisa que você queira ilustrar - animais, veículos, alimentos, etc. Vamos tentar alguns exemplos:


  • livro de colorir para adultos, desenhos animados, flores delicadas, detalhes intrincados, padrões avançados, preto e branco


  • livro de colorir para adultos, desenho animado, belo guerreiro, detalhes intrincados, padrões avançados, preto e branco


  • livro de colorir para adultos, desenhos animados, edifícios art déco, detalhes intrincados, padrões avançados, preto e branco


Você também ganhará muito definindo um prompt negativo. Aqui está o que eu usei:

  • cor, foto, fax, Captura de tela, fronteira, embaçado, granulado


Você pode definir os outros parâmetros que revi acima. Aqui está um exemplo completo que eu acho que tem uma saída muito boa.


  • Prompt: livro de colorir para adultos, desenho animado, belo guerreiro, detalhes intrincados, padrões avançados, preto e branco
  • Prompt negativo: foto, fax, captura de tela, borda, embaçado, granulado
  • Largura: 512
  • Altura: 512
  • Número de saídas: 1
  • Número de etapas de inferência: 185
  • Escala de Orientação: 12
  • Agendador: DPMSolverMultistep
  • Semente: nenhum (em branco)



Ajustando a Complexidade

Também podemos ajustar a complexidade das imagens geradas. Para livros adultos, detalhes intrincados e padrões avançados são os preferidos. Os livros infantis, por outro lado, costumam privilegiar imagens mais simples devido ao nível de habilidade motora fina de seus leitores.


Para fazer ilustrações mais básicas para livros infantis mais simples, considere mudando o prompt ter elementos que evocam estilos mais simples:

 b/w outline art for kids coloring book page, rabbit, Kids coloring pages, full white, kids style, white background, whole body, Sketch style, full body (((((white background))))), only use outline. , cartoon style, line art, coloring book, clean line art, white background, Sketch style


(Prompt original do prompthero )



Experimente diferentes valores de estilo para obter o nível certo de detalhe. Mas lembre-se, a maioria dos adultos gosta de complexidade avançada.

Aumentando a escala da imagem

Você pode achar a imagem resultante gerada pelo Hasdx um pouco embaçada, especialmente se precisar aumentá-la para ser maior para um livro que gostaria de imprimir.


Felizmente, você pode executar suas saídas por meio de outro modelo para obter um arquivo ainda melhor. Esses modelos são chamados de upscalers e existem muitas opções populares:


  • ESRGAN : Oferece excelentes resultados para degradação simulada ideal. Esse modelo funcionaria bem para restaurar imagens sintéticas como as que estamos criando com o Hasdx.



  • Codeformer: Um robusto algoritmo de restauração facial projetado para funcionar com fotos antigas e rostos gerados por IA. Funcionaria bem para limpar artefatos estranhos em gerações do tipo retrato para livros de colorir.



Aqui está um exemplo que mostra como a execução da primeira saída de exemplo por meio do Real-ESRGAN resulta em uma imagem de melhor qualidade:



Os resultados são bastante sutis, mas depois de ver a imagem aprimorada e o original lado a lado, você pode ver como as linhas aprimoradas facilitam a coloração da imagem - menos áreas cinzas e limites mais nítidos são ótimos para esse tipo de aplicativo.

Gerando um Livro Completo

Depois de aperfeiçoar seus prompts e praticar o upscaling de imagens, você está basicamente pronto. Agora você pode gerar o conjunto completo de ilustrações para o seu livro seguindo este processo geral:


  • Faça uma lista de temas e tópicos que deseja incluir.


  • Crie um prompt para cada um usando a fórmula acima, ajustando o estilo conforme necessário. Considere usar uma semente para manter os estilos consistentes.


  • Refine quaisquer ilustrações que não tenham detalhes suficientes. Use um upscaler para melhorá-los.


  • Organize as imagens finais em páginas imprimíveis usando o software de publicação.


E é isso - agora você tem um livro de colorir adulto personalizado gerado por IA! A enorme variedade de imagens intrincadamente detalhadas que esses modelos podem criar facilita a adaptação do livro a qualquer estilo e assunto.

Conclusão

O uso da IA para criar livros de colorir personalizados para adultos é uma nova e empolgante aplicação de modelos de imagens generativas. Como vimos, ferramentas como Hasdx fornecem uma fonte inesgotável de ilustrações únicas e intrincadas para criar livros altamente personalizados.


Aqui estão algumas das principais conclusões depois de passar por todo esse processo:

  • Modelos recentes de IA, como Stable Diffusion, permitem gerar imagens personalizadas por meio de prompts de texto cuidadosamente elaborados. O ajuste fino produz modelos especializados como Hasdx adaptados para necessidades criativas específicas.


  • Hasdx equilibra recursos gerais com foco em realismo e detalhes. Isso o torna adequado para imagens detalhadas de livros para colorir para adultos.


  • A estrutura do prompt oferece controle preciso sobre o tema e a complexidade das ilustrações geradas. Prompts negativos ajudam a evitar elementos indesejáveis.


  • A execução de saídas Hasdx por meio de modelos de upscaling melhora a qualidade da impressão. ESRGAN e outros aprimoram detalhes e linhas.


  • A enorme variedade de ilustrações possíveis torna os livros personalizados fáceis de adaptar a estilos e interesses individuais.


  • A IA parece prestes a se tornar um divisor de águas ao permitir que os criadores criem livros de colorir exclusivos e outros produtos personalizados baseados em imagens.


O mundo da IA generativa está evoluindo rapidamente. À medida que os modelos continuam a melhorar em capacidade e acessibilidade, é provável que vejamos muitos outros aplicativos emergentes, como livros de colorir personalizados para adultos. O futuro parece brilhante para alavancar a criatividade da IA! Obrigado por ler.


Se inscrever ou siga-me no Twitter para mais conteúdos como este!

Recursos e leitura adicional

Aqui estão alguns recursos úteis que você pode querer dar uma olhada enquanto trabalha em seu projeto de livro de colorir para adultos baseado em IA:


  • modelo hasdx - Modelo de difusão estável misto otimizado para criatividade





  • GFPGAN - Modelo de restauração facial AI


  • PromptHero - Ferramenta para otimizar prompts de texto



Também publicado aqui