Quer saber como construir um analisador de imagens de IA? Então leia este artigo até o fim! Vou mostrar como construir ferramentas de análise de IA de maneira muito simples, para que você quase não precise ter nenhum conhecimento prévio. Vou guiá-lo passo a passo e usaremos o Project IDX e a API Gemini. Isso significa que você não precisa configurar nada; tudo o que faremos está na nuvem. Se você estiver pronto, vamos começar!
O primeiro passo é bem simples. Precisamos abrir o site
Escolha um modelo: escolherei o modelo API Gemini.
Dê um nome ao seu projeto: vou chamá-lo de “teste 2024”.
Selecione Ambiente: escolherei "Vite", que é um ambiente de aplicação web JavaScript.
Crie o Projeto: Pressione o botão Criar.
Depois de alguns minutos, o IDX criará tudo para nós e veremos nossos arquivos de modelo, que podemos modificar como quisermos.
Este é o nosso arquivo index.html. Podemos modificá-lo da maneira que quisermos, mas vamos primeiro dar uma olhada nisso. O modelo inicial contém quase tudo que precisamos. Este modelo usa o modelo Gemini 1.5 flash, então é mais que suficiente para nós.
Como você pode ver, o aplicativo não funciona inicialmente porque precisamos primeiro obter uma chave de API. Acesse o site
Depois de obter sua chave, copie-a e vá para o arquivo main.js. Substitua o espaço reservado pela sua chave de API.
Vamos verificar se nosso aplicativo está funcionando. Pressione “Go” e veja o que Gêmeos retorna para nós.
Como você pode ver, Gêmeos entende o que está dentro da imagem e sugere algumas receitas para assar esse tipo de padaria. Como este aplicativo já está no servidor, você poderá compartilhar o link ou abrir este aplicativo em seu navegador.
A URL ainda não é bonita; no entanto, você poderá ver que tudo está funcionando e poderá compartilhar esse link com seus parceiros ou colegas de trabalho.
Para completar nosso analisador de imagens de IA, precisamos ser capazes de adicionar nossa própria imagem. Vamos fazer alguns ajustes no template; primeiro está o arquivo index.html:
Altere o nome do aplicativo: vou chamá-lo de “AI Image Analyzer”.
Exclua o HTML: Exclua as imagens predefinidas. Linhas de 14 a 27.
<div class="image-picker"> <label class="image-choice"> <input type="radio" checked name="chosen-image" value="/baked_goods_1.jpg"> <img src="/baked_goods_1.jpg"> </label> <label class="image-choice"> <input type="radio" name="chosen-image" value="/baked_goods_2.jpg"> <img src="/baked_goods_2.jpg"> </label> <label class="image-choice"> <input type="radio" name="chosen-image" value="/baked_goods_3.jpg"> <img src="/baked_goods_3.jpg"> </label> </div>
<input type="file" id="fileInput" name="file">
O HTML resultante deve ser semelhante à imagem abaixo.
Precisamos definir o código JavaScript para ler nosso arquivo. Abra o arquivo main.js e faça as seguintes alterações:
// Load the image as a base64 string let imageUrl = form.elements.namedItem('chosen-image').value; let imageBase64 = await fetch(imageUrl) .then(r => r.arrayBuffer()) .then(a => Base64.fromByteArray(new Uint8Array(a)));
// Load the image as a base64 string const fileInput = document.getElementById('fileInput'); const file = fileInput.files[0]; const imageBase64 = await new Promise((resolve, reject) => { const reader = new FileReader(); reader.readAsDataURL(file); reader.onload = () => { const base64String = reader.result.split(',')[1]; // Extract base64 part resolve(base64String); }; reader.onerror = reject; });
Seu aplicativo ficará assim na imagem abaixo.
Vamos verificar o resultado. Faça upload de uma imagem, pergunte o que está nela e pressione “Ir”.
Meu exemplo de imagem.
O resultado:
Como você pode ver, a API Gemini explica tudo sobre a imagem. Nosso analisador de imagens AI está funcionando!
É isso! Como você pode ver, é muito simples construir um analisador de imagens de IA usando o Project IDX e a API Gemini. Você pode criar vários aplicativos diferentes. isso é apenas um exemplo. Espero que você considere este artigo útil e informativo. Não se esqueça de compartilhar seus comentários nos comentários abaixo.
Obrigado e até meus próximos artigos! :)