Vimos o surgimento de um novo gigante de IA generativa, OpenAI, com a introdução do ChatGPT em novembro de 2022. O ChatGPT serve como uma interface orientada a bate-papo para o modelo subjacente que ele emprega. A primeira versão do chatbot contava com um grande modelo de linguagem chamado GPT-3.5. Mas na terça-feira, 14 de março de 2023, 4 meses após o primeiro lançamento do ChatGPT, a OpenAI está animando as coisas com o lançamento do GPT-4, um modelo mais capaz do que as versões anteriores. Inicialmente projetado para interagir com o GPT-3.5, o chatbot agora funciona como um meio para interagir com o GPT-4.
A mesma coisa que o GPT-3.5 pode fazer, mas muito mais. A empresa disse em um post no blog,
“O GPT-4 é mais confiável, criativo e capaz de lidar com instruções muito mais sutis do que o GPT-3.5.”
Desde 2018, a OpenAI vem divulgando os modelos de linguagem GPT, mas de todos os enormes modelos de linguagem da Open AI, o GPT-4 não é apenas o mais novo, mas também o mais potente. A OpenAI informou que usou o Microsoft Azure para treinar o modelo. Aqui estão algumas maneiras pelas quais o GPT-4 se compara ao GPT-3.5
GPT-4 aceita entradas visuais e GPT-3.5 não
Dado que o GPT-4 é "multimodal", conforme especificado pelo OpenAI, e pode compreender muitas "modalidades" de informação, pode ser solicitado a produzir conteúdo por pistas visuais e textuais, enquanto o GPT-3.5 foi essencialmente capaz de ler e escrever texto . No entanto, a empresa não está implantando seu recurso de descrição de imagem imediatamente, e a versão GPT-4 permanece disponível apenas para assinantes de usuários e desenvolvedores ChatGPT Plus da OpenAI e suporta apenas texto.
Comparado com o GPT-3.5, o GPT-4 tem um buffer maior
Simplificando, o GPT-4 tem uma memória mais longa que o modelo anterior. Com o GPT-3.5 e a iteração anterior do ChatGPT, o máximo era de 4.096 "tokens" ou cerca de 8.000 palavras, enquanto a contagem máxima de tokens para o GPT-4 é de 32.768, ou cerca de 64.000 palavras. Isso é 8 vezes mais capacidade de memória.
GPT-4 tem uma variedade de "personas". ou dirigibilidade, ao contrário do GPT-3.5
Dirigibilidade refere-se à capacidade de controlar ou influenciar a saída de um modelo de linguagem em uma direção ou estilo específico. Em outras palavras, permite que os usuários orientem o modelo de linguagem para produzir um texto que se encaixe em um determinado tom, estilo ou tópico. Enquanto o GPT-3 não possui recursos de dirigibilidade integrados, o GPT-4 possui. Com o GPT-4, os desenvolvedores e usuários do ChatGPT podem especificar o estilo e a tarefa de sua IA, fornecendo essas instruções na mensagem do "sistema", em oposição à personalidade tradicional do ChatGPT com verbosidade, tom e estilo definidos. A empresa afirmou que, embora esse recurso esteja atualmente acessível apenas para desenvolvedores, em breve será disponibilizado também para usuários do ChatGPT.
GPT-4 tem uma gama de idiomas mais ampla.
Isso significa que o GPT-4 pode entender e gerar texto em uma variedade maior de idiomas do que seu predecessor GPT-3.5. Este é um avanço significativo no campo do processamento de linguagem natural. De acordo com a OpenAI, o GPT-4 supera o desempenho em inglês do GPT-3.5 e outros LLMs em 24 dos 26 idiomas testados. Como resultado, o GPT-4 pode responder com precisão a um grande número de questões de múltipla escolha em 26 idiomas diferentes.
GPT-4 tem menos 'alucinações' sobre fatos
Mesmo que não pare totalmente as alucinações, o GPT-4 as reduz consideravelmente em comparação com as variantes anteriores. No entanto, há uma ressalva, o GPT-4 ainda não é totalmente confiável. A empresa disse que o modelo de linguagem atualizado continua a "alucinar" fatos e exibir lógica falha, embora não tão ruim quanto o GPT-3.5. Alucinações no contexto do software de modelo de linguagem referem-se à geração de texto que parece ser coerente e significativo, mas não é realmente suportado pelos dados de entrada. Isso pode ocorrer quando um modelo de linguagem gera texto que não está fundamentado no contexto ou não é consistente com o significado semântico do texto de entrada.
Em outras palavras, um modelo de linguagem às vezes pode gerar um texto que não é preciso ou plausível com base nas informações com as quais foi treinado, resultando no que é comumente chamado de "alucinações". O modelo também incorpora vieses sociais e sugestões adversárias, além da restrição acima. A postagem no blog da OpenAI afirmou,
“O GPT-4 pontua 40% a mais do que o último GPT-3.5 em avaliações internas de factualidade contraditórias.”
De acordo com o The Washington Post, os LLMs aprenderam a imitar os preconceitos humanos de raça, gênero, religião e classe como resultado de seu treinamento em textos e recursos visuais da Internet.
O GPT-4 também possui restrições adicionais semelhantes às encontradas no GPT-3.5, uma das quais é que ainda não tem conhecimento de eventos ocorridos após setembro de 2021. A capacidade de outras pessoas de ensinar coisas novas também é limitada pelo fato de não aprende com suas experiências. Independentemente disso, o GPT-4 ainda é mais inteligente; pois é mais preciso, mais preciso e tem melhor experiência.
O modelo de linguagem também mostrou que é capaz de passar nos exames. De acordo com a OpenAI, ele alcançou o 90º percentil em um exame simulado da barra, o 93º percentil em um teste de leitura SAT e o 89º percentil em um teste de matemática SAT.
O GPT-4 tem potencial para ser usado em uma ampla gama de aplicações que requerem compreensão e geração de linguagem natural. O software de aprendizado de idiomas Duolingo, o provedor de pagamento Stripe, a plataforma de aprendizado online Khan Academy e a empresa de serviços financeiros Morgan Stanley estavam entre as empresas mencionadas no comunicado da OpenAI que estão usando o novo modelo.
A Microsoft também informou que seu chatbot, BingAI, tem usado o GPT-4 o tempo todo, mesmo antes do lançamento público do modelo.
“Temos o prazer de confirmar que o novo Bing está sendo executado no GPT-4, que personalizamos para pesquisa. Se você usou a nova visualização do Bing a qualquer momento nas últimas cinco semanas, já experimentou versão deste poderoso modelo.”
Yusuf Mehdi, vice-presidente corporativo e diretor de marketing para consumidores da Microsoft, escreveu em um comunicado.
O GPT-4 "se destaca em tarefas que exigem raciocínio avançado, compreensão de instruções complicadas e mais criatividade", de acordo com a OpenAI.
Os usuários relataram o uso do GPT-4 de várias maneiras inventivas no breve período desde seu lançamento:
Acredita-se que as possibilidades dessa nova ferramenta sejam infinitas.
\Fundamentalmente, para acessar o ChatGPT, você deve primeiro se registrar no OpenAI
Como a Microsoft confirmou que o novo Bing é executado no novo modelo do GPT, é óbvio que milhões de usuários do Bing já podem acessá-lo por meio do chatbot.
O novo modelo também é acessível via API, a empresa afirmou que está priorizando o acesso à API para desenvolvedores que fornecem avaliações de modelo excelentes para OpenAI Evals durante o lento lançamento do GPT-4, a fim de aprender como eles podem aprimorar o modelo para todos.