paint-brush
ChatGPT 4.0 finalmente recebe uma piadapor@ursushoribilis
2,865 leituras
2,865 leituras

ChatGPT 4.0 finalmente recebe uma piada

por Miguel Rodriguez8m2023/03/20
Read on Terminal Reader

Muito longo; Para ler

Testou como o novo ChatGPT4 melhorou seus recursos de raciocínio, criatividade e análise em relação à versão anterior e achou melhor no geral. No self know how, uma vez que ambos são treinados em dados antigos, nenhum deles conhece os recursos do ChatGPT
featured image - ChatGPT 4.0 finalmente recebe uma piada
Miguel Rodriguez HackerNoon profile picture
0-item

Analisei esses aspectos da nova versão 4 do ChatGPT, comparando-a com seu irmão mais velho, ChatGPT V 3.5:


  • Raciocínio: será capaz de explicar por que uma piada é engraçada?
  • Criatividade: Pode me contar uma piada? uma verdadeira piada nova?
  • Analytics: pode resolver um enigma?
  • Self know how: Quanto ele sabe sobre si mesmo.


Comparação da versão do Chat GPT conforme documentado pela OpenAI


Aqui estão minhas descobertas:

  • Raciocínio: ChatGPT4.0 entendeu a piada, ChatGPT3.5 não
  • Criatividade: ChatGPT4.0 faz um trabalho melhor.
  • Analytics: ChatGPT4.0 é um programador melhor que ChatGPT3.5
  • Self know how: Por causa de dados desatualizados, não sabe quem é.


Abaixo estão os detalhes:

Raciocínio

Eu fui e olhei alguns artigos que haviam sido escritos sobre os novos recursos do algoritmo. Eles mencionaram alguns fatos interessantes. A primeira era que o modelo era capaz de explicar as piadas.


Então eu fiz um experimento. Eu fiz a seguinte pergunta para 3.5 e 4:

Por que isso é engraçado *: Por que o tomate ficou vermelho? Porque viu o molho da salada!*

Eu me perguntei o que uma versão mais antiga me diria sobre a piada, então pedi ao velho ChatGPT 3 para explicar. Esta é a versão desastrada que recebi:

Piada explicada ChatGPT3.5 vs ChatGPT4


Essa piada é engraçada porque brinca com a ideia de um tomate mudar de cor como resultado de uma resposta emocional. A piada, “Porque viu o molho para salada!”, é uma brincadeira com a frase “Porque viu a luz!” , que é freqüentemente usado para descrever uma percepção repentina ou mudança na percepção. Nesse caso, a piada é que o tomate ficou vermelho porque foi excitado ou estimulado pela visão do molho de salada, que é um condimento comum para vegetais. O humor vem do absurdo da ideia de que um vegetal possa ter uma resposta emocional tão forte.


Compare isso com a resposta certa dada pelo ChatGPT4:


Essa piada é considerada engraçada porque se baseia em um jogo de palavras e antropomorfismo. O humor vem de dar qualidades humanas ao tomate, como a capacidade de sentir vergonha.

Na brincadeira, o tomate "fica vermelho" porque "enxerga o molho da salada". A piada pode ser interpretada de duas maneiras:


  1. Literalmente, os tomates ficam vermelhos à medida que amadurecem, o que é um processo natural.


  2. Figurativamente, o tomate fica envergonhado (como se uma pessoa pudesse corar ou ficar vermelha) porque "viu" o molho da salada, como se tivesse pegado alguém se despindo. Ao misturar o significado literal com uma reviravolta bem-humorada e inesperada, a piada cria uma imagem mental que muitas pessoas acham divertida.


Portanto, se pudermos julgar o raciocínio sobre como explicar uma piada, o ChatGPT4.0 é o vencedor.

criatividade

Então pedi para os dois criarem uma brincadeira que ainda não existe:

Nova piada de ChatGPT3 (esquerda) e ChatGPT4 (direita)


Parece que eles precisam melhorar as habilidades de humor do sistema.


Dei então a tarefa de criar um anúncio digital anunciando o lançamento do ChatGPT-4 descrevendo os elementos gráficos que ele usaria, incluindo legendas e texto:


Título: “Apresentando o ChatGPT-4: uma revolução nas conversas de IA”

Legenda : “Experimente a IA de última geração com comunicação perfeita, criatividade aprimorada e inteligência incomparável.”


Elementos Visuais:

Fundo : Uma mistura de cores radiantes para simbolizar a fusão do pensamento humano e tecnologia avançada. A paleta de cores é composta por azul elétrico e roxo, transitando de tons escuros para tons mais claros.


Logótipo ChatGPT-4 : O logótipo é apresentado de forma proeminente no centro, apresentando uma combinação de um balão de fala e um “4” estilizado, que indica a quarta versão do ChatGPT. O logotipo usa uma fonte elegante e moderna, com um gradiente combinando com as cores de fundo.


Ilustração de IA : Uma figura holográfica semelhante a um humano, com um fone de ouvido ou óculos futuristas, representa a integração perfeita de IA e comunicação humana. A figura parece estar interagindo com uma interface de bate-papo virtual, enfatizando a função principal do ChatGPT-4.


Destaques dos recursos : Uma lista dos principais recursos exibidos usando ícones modernos e texto conciso:

  • Compreensão aprimorada do contexto
  • Criatividade inigualável
  • Suporte multilíngue aprimorado
  • Privacidade e segurança de dados robustas


Call to Action (CTA) : Um botão proeminente e atraente que incentiva os usuários a “Experimentar o ChatGPT-4 gratuitamente” ou “Saber mais”. O botão usa uma cor contrastante para se destacar no fundo, como laranja ou verde.


Carrossel de depoimentos: um carrossel rotativo com citações de usuários satisfeitos ou líderes do setor para criar confiança e credibilidade. O carrossel foi concebido com um layout limpo e moderno, usando retratos circulares dos indivíduos junto com suas citações.


Rodapé: o rodapé inclui o logotipo da OpenAI, um slogan que diz “Powered by OpenAI” e links para a Política de Privacidade e os Termos de Serviço.


Texto: “Descubra um mundo de infinitas possibilidades com o ChatGPT-4. Nosso modelo de linguagem AI mais recente oferece uma experiência de conversação incomparável, permitindo que você se conecte, crie e colabore como nunca antes. Junte-se à revolução da IA hoje e libere seu potencial com o ChatGPT-4.”


E então, é claro, procurei seu primo digital Dall-E e pedi que criasse a arte digital que o ChatGPT 4 havia descrito:


Versão Dall-E da arte digital para um pôster de lançamento do ChatGPT


Não sou especialista em marketing, mas devo dizer que estou impressionado com os resultados. O bate-papo GPT3.5 foi um pouco menos eloquente e convincente sobre isso.


Ele também tinha o texto explicativo inferior que parece fazer parte de todas as respostas e soa mais como um político do que um especialista:


Título do anúncio: Apresentando o bate-papo GPT-4: o futuro das conversas de IA


Legenda : Diga olá para conversas mais inteligentes


Texto do anúncio: o futuro das conversas de IA está aqui com o Chat GPT-4. Prepare-se para uma experiência mais natural e intuitiva com respostas mais rápidas e precisas. Diga adeus às respostas genéricas e olá para conversas mais inteligentes.


Elementos gráficos:

Uma ilustração futurista de um robô ou dispositivo AI
Uma tela de smartphone ou laptop exibindo uma conversa com Chat GPT-4
Tipografia arrojada e moderna para o título e a legenda
Uma paleta de cores que valoriza a tecnologia e a inovação, como o azul e o prata metálico


Este anúncio visa enfatizar a tecnologia de ponta e os recursos avançados do Chat GPT-4, além de destacar seu potencial para aprimorar a maneira como interagimos com a IA. O uso de uma ilustração futurística e a tela de um smartphone ou notebook exibindo uma conversa ajudam a dar vida ao conceito e mostrar a aplicação prática do produto. A tipografia ousada e moderna e o esquema de cores com foco em tecnologia reforçam a mensagem de inovação e progresso.

Análise

Então eu tive que experimentá-lo em suas habilidades de solução de enigmas. Eu tenho usado esta pergunta de entrevista por muitos anos:

Os quatro membros do U2 (Bono, the Edge, Larry e Adam) precisam atravessar uma ponte estreita para fazer um show. Como está escuro, é necessário uma lanterna para atravessar, mas a banda tem apenas uma lanterna, e apenas duas pessoas podem atravessar a ponte por vez. (Isso não quer dizer, é claro, que se um dos membros da banda atravessou a ponte, ele não pode voltar sozinho com a lanterna.) Adam leva apenas um minuto para atravessar, Larry leva dois minutos , o Edge leva cinco minutos e o Slowpoke Bono leva 10 minutos. Um par só pode ir tão rápido quanto o membro mais lento. Eles têm 17 minutos para atravessar. Como eles deveriam fazer isso?


Para fazer todos os quatro membros do U2 atravessarem a ponte em 17 minutos, eles podem seguir estas etapas:

  • Adam e Larry atravessam a ponte juntos, levando 2 minutos (2 minutos se passaram).
  • Adam volta com a lanterna, demorando 1 minuto (decorridos 3 minutos).
  • Bono e Edge cruzam a ponte juntos, levando 10 minutos (13 minutos decorridos).
  • Larry volta com a lanterna, demorando 2 minutos (decorridos 15 minutos).
  • Adam e Larry cruzam a ponte juntos novamente, levando 2 minutos (decorridos 17 minutos). Dessa forma, todos os quatro membros, Bono, The Edge, Larry e Adam, atravessam a ponte em exatamente 17 minutos.


O que realmente me surpreendeu foi a velocidade com que surgiu a resposta.

O que não me surpreendeu é que o ChatGPT 3.5 conseguiu vir com a mesma solução.


Então fui ao Interviewcake.com e recebi a última pergunta sobre programação:


Escreva uma função fib() que receba um inteiro n e retorne o enésimo número de Fibonacci

Código Fib(n) por ChatGPT 3.5 (acima) e ChatGPT 4 (abaixo)

Neste caso, o código do ChatGPT 4.0 vence. Tem melhor tratamento de erros e resolve o problema de uma forma mais elegante.

Auto-saber como

O que você faz quando quer aprender sobre o novo ChatGPT 4.0 lançado? Claro, você pergunta ao próprio modelo. Exceto que o modelo foi treinado com dados de setembro de 2021, então é claro que ele não sabe sobre si mesmo.


No entanto, se você perguntar quais recursos ele teria, ele dará uma resposta razoável:

  1. Tamanho e arquitetura do modelo: o GPT-4 poderia ter um tamanho de modelo maior, consistindo em mais parâmetros e camadas do que o GPT-3, que possui 175 bilhões de parâmetros. Um tamanho de modelo maior geralmente leva a um melhor desempenho, pois o modelo pode aprender padrões e relacionamentos mais complexos nos dados.
  2. Dados de treinamento: o GPT-4 pode ser treinado em um conjunto de dados mais diversificado e atualizado, o que levaria a um melhor conhecimento e compreensão de eventos, tendências e tecnologias recentes.
  3. Ajuste fino e adaptação específica da tarefa: o GPT-4 pode ter recursos aprimorados para ser ajustado e adaptado para tarefas ou domínios específicos, tornando-o mais versátil e eficaz em uma ampla gama de casos de uso.
  4. Eficiência e requisitos computacionais: o GPT-4 pode ser potencialmente mais eficiente em termos de recursos computacionais, permitindo que seja executado em dispositivos menores ou reduzindo o impacto ambiental do treinamento e implantação de modelos de IA em larga escala.
  5. Considerações éticas e medidas de segurança: o GPT-4 pode incorporar medidas de segurança mais avançadas para reduzir vieses, abordar questões éticas e evitar saídas prejudiciais ou usos maliciosos.
  6. Manuseio de contexto e raciocínio aprimorados: o GPT-4 poderia potencialmente ter uma melhor compreensão do contexto, permitindo-lhe fornecer respostas mais relevantes e coerentes, bem como executar tarefas que exigem habilidades de raciocínio e resolução de problemas.

Parece um texto que um Product Owner bem preparado teria escrito. Se você comparar com a maneira como eles estão promovendo, parece que eles melhoraram o raciocínio e o tratamento do contexto, mas ainda estão trabalhando nas melhorias de velocidade.

Conclusões

  • Raciocínio: ChatGPT4.0 entendeu a piada, ChatGPT3.5 não
  • Criatividade: ChatGPT4.0 faz um trabalho melhor ao criar uma campanha para si mesmo.
  • Analytics: ChatGPT4.0 é um programador melhor que ChatGPT3.5
  • Autoconhecimento: Devido a dados desatualizados, nenhum deles sabe quem é o ChatGPT4.0. Ainda tentam adivinhar quais seriam as melhorias que a equipe faria