Na segunda-feira passada, uma enfermeira sugeriu que experimentássemos um monitor sem fio para monitorar meus sinais vitais e os do meu bebê ainda não nascido.    disse-me a enfermeira. “Chamamos esse dispositivo de “Monica, o monitor!” Trabalhar com isso é um sonho ou um pesadelo total”,  Naquele dia, “Monica” (na verdade, o Novii Wireless Patch System) teve um desempenho excepcionalmente bom. Consegui me movimentar livremente, sem o peso dos fios, durante o parto da minha filha. Esta tecnologia aproveita a aquisição passiva de sinais para diferenciar entre sinais cardíacos fetais e maternos e para detectar contrações uterinas. Os dados são transmitidos sem fio para uma unidade de monitoramento para observação em tempo real. Este sistema aumenta a precisão e reduz alarmes falsos, oferecendo a mobilidade necessária durante o trabalho de parto.  Pensei: escrever e teorizar sobre tecnologias é uma coisa, mas experimentar em primeira mão suas notáveis capacidades é outra bem diferente, especialmente quando um dispositivo funciona perfeitamente. Surgiu uma questão: o que os modelos básicos podem acrescentar aos wearables? Logo após minha experiência com “Monica”, um artigo recente do Google Research e de pesquisadores do MIT chamou minha atenção. Intitulado '   ', e de autoria de Kim et al., este artigo investiga a aplicação de LLMs no setor de saúde, com foco na interpretação de dados de sensores vestíveis para previsão de saúde. Curiosamente, esses modelos são alimentados com dados não de registros médicos ou anotações médicas, mas de dispositivos vestíveis como Fitbits, que monitoram passos diários, frequência cardíaca, padrões de sono e muito mais – semelhante a ‘Monica’. Health-LLM: Large Language Models for Health Prediction via Wearable Sensor Data  A pesquisa avaliou oito LLMs de ponta: Med-Alpaca, PMC-Llama, Asclepius, ClinicalCamel, Flan-T5, Palmyra-Med, GPT-3.5 e GPT-4, em seis conjuntos de dados de saúde pública. Eles conduziram experimentos em treze tarefas de previsão de saúde relacionadas à saúde mental, atividade, metabolismo, sono e avaliações cardíacas.  A equipe experimentou vários métodos, incluindo prompt zero e poucos disparos (ensinando o modelo com o mínimo ou nenhum exemplo), ajuste fino instrucional (adaptando o modelo para tarefas específicas) e até mesmo alguns ajustes finos com eficiência de parâmetros para eficiência computacional.  Particularmente fascinante é a eficácia do aprimoramento do contexto nos prompts, que envolve adicionar contexto do usuário, conhecimento de saúde e informações temporais. Essa abordagem rendeu uma melhoria de 23,8% no desempenho.  A saúde é um campo extremamente sensível, mas os benefícios potenciais da IA generativa para os humanos são imensos, especialmente com o poder dos modelos básicos. Health-LLM explora o futuro onde os wearables não são apenas rastreadores passivos, mas também guardiões proativos da saúde.  Outro artigo inovador recente na área da saúde vem de pesquisadores de Stanford e Stability AI, intitulado   . O aspecto mais fascinante deste artigo é o desenvolvimento do CheXagent, um modelo básico avançado projetado especificamente para a interpretação de radiografias de tórax. Este modelo combina exclusivamente um LLM clínico, um codificador de visão especializado e uma rede de ponte visão-linguagem, demonstrando desempenho excepcional na interpretação de imagens médicas complexas. Sua capacidade de superar os modelos existentes em avaliações de precisão e imparcialidade marca um avanço significativo na tecnologia de IA de imagens médicas. Isso pode economizar muito tempo! E possivelmente vive. CheXagent: Towards a Foundation Model for Chest X-Ray Interpretation   (A menina recém-nascida — Reason Leeloo Joy — manda lembranças. Tiramos uma semana de folga na semana passada, mas agora estamos de volta aos trilhos, explorando o mundo da IA para entender como ela e seus quatro irmãos viverão nele e navegarão nele.)  Notícias dos suspeitos do costume ©  Sam Altman e OpenAI  A OpenAI   dois novos modelos de incorporação (text-embedding-3-small e text-embedding-3-large) e versões atualizadas do GPT-4 Turbo, GPT-3.5 Turbo e um modelo de moderação de texto. Os novos modelos de incorporação representam conteúdo como sequências numéricas, aprimorando tarefas de aprendizado de máquina, como agrupamento ou recuperação. Eles também são mais eficientes e econômicos. lançou  Enquanto isso, Sam Altman está   com financiadores do Oriente Médio, incluindo investidores ricos e fabricantes de chips como a TSMC, para lançar um novo empreendimento de chips. Esta mudança visa atender às crescentes necessidades de semicondutores da OpenAI e reduzir a dependência da Nvidia. A estrutura do empreendimento não é clara e pode ser uma entidade separada ou uma subsidiária da OpenAI. em negociações  Blackstone entra em cena  Outro grande player está investindo pesadamente na revolução da IA. A Blackstone está construindo uma rede de data centers com uso intensivo de energia no valor de US$ 25 bilhões em toda a América. Após a aquisição da QTS, uma importante operadora de data center, por US$ 10 bilhões, a Blackstone está desenvolvendo instalações enormes para atender às crescentes demandas digitais e de IA dos gigantes da tecnologia. Estes projectos, que consomem electricidade equivalente a milhões de casas, estão a remodelar comunidades e a desencadear debates sobre a utilização de recursos e benefícios locais. Apesar dos desafios, incluindo fontes de energia sobrecarregadas e reações públicas, a Blackstone vê este empreendimento como um dos seus melhores investimentos potencialmente, ilustrando a crescente importância e complexidade da infraestrutura de dados na era da IA.  Elon Musk, xAI e Tesla  Elon Musk tem estado nas manchetes recentemente, buscando um   de investidores globais no Oriente Médio, Hong Kong, Japão e Coréia. Se for bem-sucedida, a avaliação da xAI poderá atingir US$ 20 bilhões, ultrapassando os US$ 18,4 bilhões da Anthropic, mas ficando atrás dos US$ 100 bilhões da OpenAI. No entanto, a recente   a menos que ele garanta o controle de 25%, despertou a insatisfação entre os investidores atuais e pode afetar as negociações com potenciais novos financiadores. Enquanto isso,   em um supercomputador “Dojo” em suas instalações em Buffalo, Nova York, ressaltando o compromisso da empresa com o avanço da tecnologia de IA. investimento de US$ 6 bilhões para xAI ameaça de Musk de remover os projetos de IA da Tesla, a Tesla está planejando um investimento de US$ 500 milhões  Google e o rosto do abraço  A   visa tornar a IA mais acessível. Ele se concentra em iniciativas compartilhadas em ciência e código aberto, aproveitando os modelos abertos do Hugging Face e a tecnologia do Google Cloud. O objetivo é facilitar o desenvolvimento de tecnologias de IA para uma gama mais ampla de usuários e aplicações. parceria recentemente anunciada entre Hugging Face e Google Cloud  Enquanto isso, o Google Bard   no ranking Chatbot Arena do HuggingFace, ultrapassando o GPT-4 e agora apenas atrás do GPT-4 Turbo nas classificações LLM conduzidas pela comunidade. ascendeu para a segunda posição  Os artigos de pesquisa mais recentes, categorizados para sua conveniência  Compressão e eficiência do modelo    : Uma técnica para compactar com eficiência modelos de linguagem grandes, removendo parâmetros e mantendo o desempenho  SLICEGPT → leia o artigo    : concentra-se no desenvolvimento de modelos de geração de código multilíngue e de alto desempenho com uma ampla gama de parâmetros  DeepSeek-Coder → leia o artigo    : Introduz um método eficiente de pré-treinamento para modelos T5, reduzindo os requisitos computacionais  SPACTOR-T5 →leia o artigo    : Uma estrutura para acelerar a inferência de modelos de linguagem grande usando vários cabeçotes de decodificação  MEDUSA → leia o artigo  Capacidades e avaliação do LLM    : avalia MLLMs quanto à generalização, confiabilidade e causalidade em múltiplas modalidades  Do GPT-4 ao Gemini e além → leia o artigo    : Desenvolve um LLM multilíngue com suporte para mais de 500 idiomas, melhorando a acessibilidade do modelo de idioma  MaLA-500 →leia o artigo    : apresenta um método para detecção zero-shot de texto gerado por grandes modelos de linguagem  Identificando LLMs com binóculos → leia o artigo  Modelos Multimodais e Especializados    : examina o mecanismo de decodificação em codificadores automáticos mascarados para melhorar o processamento de imagens  Repensando a dependência de patch para codificadores automáticos mascarados → leia o artigo    : Uma pesquisa abrangente sobre os avanços e capacidades de modelos multimodais de grandes linguagens  MM-LLMs → leia o artigo    : Estabelece uma referência para avaliar grandes modelos multimodais no contexto chinês  CMMMU →leia o artigo    : aprimora modelos de linguagem de visão com recursos avançados de raciocínio espacial  SpatialVLM →leia o artigo  Treinamento em IA e técnicas de geração de dados    : Explora redes neurais de treinamento para estratégias de predição universais, aproximando-se da Indução de Solomonoff  Aprendendo Preditores Universais → leia o artigo    : uma biblioteca Python para preparação de dados flexível e reproduzível em PNL generativa  Unitxt →leia o artigo    : Um método para gerar dados sintéticos de alta qualidade baseados em conteúdo usando grandes modelos de linguagem  GENIE →leia o artigo    : investiga um modelo de linguagem sem token que aprende diretamente a partir de bytes brutos  MambaByte → leia o artigo    : aprimora os modelos de linguagem com uma técnica de andaime independente de tarefas para melhor desempenho  Meta-Prompting → leia o artigo    : Uma abordagem para alinhar grandes modelos de linguagem com preferências humanas na aprendizagem por reforço  WARM → leia o artigo  Modelos de Linguagem e Role-Playing    : apresenta um modelo compacto que integra vocabulário de visão aprimorado para codificação eficiente de informações visuais  Modelo de linguagem pequena encontra vocabulário de visão reforçado → leia o artigo    : Desenvolve um método para dramatização de diálogos usando grandes modelos de linguagem  Grandes modelos de linguagem são superposições de todos os personagens → leia o artigo    : apresenta uma coleção de modelos multilíngues de grandes idiomas para aplicações de conversação  Orion-14B → leia o artigo  Em outros boletins informativos  Grande mergulho na “Atualização sobre aplicativos distribuídos na União Europeia” da Apple da  Hardcore Software  Leitura divertida de   sobre fusão de modelos “Quando o que parece ser pura magia negra LLM é apoiado pela literatura” Interconnects  Este é o ano em que a Apple desperta na IA?  Opinião dos investidores da Madrona.    descreve sua experiência em Davos e no Fórum Econômico Mundial. É sobre IA, mas no estilo humanístico característico de Ng. Andrew Ng

This story contains new, firsthand information uncovered by the writer.

The writer was physically present in relevant location(s) to this story. The location is also a prevalent aspect of this story be it news or otherwise.

Subscribe to Turing Post newsletter for free

Subscribe to My Newsletter

Este áudio é produzido no idioma original da história!

FOD#38: A IA pode estar nos conduzindo a uma nova era de monitoramento da saúde

About Author

COMENTARIOS

Rótulos

ESTE ARTIGO FOI APRESENTADO EM

Related Stories

Guia do arquiteto para construir arquitetura de referência para um Datalake de IA/ML

Crescimento de Criptomoedas: Criando Personas de Usuários Eficazes

De fóruns a feeds: como os algoritmos de mídia social moldam a interação digital

Vazamento do prompt do sistema Claude Sonnet 3.5: uma análise forense

Guia do arquiteto para construir arquitetura de referência para um Datalake de IA/ML

Crescimento de Criptomoedas: Criando Personas de Usuários Eficazes

De fóruns a feeds: como os algoritmos de mídia social moldam a interação digital

Vazamento do prompt do sistema Claude Sonnet 3.5: uma análise forense

Light-Mode

Classic

Newspaper

Minty

Dark-Mode

Neon Noir

Minty

HN StartUps