先週の月曜日、看護師が、私と胎児のバイタルを追跡するためにワイヤレスモニターを試してみたらどうかと提案しました。   看護師は私に言いました。 「私たちはこの装置を「モニターのモニカ」と呼んでいます！一緒に働くのは夢か、まったくの悪夢のどちらかです」と この日は、「Monica」（実際には Novii Wireless Patch System）が非常に好調でした。娘を出産している間、私はワイヤーの邪魔にならずに自由に動くことができました。この技術は、受動的信号取得を利用して、胎児と母体の心臓信号を区別し、子宮収縮を検出します。データはリアルタイム監視のために監視ユニットに無線で送信されます。このシステムは精度を高め、誤報を減らし、分娩中に非常に必要とされる機動性を提供します。 私は、テクノロジーについて文章を書いたり理論化することは別のことですが、その驚くべき機能を直接体験することは、特にデバイスが完璧に機能する場合にはまったく別のことだと考えました。 「基礎モデルはウェアラブルに何を追加できるのでしょうか?」という疑問が生じました。 「Monica」を体験した直後、Google Research と MIT の研究者による最近の論文が私の注意を引きました。 「   」と題され、Kim らによって執筆されたこの論文は、健康分野における LLM の応用を掘り下げ、健康予測のためのウェアラブル センサーからのデータの解釈に焦点を当てています。興味深いことに、これらのモデルには、医療記録や医師の診断書からではなく、毎日の歩数、心拍数、睡眠パターンなどを追跡する Fitbits のようなウェアラブル デバイスからデータが供給されています。これは「Monica」に似ています。 Health-LLM: Large Language Models for Health Prediction via Wearable Sensor Data この研究では、6 つの公衆衛生データセットにわたって、8 つの最先端の LLM (Med-Alpaca、PMC-Llama、Asclepius、ClinicalCamel、Flan-T5、Palmyra-Med、GPT-3.5、GPT-4) を評価しました。彼らは、精神的健康、活動、代謝、睡眠、心臓の評価に関連する 13 の健康予測タスクについて実験を実施しました。 チームは、ゼロショットおよび少数ショットのプロンプト (最小限の例またはまったく例を使用せずにモデルを教える)、指導の微調整 (モデルを特定のタスクに合わせて調整する)、さらにはパラメーター効率の高い微調整など、さまざまな方法を実験しました。計算効率。 特に興味深いのは、ユーザーのコンテキスト、健康に関する知識、一時的な情報の追加を含む、プロンプト内のコンテキスト強化の有効性です。このアプローチにより、パフォーマンスが最大 23.8% 向上しました。 ヘルスケアは非常にデリケートな分野ですが、人間にとって生成 AI がもたらす潜在的な利点は、特に基礎モデルの力を利用すると計り知れません。 Health-LLM は、ウェアラブルが単なる受動的なトラッカーではなく、プロアクティブな健康保護者となる未来を模索しています。 ヘルスケアにおけるもう 1 つの最近の画期的な論文は、スタンフォード大学と Stability AI 研究者によるもので、  題されています。この論文の最も興味深い点は、胸部 X 線の読影用に特別に設計された高度な基礎モデルである CheXagent の開発です。このモデルは、臨床 LLM、特殊なビジョン エンコーダ、およびビジョン言語ブリッジング ネットワークを独自に組み合わせ、複雑な医療画像の解釈において優れたパフォーマンスを発揮します。精度と公平性の評価において既存のモデルを上回るパフォーマンスを発揮するその能力は、医療画像 AI テクノロジーの大きな進歩を示しています。時間を大幅に節約できます。そしてもしかしたら生きているかもしれない。 「 CheXagent: Towards a Foundation Model for Chest X-Ray Interpretation 」と   (生まれたばかりの女の子、リーズン・リールー・ジョイがよろしくお伝えします。私たちは先週 1 週間休暇をとりましたが、現在は順調に回復しており、彼女と 4 人の兄弟がどのようにAI の世界に住み、どのようにナビゲートしていくのかを理解するために AI の世界を探索しています。) ユージュアル・サスペクツからのニュース © サム・アルトマンとOpenAI  OpenAI は、2 つの新しい埋め込みモデル (text-embedding-3-small および text-embedding-3-large) と、GPT-4 Turbo、GPT-3.5 Turbo、およびテキスト モデレーション モデルの更新バージョンを た。新しい埋め込みモデルはコンテンツを数値シーケンスとして表現し、クラスタリングや検索などの機械学習タスクを強化します。また、効率性とコスト効率も向上します。 リリースしまし 一方、サム・アルトマン氏は、新しいチップベンチャーの立ち上げに向けて、裕福な投資家やTSMCのようなチップ製造業者を含む中東の支援者と 。この動きは、OpenAIの増大する半導体ニーズに応え、Nvidiaへの依存を減らすことを目的としている。このベンチャーの構造は不明であり、OpenAI の別個の事業体または子会社である可能性があります。 協議している ブラックストーンが介入する 別の大手企業も AI 革命に多額の投資を行っています。ブラックストーンは、全米に250億ドルをかけて電力を大量に消費するデータセンターのネットワークを構築している。大手データセンター運営会社QTSを100億ドルで買収した後、ブラックストーンはハイテク大手の増大するデジタルとAIの需要に応える大規模な施設を開発している。これらのプロジェクトは数百万世帯に相当する電力を消費し、コミュニティを再構築し、資源の利用と地域の利益をめぐる議論を引き起こしています。電力供給の逼迫や世論の反発などの課題にもかかわらず、ブラックストーンはこの事業を潜在的に最良の投資の1つとみなしており、AI時代におけるデータインフラストラクチャの重要性と複雑さの増大を示している。 イーロン・マスク、xAI、テスラ イーロン・マスク氏は最近、中東、香港、日本、韓国の世界的な投資家から 求めて話題になっている。成功すれば、xAIの評価額は200億ドルに達する可能性があり、Anthropicの184億ドルを上回るが、OpenAIの1000億ドルには及ばない。しかし、マスク氏が25％の支配権を確保しなければ は、現在の投資家たちの不満を引き起こしており、潜在的な新たな支援者との交渉に影響を与える可能性がある。一方、  、AI技術の進歩に対する同社の取り組みを強調している。 xAIへの60億ドルの投資を テスラAIプロジェクトを削除すると最近脅迫したこと テスラはニューヨーク州バッファローの施設にある「Dojo」スーパーコンピューターに5億ドルの投資を計画しており  Googleとハグフェイス 最近発表された  AI をよりアクセスしやすくすることを目的としています。 Hugging Face のオープン モデルと Google Cloud テクノロジーの両方を活用し、オープン サイエンスとソースにおける共有イニシアチブに焦点を当てています。目標は、より幅広いユーザーやアプリケーション向けの AI テクノロジーの開発を促進することです。 Hugging Face と Google Cloud のパートナーシップは、 一方、Google Bard は HuggingFace の Chatbot Arena Leaderboard で 、GPT-4 を追い抜き、コミュニティ主導の LLM ランキングでは GPT-4 Turbo に次ぐものになりました。 2 位に上昇し 最新の研究論文をわかりやすく分類 モデルの圧縮と効率  : パフォーマンスを維持しながらパラメータを削除することで大規模な言語モデルを効率的に圧縮する手法 SLICEGPT →論文を読む  : 広範なパラメータ範囲を備えた高性能の多言語コード生成モデルの開発に焦点を当てています DeepSeek-Coder →論文を読む  : T5 モデルの効率的な事前トレーニング方法を導入し、計算要件を削減 SPACTOR-T5 → 論文を読む  : 複数のデコードヘッドを使用して大規模言語モデル推論を高速化するフレームワーク MEDUSA →論文を読む LLM の機能と評価 : 複数のモダリティにわたる一般化可能性、信頼性、因果関係について MLLM を評価 GPT-4 から Gemini 以降まで → 論文を読む  : 500以上の言語をサポートする多言語LLMを開発し、言語モデルのアクセシビリティを強化 MaLA-500 →論文を読む : 大規模な言語モデルによって生成されたテキストのゼロショット検出方法を紹介します 双眼鏡による LLM の発見 →論文を読む マルチモーダルかつ特殊なモデル : 画像処理を改善するためにマスクされたオートエンコーダーのデコード メカニズムを検討します マスクされたオートエンコーダーのパッチ依存性を再考する →論文を読む  : マルチモーダル大規模言語モデルの進歩と機能に関する包括的な調査 MM-LLMs →論文を読む  : 中国の文脈における大規模複合モデルを評価するためのベンチマークを確立 CMMMU →論文を読む  : 高度な空間推論機能で視覚言語モデルを強化 SpatialVLM → 論文を読む AI トレーニングとデータ生成手法 : ソロモノフ帰納法にアプローチし、普遍的な予測戦略のためのトレーニング ニューラル ネットワークを探索します 普遍的な予測子の学習 →論文を読む  : 生成 NLP における柔軟で再現可能なデータ準備のための Python ライブラリ Unitxt →論文を読む  : 大規模な言語モデルを使用して、高品質でコンテンツに基づいた合成データを生成する手法 GENIE →論文を読む  : 生のバイトから直接学習するトークンフリー言語モデルを調査 MambaByte →論文を読む : タスクに依存しないスキャフォールディング手法で言語モデルを強化し、パフォーマンスを向上します メタプロンプティング →論文を読む  : 強化学習において大規模な言語モデルを人間の好みに合わせるためのアプローチ WARM →論文を読む 言語モデルとロールプレイング  : 視覚情報を効率的にエンコードするために強化された視覚語彙を統合したコンパクトなモデルを提示します Small Language Model Meets with Reinforced Vision Vocabulary →論文を読む : 大規模言語モデルを用いたロールプレイング対話手法の開発 大規模言語モデルはすべての文字の重ね合わせ →論文を読む  : 会話型アプリケーション向けの多言語大規模言語モデルのコレクションを紹介 Orion-14B →論文を読む 他のニュースレターでも による Apple の「欧州連合内で配布されているアプリのアップデート」について詳しく解説 Hardcore Software モデルのマージに関する からの楽しい読み物「純粋な LLM 黒魔術のように見えるものが文献によってサポートされるとき」 Interconnects 今年はAppleがAIに目覚める年になるのか? マドロナ投資家の意見。   ダボス会議と世界経済フォーラムでの自身の経験について語ります。これは AI に関するものですが、Ng の特徴的なヒューマニスティックなスタイルで描かれています。 アンドリュー・ン氏は、

This story contains new, firsthand information uncovered by the writer.

The writer was physically present in relevant location(s) to this story. The location is also a prevalent aspect of this story be it news or otherwise.

Subscribe to Turing Post newsletter for free

Subscribe to My Newsletter

このオーディオは、ストーリーの元の言語で制作されています。

FOD#38: AI は私たちを健康モニタリングの新時代に導くかもしれない

About Author

コメント

ラベル

この記事は

Related Stories

暗号通貨の成長: 効果的なユーザーペルソナの作成

フォーラムからフィードへ: ソーシャルメディアアルゴリズムがデジタルインタラクションを形作る仕組み

ユーザー中心の暗号通貨製品の作成: 顧客からのフィードバックの重要性

フロキのヴァルハラがインドのスリランカツアーのアソシエイトスポンサーに加わる

暗号通貨の成長: 効果的なユーザーペルソナの作成

フォーラムからフィードへ: ソーシャルメディアアルゴリズムがデジタルインタラクションを形作る仕組み

ユーザー中心の暗号通貨製品の作成: 顧客からのフィードバックの重要性

フロキのヴァルハラがインドのスリランカツアーのアソシエイトスポンサーに加わる

Light-Mode

Classic

Newspaper

Minty

Dark-Mode

Neon Noir

Minty

HN StartUps