paint-brush
एफओडी#38: एआई हमें स्वास्थ्य निगरानी के एक नए युग में प्रवेश करा सकता हैद्वारा@kseniase
498 रीडिंग
498 रीडिंग

एफओडी#38: एआई हमें स्वास्थ्य निगरानी के एक नए युग में प्रवेश करा सकता है

द्वारा Ksenia Se6m2024/02/01
Read on Terminal Reader

बहुत लंबा; पढ़ने के लिए

हेल्थकेयर एक बेहद संवेदनशील क्षेत्र है, लेकिन मनुष्यों के लिए जेनरेटिव एआई के संभावित लाभ बहुत अधिक हैं, खासकर फाउंडेशन मॉडल की शक्ति के साथ।
featured image - एफओडी#38: एआई हमें स्वास्थ्य निगरानी के एक नए युग में प्रवेश करा सकता है
Ksenia Se HackerNoon profile picture
0-item
1-item

पिछले सोमवार को, एक नर्स ने सुझाव दिया कि हम मेरे और मेरे अजन्मे बच्चे के महत्वपूर्ण अंगों को ट्रैक करने के लिए एक वायरलेस मॉनिटर का प्रयास करें।


"हम इस डिवाइस को "मोनिका, मॉनिटर" कहते हैं!" नर्स ने मुझसे कहा , "इसके साथ काम करना या तो एक सपना है या पूरी तरह से दुःस्वप्न है।"


उस दिन, "मोनिका" (वास्तव में नोवी वायरलेस पैच सिस्टम) ने असाधारण रूप से अच्छा प्रदर्शन किया। अपनी बेटी को जन्म देते समय, मैं तारों के बंधन के बिना, स्वतंत्र रूप से घूमने में सक्षम थी। यह तकनीक भ्रूण और मातृ हृदय संकेतों के बीच अंतर करने और गर्भाशय संकुचन का पता लगाने के लिए निष्क्रिय सिग्नल अधिग्रहण का उपयोग करती है। वास्तविक समय के अवलोकन के लिए डेटा को वायरलेस तरीके से एक निगरानी इकाई में प्रेषित किया जाता है। यह प्रणाली सटीकता को बढ़ाती है और झूठे अलार्म को कम करती है, जिससे प्रसव के दौरान अत्यधिक आवश्यक गतिशीलता मिलती है।


मैंने सोचा: प्रौद्योगिकियों के बारे में लिखना और सिद्धांत बनाना एक बात है, लेकिन उनकी उल्लेखनीय क्षमताओं का प्रत्यक्ष अनुभव करना बिल्कुल दूसरी बात है, खासकर जब कोई उपकरण त्रुटिहीन रूप से कार्य करता है। एक प्रश्न उठा: फाउंडेशन मॉडल पहनने योग्य वस्तुओं में क्या जोड़ सकते हैं? "मोनिका" के साथ मेरे अनुभव के ठीक बाद, Google रिसर्च और MIT शोधकर्ताओं के एक हालिया पेपर ने मेरा ध्यान खींचा। ' हेल्थ-एलएलएम: पहनने योग्य सेंसर डेटा के माध्यम से स्वास्थ्य भविष्यवाणी के लिए बड़े भाषा मॉडल ' शीर्षक वाला और किम एट अल द्वारा लिखित, यह पेपर स्वास्थ्य भविष्यवाणी के लिए पहनने योग्य सेंसर से डेटा की व्याख्या पर ध्यान केंद्रित करते हुए, स्वास्थ्य क्षेत्र में एलएलएम के अनुप्रयोग पर प्रकाश डालता है। दिलचस्प बात यह है कि इन मॉडलों को डेटा मेडिकल रिकॉर्ड या डॉक्टर के नोट्स से नहीं, बल्कि फिटबिट्स जैसे पहनने योग्य उपकरणों से दिया जाता है, जो दैनिक कदम, हृदय गति, नींद के पैटर्न और बहुत कुछ ट्रैक करते हैं - 'मोनिका' के समान।


अनुसंधान ने छह सार्वजनिक स्वास्थ्य डेटासेटों में आठ अत्याधुनिक एलएलएम: मेड-अल्पाका, पीएमसी-लामा, एस्क्लेपियस, क्लिनिकलकैमल, फ़्लान-टी5, पाल्मायरा-मेड, जीपीटी-3.5 और जीपीटी-4 का मूल्यांकन किया। उन्होंने मानसिक स्वास्थ्य, गतिविधि, चयापचय, नींद और हृदय संबंधी आकलन से संबंधित तेरह स्वास्थ्य भविष्यवाणी कार्यों पर प्रयोग किए।


टीम ने विभिन्न तरीकों का प्रयोग किया, जिसमें शून्य-शॉट और कुछ-शॉट प्रॉम्प्टिंग (न्यूनतम या बिना किसी उदाहरण के मॉडल को पढ़ाना), निर्देशात्मक फाइन-ट्यूनिंग (मॉडल को विशिष्ट कार्यों के अनुरूप बनाना), और यहां तक कि कुछ पैरामीटर-कुशल फाइन-ट्यूनिंग भी शामिल है। कम्प्यूटेशनल दक्षता.


संकेतों में संदर्भ वृद्धि की प्रभावशीलता विशेष रूप से आकर्षक है, जिसमें उपयोगकर्ता संदर्भ, स्वास्थ्य ज्ञान और अस्थायी जानकारी जोड़ना शामिल है। इस दृष्टिकोण से प्रदर्शन में 23.8% तक सुधार हुआ।


हेल्थकेयर एक बेहद संवेदनशील क्षेत्र है, लेकिन मनुष्यों के लिए जेनरेटिव एआई के संभावित लाभ बहुत अधिक हैं, खासकर फाउंडेशन मॉडल की शक्ति के साथ। हेल्थ-एलएलएम उस भविष्य की खोज करता है जहां पहनने योग्य वस्तुएं केवल निष्क्रिय ट्रैकर नहीं बल्कि सक्रिय स्वास्थ्य संरक्षक हैं।


स्वास्थ्य सेवा में एक और हालिया अभूतपूर्व पेपर स्टैनफोर्ड और स्टेबिलिटी एआई शोधकर्ताओं से आया है, जिसका शीर्षक है CheXagent: टुवार्ड्स ए फाउंडेशन मॉडल फॉर चेस्ट एक्स-रे इंटरप्रिटेशन । इस पेपर का सबसे आकर्षक पहलू CheXagent का विकास है, जो एक उन्नत फाउंडेशन मॉडल है जो विशेष रूप से छाती के एक्स-रे की व्याख्या करने के लिए डिज़ाइन किया गया है। यह मॉडल विशिष्ट रूप से एक क्लिनिकल एलएलएम, एक विशेष दृष्टि एनकोडर और एक दृष्टि-भाषा ब्रिजिंग नेटवर्क को जोड़ता है, जो जटिल चिकित्सा छवियों की व्याख्या में असाधारण प्रदर्शन प्रदर्शित करता है। सटीकता और निष्पक्षता मूल्यांकन में मौजूदा मॉडलों से बेहतर प्रदर्शन करने की इसकी क्षमता मेडिकल इमेजिंग एआई तकनीक में एक महत्वपूर्ण प्रगति का प्रतीक है। यह इतना समय बचा सकता है! और संभवतः रहता है.


(नवजात लड़की - रीज़न लीलू जॉय - उसे शुभकामनाएं भेजती है। हमने पिछले सप्ताह एक सप्ताह की छुट्टी ली थी, लेकिन अब वापस ट्रैक पर हैं, एआई दुनिया की खोज कर रहे हैं ताकि यह समझ सकें कि वह और उसके चार भाई इसमें कैसे रहेंगे और इसे नेविगेट करेंगे।)

सामान्य संदिग्धों से समाचार ©

सैम ऑल्टमैन और ओपनएआई

  • ओपनएआई ने दो नए एम्बेडिंग मॉडल (टेक्स्ट-एम्बेडिंग-3-छोटा और टेक्स्ट-एम्बेडिंग-3-बड़ा) और जीपीटी-4 टर्बो, जीपीटी-3.5 टर्बो और एक टेक्स्ट मॉडरेशन मॉडल के अद्यतन संस्करण जारी किए । नए एम्बेडिंग मॉडल सामग्री को संख्यात्मक अनुक्रमों के रूप में प्रस्तुत करते हैं, जो क्लस्टरिंग या पुनर्प्राप्ति जैसे मशीन सीखने के कार्यों को बढ़ाते हैं। वे अधिक कुशल और लागत प्रभावी भी हैं।
  • इस बीच, सैम ऑल्टमैन एक नया चिप उद्यम शुरू करने के लिए मध्य पूर्वी समर्थकों के साथ चर्चा कर रहे हैं, जिसमें धनी निवेशक और टीएसएमसी जैसे चिप फैब्रिकेटर शामिल हैं। इस कदम का उद्देश्य ओपनएआई की बढ़ती सेमीकंडक्टर जरूरतों को पूरा करना और एनवीडिया पर निर्भरता कम करना है। उद्यम की संरचना अस्पष्ट है, और यह एक अलग इकाई या OpenAI की सहायक कंपनी हो सकती है।

ब्लैकस्टोन अंदर आता है

  • एक और बड़ा खिलाड़ी एआई क्रांति में भारी निवेश कर रहा है। ब्लैकस्टोन पूरे अमेरिका में $25 बिलियन के ऊर्जा-गहन डेटा केंद्रों का नेटवर्क बना रहा है। प्रमुख डेटा सेंटर ऑपरेटर क्यूटीएस के 10 बिलियन डॉलर के अधिग्रहण के बाद, ब्लैकस्टोन तकनीकी दिग्गजों की बढ़ती डिजिटल और एआई मांगों को पूरा करने के लिए बड़े पैमाने पर सुविधाएं विकसित कर रहा है। लाखों घरों के बराबर बिजली की खपत करने वाली ये परियोजनाएं समुदायों को नया आकार दे रही हैं और संसाधन के उपयोग और स्थानीय लाभों पर बहस छेड़ रही हैं। तनावपूर्ण बिजली आपूर्ति और सार्वजनिक प्रतिक्रिया सहित चुनौतियों के बावजूद, ब्लैकस्टोन इस उद्यम को अपने संभावित सर्वोत्तम निवेशों में से एक के रूप में देखता है, जो एआई युग में डेटा बुनियादी ढांचे के बढ़ते महत्व और जटिलता को दर्शाता है।

एलोन मस्क, एक्सएआई और टेस्ला

गूगल और हगिंग फेस

  • हगिंग फेस और गूगल क्लाउड के बीच हाल ही में घोषित साझेदारी का उद्देश्य एआई को और अधिक सुलभ बनाना है। यह हगिंग फेस के ओपन मॉडल और Google क्लाउड की तकनीक दोनों का लाभ उठाते हुए, खुले विज्ञान और स्रोत में साझा पहल पर ध्यान केंद्रित करता है। लक्ष्य उपयोगकर्ताओं और अनुप्रयोगों की व्यापक श्रेणी के लिए एआई प्रौद्योगिकियों के विकास को सुविधाजनक बनाना है।
  • इस बीच, Google बार्ड हगिंगफेस के चैटबॉट एरिना लीडरबोर्ड पर GPT-4 को पछाड़कर दूसरे स्थान पर पहुंच गया है और अब समुदाय-संचालित LLM रैंकिंग में केवल GPT-4 टर्बो से पीछे है।

आपकी सुविधा के लिए वर्गीकृत नवीनतम शोध पत्र

मॉडल संपीड़न और दक्षता

  • SLICEGPT : प्रदर्शन को बनाए रखते हुए मापदंडों को हटाकर बड़े भाषा मॉडल को कुशलतापूर्वक संपीड़ित करने की एक तकनीक → पेपर पढ़ें
  • डीपसीक-कोडर : व्यापक पैरामीटर रेंज के साथ उच्च-प्रदर्शन, बहु-भाषा कोड जनरेशन मॉडल विकसित करने पर ध्यान केंद्रित करता है → पेपर पढ़ें
  • SPACTOR-T5 : कम्प्यूटेशनल आवश्यकताओं को कम करते हुए, T5 मॉडल के लिए एक कुशल पूर्व-प्रशिक्षण विधि प्रस्तुत करता है →पेपर पढ़ें
  • मेडुसा : कई डिकोडिंग प्रमुखों का उपयोग करके बड़े भाषा मॉडल अनुमान को तेज करने के लिए एक रूपरेखा → पेपर पढ़ें

एलएलएम क्षमताएं और मूल्यांकन

  • जीपीटी-4 से जेमिनी और उससे आगे तक : कई तौर-तरीकों में सामान्यीकरण, भरोसेमंदता और कार्य-कारण के लिए एमएलएलएम का मूल्यांकन करता है → पेपर पढ़ें
  • MaLA-500 : 500 से अधिक भाषाओं का समर्थन करने वाला एक बहुभाषी LLM विकसित करता है, जो भाषा मॉडल की पहुंच को बढ़ाता है → पेपर पढ़ें
  • दूरबीन के साथ एलएलएम का पता लगाना : बड़े भाषा मॉडल द्वारा उत्पन्न पाठ की शून्य-शॉट पहचान के लिए एक विधि का परिचय देता है → पेपर पढ़ें

मल्टीमॉडल और विशिष्ट मॉडल

  • मास्क्ड ऑटोएन्कोडर्स के लिए पैच निर्भरता पर पुनर्विचार : बेहतर छवि प्रसंस्करण के लिए मास्क्ड ऑटोएनकोडर्स में डिकोडिंग तंत्र की जांच करता है → पेपर पढ़ें
  • एमएम-एलएलएम : मल्टीमॉडल बड़े भाषा मॉडल की प्रगति और क्षमताओं पर एक व्यापक सर्वेक्षण → पेपर पढ़ें
  • सीएमएमएमयू : चीनी संदर्भ में बड़े मल्टीमॉडल मॉडल के मूल्यांकन के लिए एक बेंचमार्क स्थापित करता है → पेपर पढ़ें
  • SpatialVLM : उन्नत स्थानिक तर्क क्षमताओं के साथ दृष्टि-भाषा मॉडल को बढ़ाता है → पेपर पढ़ें

एआई प्रशिक्षण और डेटा जनरेशन तकनीक

  • सार्वभौमिक भविष्यवक्ताओं को सीखना : सार्वभौमिक भविष्यवाणी रणनीतियों के लिए तंत्रिका नेटवर्क के प्रशिक्षण की खोज, सोलोमनॉफ इंडक्शन के करीब → पेपर पढ़ें
  • Unitxt : जेनरेटिव एनएलपी में लचीले और प्रतिलिपि प्रस्तुत करने योग्य डेटा तैयार करने के लिए एक पायथन लाइब्रेरी → पेपर पढ़ें
  • जिनी : बड़े भाषा मॉडल का उपयोग करके उच्च-गुणवत्ता, सामग्री-आधारित सिंथेटिक डेटा उत्पन्न करने की एक विधि → पेपर पढ़ें
  • MambaByte : एक टोकन-मुक्त भाषा मॉडल की जांच करता है जो सीधे कच्चे बाइट्स से सीखता है → पेपर पढ़ें
  • मेटा-प्रॉम्पटिंग : बेहतर प्रदर्शन के लिए कार्य-अज्ञेयवादी मचान तकनीक के साथ भाषा मॉडल को बढ़ाता है → पेपर पढ़ें
  • वार्म : सुदृढीकरण सीखने में मानवीय प्राथमिकताओं के साथ बड़े भाषा मॉडल को संरेखित करने के लिए एक दृष्टिकोण → पेपर पढ़ें

भाषा मॉडल और भूमिका निभाना

  • लघु भाषा मॉडल प्रबलित दृष्टि शब्दावली से मिलता है : कुशल दृश्य सूचना एन्कोडिंग के लिए उन्नत दृष्टि शब्दावली को एकीकृत करने वाला एक कॉम्पैक्ट मॉडल प्रस्तुत करता है → पेपर पढ़ें
  • बड़े भाषा मॉडल सभी पात्रों के सुपरपोजिशन हैं : बड़े भाषा मॉडल का उपयोग करके भूमिका निभाने वाले संवादों के लिए एक विधि विकसित करते हैं → पेपर पढ़ें
  • ओरियन-14बी : संवादात्मक अनुप्रयोगों के लिए बहुभाषी बड़े भाषा मॉडल का एक संग्रह प्रस्तुत करता है →पेपर पढ़ें

अन्य समाचार पत्रों में

  • हार्डकोर सॉफ्टवेयर से एप्पल के "यूरोपीय संघ में वितरित ऐप्स पर अपडेट" के बारे में शानदार जानकारी
  • मॉडल मर्जिंग के बारे में इंटरकनेक्ट्स से मजेदार बात "जब शुद्ध एलएलएम काला जादू जैसा प्रतीत होता है तो उसे साहित्य द्वारा समर्थित किया जाता है"
  • क्या यह वह वर्ष है जब Apple AI में जागृत हुआ है? मैड्रोना निवेशकों की राय.
  • एंड्रयू एनजी दावोस और विश्व आर्थिक मंच में अपने अनुभव का वर्णन करते हैं। यह एआई के बारे में है लेकिन एनजी की विशिष्ट मानवतावादी शैली में है।