paint-brush
FOD#38: AI হয়তো আমাদেরকে স্বাস্থ্য পর্যবেক্ষণের একটি নতুন যুগে নিয়ে যাচ্ছেদ্বারা@kseniase
498 পড়া
498 পড়া

FOD#38: AI হয়তো আমাদেরকে স্বাস্থ্য পর্যবেক্ষণের একটি নতুন যুগে নিয়ে যাচ্ছে

দ্বারা Ksenia Se6m2024/02/01
Read on Terminal Reader

অতিদীর্ঘ; পড়তে

স্বাস্থ্যসেবা একটি অত্যন্ত সংবেদনশীল ক্ষেত্র, তবে মানুষের জন্য জেনারেটিভ এআই-এর সম্ভাব্য সুবিধাগুলি অপরিসীম, বিশেষ করে ফাউন্ডেশন মডেলগুলির শক্তির সাথে।
featured image - FOD#38: AI হয়তো আমাদেরকে স্বাস্থ্য পর্যবেক্ষণের একটি নতুন যুগে নিয়ে যাচ্ছে
Ksenia Se HackerNoon profile picture
0-item
1-item

গত সোমবার, একজন নার্স পরামর্শ দিয়েছিলেন যে আমরা আমার অত্যাবশ্যক এবং আমার অনাগত শিশুর ট্র্যাক করার জন্য একটি ওয়্যারলেস মনিটর চেষ্টা করি।


"আমরা এই ডিভাইসটিকে বলি "মনিকা, মনিটর!" এটি হয় একটি স্বপ্নের সাথে কাজ করা বা সম্পূর্ণ দুঃস্বপ্ন,” নার্স আমাকে বলেছিলেন।


সেই দিন, "মনিকা" (আসলে Novii ওয়্যারলেস প্যাচ সিস্টেম) অসাধারণভাবে পারফর্ম করেছে। আমার মেয়ের জন্ম দেওয়ার সময় আমি তারের চাপ ছাড়াই স্বাধীনভাবে চলাফেরা করতে পেরেছিলাম। এই প্রযুক্তিটি ভ্রূণ এবং মাতৃ হৃৎপিণ্ডের সংকেতের মধ্যে পার্থক্য করতে এবং জরায়ুর সংকোচন সনাক্ত করতে প্যাসিভ সংকেত অর্জনকে ব্যবহার করে। রিয়েল-টাইম পর্যবেক্ষণের জন্য ডেটা বেতারভাবে একটি পর্যবেক্ষণ ইউনিটে প্রেরণ করা হয়। এই সিস্টেম সঠিকতা বাড়ায় এবং মিথ্যা অ্যালার্ম কমায়, প্রসবের সময় এত প্রয়োজনীয় গতিশীলতা প্রদান করে।


আমি ভেবেছিলাম: প্রযুক্তি সম্পর্কে লেখা এবং তাত্ত্বিক করা এক জিনিস, কিন্তু তাদের অসাধারণ ক্ষমতাগুলি সরাসরি অনুভব করা একেবারে অন্য বিষয়, বিশেষ করে যখন কোনও ডিভাইস ত্রুটিহীনভাবে কাজ করে। একটি প্রশ্ন উঠেছিল: ফাউন্ডেশন মডেলগুলি পরিধানযোগ্য জিনিসগুলিতে কী যোগ করতে পারে? "মনিকা" এর সাথে আমার অভিজ্ঞতার ঠিক পরে, গুগল রিসার্চ এবং এমআইটি গবেষকদের সাম্প্রতিক একটি গবেষণাপত্র আমার দৃষ্টি আকর্ষণ করেছে। শিরোনাম ' স্বাস্থ্য-এলএলএম: পরিধানযোগ্য সেন্সর ডেটার মাধ্যমে স্বাস্থ্যের ভবিষ্যদ্বাণীর জন্য বৃহৎ ভাষা মডেল ' এবং কিম এট আল দ্বারা রচিত, এই গবেষণাপত্রটি স্বাস্থ্য খাতে এলএলএম-এর প্রয়োগের উপর আলোকপাত করে, স্বাস্থ্যের পূর্বাভাসের জন্য পরিধানযোগ্য সেন্সর থেকে ডেটা ব্যাখ্যা করার উপর দৃষ্টি নিবদ্ধ করে। আশ্চর্যজনকভাবে, এই মডেলগুলি মেডিকেল রেকর্ড বা ডাক্তারের নোট থেকে নয়, কিন্তু ফিটবিটের মতো পরিধানযোগ্য ডিভাইস থেকে ডেটা দেওয়া হয়, যা প্রতিদিনের পদক্ষেপ, হৃদস্পন্দন, ঘুমের ধরণ এবং আরও অনেক কিছু ট্র্যাক করে — 'মনিকা'-এর মতো।


গবেষণায় আটটি অত্যাধুনিক এলএলএম মূল্যায়ন করা হয়েছে: মেড-আলপাকা, পিএমসি-লামা, অ্যাসক্লেপিয়াস, ক্লিনিক্যাল ক্যামেল, ফ্লান-টি5, পালমাইরা-মেড, জিপিটি-৩.৫ এবং জিপিটি-৪, ছয়টি জনস্বাস্থ্য ডেটাসেট জুড়ে। তারা মানসিক স্বাস্থ্য, কার্যকলাপ, বিপাক, ঘুম এবং কার্ডিয়াক মূল্যায়ন সম্পর্কিত তেরোটি স্বাস্থ্য ভবিষ্যদ্বাণী কাজের উপর পরীক্ষা চালায়।


দলটি জিরো-শট এবং কয়েক-শট প্রম্পটিং (ন্যূনতম বা কোন উদাহরণ সহ মডেল শেখানো), নির্দেশমূলক ফাইন-টিউনিং (মডেলটিকে নির্দিষ্ট কাজের জন্য সাজানো), এবং এমনকি কিছু প্যারামিটার-দক্ষ ফাইন-টিউনিং সহ বিভিন্ন পদ্ধতি নিয়ে পরীক্ষা-নিরীক্ষা করেছে। কম্পিউটেশনাল দক্ষতা।


বিশেষ করে আকর্ষণীয় হল প্রম্পটে প্রসঙ্গ বর্ধনের কার্যকারিতা, যার মধ্যে ব্যবহারকারীর প্রসঙ্গ, স্বাস্থ্য জ্ঞান এবং সাময়িক তথ্য যোগ করা জড়িত। এই পদ্ধতির পারফরম্যান্সে 23.8% উন্নতি হয়েছে।


স্বাস্থ্যসেবা একটি অত্যন্ত সংবেদনশীল ক্ষেত্র, কিন্তু মানুষের জন্য জেনারেটিভ এআই-এর সম্ভাব্য সুবিধাগুলি অপরিসীম, বিশেষ করে ফাউন্ডেশন মডেলগুলির শক্তির সাথে। Health-LLM ভবিষ্যতের অন্বেষণ করে যেখানে পরিধানযোগ্য শুধুমাত্র প্যাসিভ ট্র্যাকার নয় বরং সক্রিয় স্বাস্থ্য অভিভাবক।


স্বাস্থ্যসেবার আরেকটি সাম্প্রতিক যুগান্তকারী গবেষণাপত্র স্ট্যানফোর্ড এবং স্থিতিশীলতা এআই গবেষকদের কাছ থেকে এসেছে, যার শিরোনাম CheXagent: বুকের এক্স-রে ব্যাখ্যার জন্য একটি ফাউন্ডেশন মডেলের দিকে । এই কাগজের সবচেয়ে আকর্ষণীয় দিকটি হল CheXagent এর বিকাশ, একটি উন্নত ভিত্তি মডেল যা বিশেষভাবে বুকের এক্স-রে ব্যাখ্যা করার জন্য ডিজাইন করা হয়েছে। এই মডেলটি অনন্যভাবে একটি ক্লিনিকাল এলএলএম, একটি বিশেষ দৃষ্টি এনকোডার এবং একটি দৃষ্টি-ভাষা ব্রিজিং নেটওয়ার্ককে একত্রিত করে, জটিল চিকিৎসা চিত্রের ব্যাখ্যায় ব্যতিক্রমী কর্মক্ষমতা প্রদর্শন করে। সঠিকতা এবং ন্যায্যতা মূল্যায়নে বিদ্যমান মডেলগুলিকে ছাড়িয়ে যাওয়ার ক্ষমতা মেডিকেল ইমেজিং এআই প্রযুক্তিতে একটি উল্লেখযোগ্য অগ্রগতি চিহ্নিত করে। এটা এত সময় বাঁচাতে পারে! এবং সম্ভবত বেঁচে থাকে।


(নবজাতক মেয়ে — কারণ লীলু জয় — তাকে শুভেচ্ছা পাঠায়৷ আমরা গত সপ্তাহে এক সপ্তাহ ছুটি নিয়েছিলাম কিন্তু এখন ট্র্যাকে ফিরে এসেছি, সে এবং তার চার ভাই কীভাবে এতে বাস করবে এবং এটি নেভিগেট করবে তা বোঝার জন্য এআই বিশ্ব অন্বেষণ করছি৷)

The Usual Suspects © থেকে খবর

স্যাম অল্টম্যান এবং ওপেনএআই

  • OpenAI দুটি নতুন এমবেডিং মডেল (টেক্সট-এমবেডিং-3-ছোট এবং টেক্সট-এম্বেডিং-3-বড়) এবং GPT-4 টার্বো, GPT-3.5 টার্বো, এবং একটি টেক্সট মডারেশন মডেলের আপডেট সংস্করণ প্রকাশ করেছে । নতুন এমবেডিং মডেলগুলি সামগ্রীকে সংখ্যাসূচক ক্রম হিসাবে উপস্থাপন করে, ক্লাস্টারিং বা পুনরুদ্ধারের মতো মেশিন লার্নিং কাজগুলিকে উন্নত করে। এগুলি আরও দক্ষ এবং সাশ্রয়ী।
  • ইতিমধ্যে, স্যাম অল্টম্যান একটি নতুন চিপ উদ্যোগ চালু করার জন্য ধনী বিনিয়োগকারী এবং TSMC-এর মতো চিপ ফ্যাব্রিকেটর সহ মধ্যপ্রাচ্যের সমর্থকদের সাথে আলোচনা করছেন। এই পদক্ষেপের লক্ষ্য OpenAI-এর ক্রমবর্ধমান সেমিকন্ডাক্টর চাহিদা মেটানো এবং Nvidia-এর উপর নির্ভরতা কমানো। উদ্যোগটির কাঠামো অস্পষ্ট, এবং এটি একটি পৃথক সত্তা বা OpenAI এর একটি সহায়ক হতে পারে।

ব্ল্যাকস্টোন প্রবেশ করে

  • আরেকটি বড় খেলোয়াড় এআই বিপ্লবে প্রচুর বিনিয়োগ করছে। ব্ল্যাকস্টোন আমেরিকা জুড়ে পাওয়ার-ইনটেনসিভ ডেটা সেন্টারের $25 বিলিয়ন নেটওয়ার্ক তৈরি করছে। QTS-এর $10 বিলিয়ন অধিগ্রহণের পর, একটি প্রধান ডেটা সেন্টার অপারেটর, Blackstone প্রযুক্তি জায়ান্টদের ক্রমবর্ধমান ডিজিটাল এবং AI চাহিদা মেটাতে ব্যাপক সুযোগ-সুবিধা তৈরি করছে। এই প্রকল্পগুলি, লক্ষ লক্ষ বাড়ির সমান বিদ্যুত ব্যবহার করে, সম্প্রদায়গুলিকে পুনর্নির্মাণ করছে এবং সম্পদের ব্যবহার এবং স্থানীয় সুবিধাগুলি নিয়ে বিতর্কের জন্ম দিচ্ছে৷ স্ট্রেনড পাওয়ার সাপ্লাই এবং পাবলিক ব্যাকল্যাশ সহ চ্যালেঞ্জ থাকা সত্ত্বেও, ব্ল্যাকস্টোন এই উদ্যোগটিকে তার সম্ভাব্য সেরা বিনিয়োগগুলির একটি হিসাবে দেখে, যা AI যুগে ডেটা পরিকাঠামোর ক্রমবর্ধমান তাত্পর্য এবং জটিলতাকে চিত্রিত করে।

এলন মাস্ক, xAI এবং টেসলা

গুগল এবং আলিঙ্গন মুখ

  • হাগিং ফেস এবং গুগল ক্লাউডের মধ্যে সম্প্রতি ঘোষিত অংশীদারিত্বের লক্ষ্য AI আরও অ্যাক্সেসযোগ্য করে তোলা। এটি ওপেন সায়েন্স এবং সোর্সে শেয়ার করা উদ্যোগের উপর ফোকাস করে, হাগিং ফেসের ওপেন মডেল এবং গুগল ক্লাউডের প্রযুক্তি উভয়েরই সুবিধা করে। লক্ষ্য হল ব্যবহারকারী এবং অ্যাপ্লিকেশনগুলির একটি বিস্তৃত পরিসরের জন্য এআই প্রযুক্তির বিকাশকে সহজতর করা।
  • ইতিমধ্যে, Google Bard HuggingFace-এর চ্যাটবট এরিনা লিডারবোর্ডে দ্বিতীয় অবস্থানে উঠে এসেছে , GPT-4কে ছাড়িয়ে গেছে এবং এখন কমিউনিটি-চালিত LLM র‌্যাঙ্কিং-এ GPT-4 Turbo-এর পিছনে রয়েছে।

আপনার সুবিধার জন্য শ্রেণীবদ্ধ করা নতুন গবেষণাপত্র

মডেল কম্প্রেশন এবং দক্ষতা

  • SLICEGPT : পারফরম্যান্স ধরে রাখার সময় প্যারামিটারগুলি সরিয়ে দিয়ে বড় ভাষার মডেলগুলিকে দক্ষতার সাথে সংকুচিত করার একটি কৌশল → কাগজ পড়ুন
  • ডিপসিক-কোডার : একটি বিস্তৃত প্যারামিটার পরিসীমা সহ উচ্চ-সম্পাদনাকারী, বহু-ভাষা কোড প্রজন্মের মডেলগুলি বিকাশের উপর ফোকাস করে → কাগজ পড়ুন
  • SPACTOR-T5 : T5 মডেলের জন্য একটি দক্ষ প্রাক-প্রশিক্ষণ পদ্ধতি প্রবর্তন করে, গণনা সংক্রান্ত প্রয়োজনীয়তা হ্রাস করে → কাগজটি পড়ুন
  • মেডুসা : একাধিক ডিকোডিং হেড ব্যবহার করে বৃহৎ ভাষা মডেল অনুমানকে ত্বরান্বিত করার জন্য একটি কাঠামো → কাগজ পড়ুন

এলএলএম ক্ষমতা এবং মূল্যায়ন

  • GPT-4 থেকে মিথুন এবং তার বাইরে : একাধিক পদ্ধতিতে সাধারণীকরণ, বিশ্বস্ততা এবং কার্যকারণ জন্য MLLM-এর মূল্যায়ন করে → কাগজটি পড়ুন
  • MaLA-500 : 500 টিরও বেশি ভাষা সমর্থন করে একটি বহুভাষিক এলএলএম তৈরি করে, ভাষার মডেল অ্যাক্সেসযোগ্যতা বাড়ায় → কাগজ পড়ুন
  • বাইনোকুলার দিয়ে এলএলএম স্পটিং : বড় ভাষা মডেলের দ্বারা তৈরি করা পাঠ্যের জিরো-শট সনাক্তকরণের জন্য একটি পদ্ধতি প্রবর্তন করে → কাগজ পড়ুন

মাল্টিমোডাল এবং বিশেষায়িত মডেল

  • মুখোশযুক্ত অটোএনকোডারগুলির জন্য প্যাচ নির্ভরতা পুনর্বিবেচনা : উন্নত চিত্র প্রক্রিয়াকরণের জন্য মুখোশযুক্ত অটোএনকোডারগুলিতে ডিকোডিং প্রক্রিয়া পরীক্ষা করে → কাগজটি পড়ুন
  • MM-LLMs : মাল্টিমোডাল বৃহৎ ভাষার মডেলগুলির অগ্রগতি এবং ক্ষমতার উপর একটি ব্যাপক সমীক্ষা → কাগজ পড়ুন
  • CMMMU : চীনা প্রেক্ষাপটে বড় মাল্টিমোডাল মডেলের মূল্যায়নের জন্য একটি মানদণ্ড স্থাপন করে → কাগজ পড়ুন
  • SpatialVLM : উন্নত স্থানিক যুক্তির ক্ষমতা সহ দৃষ্টি-ভাষা মডেল উন্নত করে → কাগজ পড়ুন

এআই প্রশিক্ষণ এবং ডেটা জেনারেশন কৌশল

  • ইউনিভার্সাল ভবিষ্যদ্বাণী শেখা : সার্বজনীন ভবিষ্যদ্বাণী কৌশলগুলির জন্য প্রশিক্ষণ নিউরাল নেটওয়ার্কগুলি অন্বেষণ করে, সলোমনফ ইন্ডাকশনের কাছে → কাগজ পড়ুন
  • Unitxt : জেনারেটিভ এনএলপিতে নমনীয় এবং পুনরুত্পাদনযোগ্য ডেটা প্রস্তুতির জন্য একটি পাইথন লাইব্রেরি → কাগজটি পড়ুন
  • GENIE : বড় ভাষা মডেল ব্যবহার করে উচ্চ-মানের, বিষয়বস্তু-ভিত্তিক সিন্থেটিক ডেটা তৈরি করার একটি পদ্ধতি → কাগজ পড়ুন
  • MambaByte : একটি টোকেন-মুক্ত ভাষা মডেল তদন্ত করে যা সরাসরি কাঁচা বাইট থেকে শেখে → কাগজ পড়ুন
  • মেটা-প্রম্পটিং : আরও ভালো পারফরম্যান্সের জন্য একটি টাস্ক-অ্যাগনস্টিক স্ক্যাফোল্ডিং কৌশল সহ ভাষার মডেলগুলিকে উন্নত করে → কাগজ পড়ুন
  • উষ্ণ : শক্তিবৃদ্ধি শেখার ক্ষেত্রে মানুষের পছন্দের সাথে বৃহৎ ভাষার মডেলগুলিকে সারিবদ্ধ করার জন্য একটি পদ্ধতি → কাগজ পড়ুন

ভাষা মডেল এবং ভূমিকা-প্লেয়িং

  • রিইনফোর্সড ভিশন শব্দভান্ডারের সাথে ছোট ভাষার মডেল মিলিত হয় : দক্ষ ভিজ্যুয়াল তথ্য এনকোডিংয়ের জন্য উন্নত দৃষ্টি শব্দভাণ্ডারকে একীভূত করে একটি কমপ্যাক্ট মডেল উপস্থাপন করে → কাগজটি পড়ুন
  • বৃহৎ ভাষার মডেল হল সমস্ত অক্ষরের সুপারপজিশন : বৃহৎ ভাষার মডেল ব্যবহার করে ভূমিকা পালনের সংলাপের জন্য একটি পদ্ধতি তৈরি করে → কাগজ পড়ুন
  • Orion-14B : কথোপকথনমূলক অ্যাপ্লিকেশনের জন্য বহুভাষিক বৃহৎ ভাষার মডেলের একটি সংগ্রহ উপস্থাপন করে → কাগজ পড়ুন

অন্যান্য নিউজলেটারে