إن أغلب بيانات الرعاية الصحية في العالم الحقيقي غير متاحة بشكل كامل بسبب مخاوف تتعلق بخصوصية المرضى، والحواجز التنظيمية مثل قانون التأمين الصحي المحمول والمساءلة، والطبيعة الحساسة لهذه البيانات. وهنا يأتي مفهوم البيانات الاصطناعية: البيانات المصطنعة المصطنعة التي تمثل بالضبط جميع الخصائص الإحصائية لمجموعة بيانات في العالم الحقيقي. ويبدو أن هذا هو التحول الرئيسي لمستقبل الرعاية الصحية.
في هذه المقالة، نخطط للتعمق في التعقيدات التقنية للبيانات الاصطناعية، وتطبيقاتها في الرعاية الصحية، وكيف يمكنها تغيير البحث السريري، والتشخيص، وإدارة المرضى، والتقنيات التي تجعل ذلك ممكنًا.
تُعتبر البيانات الاصطناعية بيانات تم إنشاؤها بشكل مصطنع بسلوك مشابه للبيانات الواقعية. تُستخدم عدة طرق في إنشاء البيانات الاصطناعية، بما في ذلك النماذج الإحصائية وخوارزميات التعلم الآلي والشبكات التنافسية التوليدية (GANs). وعلى الرغم من أن البيانات الاصطناعية لا تحتوي على أي روابط فعلية لملفات المرضى، إلا أنه لا يمكن إنشاء بيانات مجهولة المصدر لتوفير التعقيد اللازم لسيناريوهات الرعاية الصحية في العالم الحقيقي.
إمكانية التوسع: يمكن إنتاج البيانات الاصطناعية بكميات كبيرة، مما يوفر مجموعات متنوعة لتدريب نماذج الذكاء الاصطناعي أو تشغيل عمليات المحاكاة.
تعتمد الرعاية الصحية على البيانات بشكل مكثف؛ حيث تعتمد المستشفيات ومرافق البحث وشركات الأدوية بشكل كبير على بيانات المرضى عند اتخاذ القرارات. ومع ذلك، فإن بيانات الرعاية الصحية في العالم الحقيقي محدودة في عدة جوانب:
تحل البيانات الاصطناعية مثل هذه التحديات، حيث تقدم بدائل أخلاقية وقابلة للتطوير وفعالة من حيث التكلفة. بالإضافة إلى ذلك، يمكن لمجموعات البيانات المخصبة اصطناعيًا أن تتضمن متغيرات ديموغرافية متنوعة وحالات نادرة وعلاجات طبية غير شائعة قد لا تمثلها مجموعات البيانات التقليدية بشكل كافٍ.
تسمح العديد من الطرق عالية التقنية بإنشاء بيانات بشكل مصطنع. وتشمل الطرق الأكثر شيوعًا ما يلي:
تعد الشبكات التوليدية التنافسية من بين تقنيات تجميع البيانات المستخدمة في قطاع الصحة. تتكون الشبكة التوليدية التنافسية من شبكتين: مولد ومميز. يقوم المولد بتوليد بيانات مصطنعة، ويحاول المميز تحديد ما إذا كانت البيانات حقيقية أم مصطنعة. وبمرور الوقت، تعمل على تعزيز كفاءة المنتج، وبالتالي توفير بيانات ذات جودة واقعية.
يمكن للشبكات التوليدية التنافسية التعلم من مجموعات بيانات التصوير الطبي لإنتاج صور الرنين المغناطيسي الاصطناعية، أو الأشعة المقطعية، أو الأشعة السينية، على سبيل المثال، والتي يمكن استخدامها كبيانات تدريب أو للتحقق من صحة بعض الخوارزميات في تطبيقات الرعاية الصحية. علاوة على ذلك، تم استخدام الشبكات التوليدية التنافسية أيضًا لتوليف بيانات السجلات الصحية الإلكترونية الاصطناعية (EHR) مع الحفاظ على علاقات المتغيرات السريرية سليمة دون الكشف عن هويات المرضى.
مثال: كود بايثون
# Example of GAN-based synthetic data generation for EHR from keras.models import Sequential from keras.layers import Dense, LeakyReLU def build_generator(latent_dim): model = Sequential() model.add(Dense(256, input_dim=latent_dim)) model.add(LeakyReLU(alpha=0.2)) model.add(Dense(512)) model.add(LeakyReLU(alpha=0.2)) model.add(Dense(1024)) model.add(LeakyReLU(alpha=0.2)) model.add(Dense(784, activation='sigmoid')) return model
يعد هذا الكود مولدًا بسيطًا لنموذج GAN الذي ينشئ ميزات نمذجة البيانات الاصطناعية الخاصة ببيانات الرعاية الصحية.
تعد نماذج VAE نموذجًا توليديًا آخر لتوليف البيانات الصحية الاصطناعية. تقوم نماذج VAE بتشفير بيانات الإدخال الحقيقية في مساحة كامنة. ومن هذه المساحة الكامنة، يتم إنشاء نقاط بيانات جديدة، مع الاحتفاظ بالخصائص الإحصائية لمجموعة البيانات الأصلية. هذه النماذج قابلة للتطبيق بشكل خاص في توليد مجموعات بيانات عالية الأبعاد في مجال الرعاية الصحية، مثل مجموعات بيانات الجينوم أو الوميكس.
الشبكات البايزية عبارة عن نماذج بيانية تمثل العلاقات الاحتمالية بين المتغيرات المختلفة. وفي مجال الرعاية الصحية، قد تكون هذه الشبكات مفيدة بشكل خاص في توليد بيانات تركيبية تعكس علاقة سببية، مثل مسار المرض أو تأثيرات نظام العلاج.
لقد أحدثت البيانات الاصطناعية ثورة في التصوير الطبي من خلال توفير حل بديل للتوافر المحدود لمجموعات البيانات الموضحة المطلوبة لتدريب نماذج التعلم الآلي. وفي هذا الصدد، تعد الشبكات التوليدية المولدة (GANs) وتقنيات VAE تقنيات مفيدة لتوليف صور الرنين المغناطيسي أو التصوير المقطعي المحوسب أو الأشعة السينية. يساعد استخدام مثل هذه الصور الاصطناعية أخصائيي الأشعة وخوارزميات الذكاء الاصطناعي على اكتشاف الشذوذ في الفحوصات الطبية بدقة عالية. كما توفر بيانات التصوير الاصطناعي للباحثين فرصة تدريب نماذج التعلم العميق دون مشاكل ندرة البيانات أو انتهاك خصوصية المريض.
مثال: صور الرنين المغناطيسي المولدة بواسطة الشبكات التوليدية الخواصية: في تجربة حديثة حول تقسيم أورام المخ، استخدم الباحثون الشبكات التوليدية الخواصية لتوليد صور اصطناعية لفحوصات الرنين المغناطيسي للأورام. وتمكنوا من تدريب نماذج التعلم العميق للكشف عن مثل هذه الحالات بدقة أعلى دون الحاجة إلى كميات كبيرة من بيانات المرضى.
من المفترض أن تُستخدم البيانات الاصطناعية مع البيانات السريرية التقليدية، وينطبق هذا بشكل خاص على مجالات الأمراض النادرة حيث يصعب إشراك المرضى في الدراسات. تسمح مجموعات البيانات الاصطناعية للمحقق بمحاكاة نتائج المرضى في ظل بروتوكولات علاج مختلفة، وبالتالي تسريع اكتشاف الأدوية واختبارها.
على سبيل المثال، قد تمكن السجلات الطبية الإلكترونية الصناعية شركات الأدوية من محاكاة نتائج العلاج لمجموعات افتراضية من المرضى. وهذا من شأنه أن يسمح باختبار الفرضيات والتحقق من فعالية الأدوية، وعلى الأرجح تقليص الوقت والتكلفة اللازمة للتجارب السريرية.
ستعمل البيانات الاصطناعية على تبسيط عملية زيادة البيانات في التعلم الآلي، مما يتيح نماذج تنبؤية أقوى. قد تساعد سجلات المرضى الاصطناعية أو بيانات التصوير في استكمال مجموعات البيانات الصغيرة في الرعاية الصحية، مما يخفف من الإفراط في التجهيز ويسمح بتعميم نماذج الذكاء الاصطناعي بشكل أكبر.
إن علم الجينوم الاصطناعي، أو توليد البيانات الجينية، يفتح آفاقاً جديدة للطب الدقيق في هذا الصدد. إذ يستطيع الباحثون التحقيق في كيفية تأثير بعض الطفرات الجينية على مخاطر الإصابة بالأمراض أو استجابات العلاج بطريقة من شأنها أن توفر علاجات شخصية ضمن مجموعات البيانات الاصطناعية التي تعكس جينات المريض.
على الرغم من أن البيانات الاصطناعية لها قيمة كبيرة، إلا أنها تطرح بعض الأسئلة التنظيمية والأخلاقية المهمة للغاية:
الأطر التنظيمية: لا يزال منظمو الرعاية الصحية يحاولون فهم كيفية تصنيف البيانات الاصطناعية. ولأن مثل هذه البيانات لا تأتي من مرضى حقيقيين، فقد تكون خارج اللوائح الحالية أو خارج نطاق اختصاص الهيئات التنظيمية. ومع ذلك، يجب أن تمتثل للمتطلبات الأخلاقية لاستخدام الذكاء الاصطناعي في الرعاية الصحية.
تحيز توليد البيانات: تحتوي عملية تجميع البيانات في أي نموذج على بعض التحيزات أو العيوب. وقد يؤدي هذا إلى جعل مجموعة البيانات الناتجة تعكس مثل هذه العيوب وتؤدي إلى نتائج بحثية معيبة أو متحيزة أو تنبؤات خاطئة للذكاء الاصطناعي.
التحقق من الصحة: يجب التحقق من صحة البيانات الاصطناعية للتأكد من دقتها وصلاحيتها. فمجرد أن البيانات الاصطناعية قد تعكس بيانات واقعية، فهذا لا يجعلها جيدة بما يكفي لتطبيقات الرعاية الصحية التي تعتمد على الوقت.
فيما يلي بعض الأدوات والأطر المتقدمة التي ظهرت مؤخرًا لدعم إنشاء بيانات الرعاية الصحية الاصطناعية:
CTGAN: اختصار لـ Conditional Tabular GAN، وهي أداة مفتوحة المصدر لإنتاج بيانات جدولية اصطناعية. يتم تنفيذها بشكل شائع في مجال الرعاية الصحية لتوليف السجلات الصحية الإلكترونية.
Synthpop : هذه أداة R لإنتاج إصدارات اصطناعية من البيانات الحساسة. وقد تم استخدامها على نطاق واسع لإنشاء مجموعات بيانات تحافظ على الخصوصية في مجال الرعاية الصحية.
مُركِّب البيانات: مُركِّب مفتوح المصدر يقوم بإنشاء مجموعات بيانات مُركَّبة مع الحفاظ على الخصوصية. تدعم الأداة نماذج وضع السمات العشوائية والمستقلة والمترابطة.
تتمتع البيانات الاصطناعية بإمكانات هائلة في مجال الرعاية الصحية. ويمكن للذكاء الاصطناعي المحسن والنماذج التوليدية أن تعمل على تسريع الابتكار بشكل كبير في عدد قليل من المجالات:
الطب عن بعد: مع انتشار مفهوم الطب عن بعد، قد يكون من الممكن تصميم مجموعات بيانات تدريبية مبنية على البيانات الاصطناعية لأنظمة الذكاء الاصطناعي المشاركة في مراقبة المرضى عن بعد وتشخيصهم.
الذكاء الاصطناعي في التشخيص: إن التدريب على البيانات الاصطناعية التي تحاكي الحالات النادرة أو الأقل تمثيلا يمكن أن يزيد من دقة تشخيص الأمراض للمرضى من قبل أنظمة الرعاية الصحية، وخاصة في الأمراض النادرة.
**البحث بين المؤسسات:** يمكن للبيانات الاصطناعية ضمان المشاركة الآمنة لبيانات الرعاية الصحية بين المؤسسات. وهذا يسهل التعاون العالمي دون إضافة أي قضايا أخرى تتعلق بالخصوصية.
تمثل البيانات الاصطناعية تحولاً جذرياً في مجال الرعاية الصحية لأنها تسمح للبيانات بتجاوز أوجه القصور المحتملة في الوصول إليها وقابلية التوسع وقضايا الخصوصية. وسيكون الباحثون والأطباء ومطورو الذكاء الاصطناعي أحراراً في الابتكار دون المساس بخصوصية المريض أو المعايير الأخلاقية. ومع استمرار الابتكار في النماذج التوليدية، بما في ذلك شبكات GAN وVAEs والشبكات البايزية، ستصبح البيانات الاصطناعية أداة فعالة في تشكيل مستقبل الرعاية الصحية، من التجارب السريرية والتشخيصات إلى الطب الشخصي.
ومن خلال استخدام هذه التكنولوجيا بشكل مسؤول، قد يتمكن قطاع الصحة من فتح إمكانيات غير مسبوقة في رعاية المرضى والبحث والابتكار.