تظلّ التجارب السريرية حجر الزاوية في الطب القائم على الأدلة، ومع ذلك فهي غالبًا ما تكون طويلة الأمد ومكلفة. وفي كثير من الأحيان، تكون هذه التجارب غير مُجدية أكثر مما يُعتقد عادة.
يمكن للذكاء الاصطناعي (AI) أن يقدّم فرصة غير مسبوقة لتبسيط دورة حياة التجارب السريرية — بدءًا من التصميم وصولاً إلى مرحلة النشر — كما يمكنه أن يُحسّن من قيمة النتائج المستخلصة ومغزاها العلمي.
لكن، ورغم ذلك، لا تزال الأدلة الكمية التي تُظهر تأثير الذكاء الاصطناعي في سياق التجارب السريرية محدودة للغاية. لقد انصبّ التركيز طويلاً على سؤال: أين يمكن استخدام الذكاء الاصطناعي؟ والإجابة البديهية كانت: في كل مكان. غير أن المجتمع البحثي يجب أن ينتقل اليوم إلى سؤالين أكثر أهمية: متى يُضيف الذكاء الاصطناعي قيمة حقيقية؟ وكيف يمكن قياس هذه القيمة بدقة؟
إنّ العجز الحالي عن اتخاذ قرارات فعّالة بشأن كيفية ومكان توظيف الذكاء الاصطناعي في التجارب السريرية يعود أساسًا إلى غياب الوضوح حول تكافؤ معايير النجاح داخل التجارب وبينها.
فعلى سبيل المثال، قد لا تكون الساعة الواحدة التي يتم توفيرها عبر استخدام نماذج لغوية ضخمة لتحديد المشاركين المؤهلين من السجلات الطبية الإلكترونية، ذات القيمة نفسها كساعة يتم توفيرها بواسطة أداة ذكية لتصميم بروتوكولات التجارب (مثل Protocol AI) — فالأمر يعتمد على السياق.
فمجتمعات الباحثين المختلفة قد تُقدّر هذه الفائدة بطرق متباينة؛ إذ إنّ أولويات تجربة تتعلق بتفشّي مرضٍ وبائيٍّ ناشئ (مثل الحُمّى النزفية الفيروسية) تختلف حتمًا عن تجربة متعددة المواقع حول علاج أمراض القلب.
أما تحسين جودة قرارات تصميم التجارب فيطرح إشكالية أعقد، نظرًا لصعوبة تقييم التغيّرات في الصلابة العلمية بطريقة موضوعية قبل تحديد قيمتها. ومع ذلك، فإن هذه التحديات ليست حكرًا على التجارب السريرية، ويمكن الاستفادة من التقدّم في مجالات بحثية أخرى لوضع خارطة طريق واضحة.
على غرار مقاييس مثل سنوات الحياة المصحّحة بجودة الحياة (QALY) أو سنوات الحياة المعدّلة بالعجز (DALY)، هناك حاجة ملحّة لوضع إطار قيميّ مُماثل لتقييم قيمة تطبيقات الذكاء الاصطناعي في التجارب السريرية.
سيتيح هذا الإطار إجراء مقارنات هادفة بين تطبيقات الذكاء الاصطناعي المختلفة عبر مراحل التجربة، بشرط الالتزام بإجراء دراسات عالية الجودة حول أثر هذه الأدوات وفق المنهجية ذاتها.
وعليه، فإنّ التحدي المطروح أمام مجتمع التجارب السريرية هو تحديد مقياس أو مجموعة مقاييس تمكّن من تحويل هذا الإطار إلى ممارسة عملية.
قد يكون أحد الحلول في استخدام تجارب الاختيار المنفصل (Discrete Choice Experiments) — وهي طريقة تُستخدم عادة لقياس تفضيلات المرضى في سياق حساب QALY — وذلك لتحديد تفضيلات الأطراف المعنية بالتجارب (مثل قيمة الساعة في سياقات مختلفة، أو مقابل تغيّر في الصلابة العلمية).
ومن الضروري أن تشمل هذه التقييمات المرضى أنفسهم، لا الباحثين والرعاة فقط، انسجامًا مع التوجّهات الحديثة التي تؤكد أهمية مشاركة المجتمع والمرضى في القرار العلمي.
فمن دون إطار قيميّ يعكس وجهات نظر المجتمع، وأدلة علمية كافية لتقييم الأدوات المختلفة، سنخاطر بملء دورة حياة التجربة بحلول قائمة على الذكاء الاصطناعي بصورة عشوائية — ما يجعلها مكلفة، غير فعّالة، وربما ضارّة.
يمكن اكتساب رؤى قيّمة من خلال مراجعة مدى توافق تطبيقات الذكاء الاصطناعي القائمة والمقترحة مع ثلاثة مؤشرات شائعة للقيمة:
قابلية الإثراء بالمعلومات، والفعالية من حيث التكلفة، وقابلية التكرار.
كثير من الحلول الحالية تركّز على أحد هذه المؤشرات فقط، مع تأثيرات ثانوية محدودة على البقية.
وفي حال غياب وسيلة دقيقة لقياس القيمة بشكل شامل، هناك خطر من أن تُمنح الأولوية للحلول التي تقلّل التكاليف فقط — لأنها الأسهل فهمًا والأكثر وضوحًا — مما قد يُهمِّش حلولاً أخرى ذات أثر بنيوي أعمق، مثل تلك التي تعالج أزمة ضعف قابلية التكرار في الأبحاث.
كما أن استراتيجيات الابتكار التي قد ترفع من احتمالية النجاح عبر مجموعة تجارب كاملة قد تُغفل.
وإذا كانت الدراسات الحديثة التي أظهرت قدرة الذكاء الاصطناعي على التنبؤ بنجاح التجارب السريرية قابلة للتعميم، فمن الممكن عندها تحسين الكفاءة الاقتصادية على مستوى المحافظ البحثية عبر تصميم وتسلسل التجارب لتحقيق معدلات نجاح أعلى.
ومع أن وضع مقياس تجريدي للقيمة خطوة ضرورية، إلا أنه لن يكون كافيًا بحد ذاته لإحداث التغيير المنشود.
فالانتقال من الفكرة إلى الممارسة يتطلب جهدًا مؤسسيًا منظّمًا، مثل إنشاء مراصد بحثية تتولى مراجعات منهجية حيّة لتقييم مدى تحقق «نقطة التحوّل» التي يصبح بعدها من غير المنطقي عدم استخدام أداة ذكاء اصطناعي معينة في تطوير التجارب.
إذ إنّ تعريض عدد أكبر من المشاركين للتجارب أكثر مما هو ضروري يُعدّ غير أخلاقي.
وبالتالي، عندما تصبح الأدلة كافية لإثبات أنّ أداة ذكاء اصطناعي معينة تحسّن كفاءة تصميم التجارب أو تزيد من فرص نجاحها، فإنّ الباحثين ملزمون أخلاقيًا باستخدامها.
إنّ نقص المعلومات الكاملة سيظلّ عائقًا رئيسيًا أمام التبنّي الواسع، ولهذا السبب ستكون مبادرات المراقبة المنهجية الإلزامية ضرورية لضمان أن يبقى الباحثون على اطلاع دائم بأحدث الأدلة وأكثرها موثوقية.
ورغم أن النقاش هنا يركّز على دور الذكاء الاصطناعي داخل التجارب السريرية نفسها، فإنّ العديد من العمليات المساندة في منظومة التجارب يمكن أن تستفيد أيضًا من هذه التقنيات — مثل استخدام الذكاء الاصطناعي في تحليل المتطلبات التنظيمية وتخطيط الوصول إلى الأسواق، أو في تسريع مراجعة الوثائق من قبل الهيئات الرقابية.
إنّ التحدي في العقد المقبل لا يتمثّل في ما إذا كان الذكاء الاصطناعي سيؤثّر، بل في تحديد وتمويل ودعم التطبيقات الأكثر تأثيرًا — إذ لا يمكن للمجتمع العلمي أن يتحمّل تكلفة تبنّي جميع الحلول دفعة واحدة.
المصدر: مجلة اللانسيت
Author: Bilal A Mateen,Vasee Moorthy,Alain Labrique,Jeremy Farrar