الخميس 04 يونيو 2026 الموافق 18 ذو الحجة 1447
المشرف العام
محمود المملوك
مستشار التحرير
د. خالد منتصر
المشرف العام
محمود المملوك
مستشار التحرير
د. خالد منتصر

كيف يساعد الذكاء الاصطناعي على تصحيح أخطاء الدراسات الطبية؟

الأحد 26/أكتوبر/2025 - 05:52 ص
الذكاء الاصطناعي
الذكاء الاصطناعي


تُعتَبر التجارب السريرية العشوائية المُحكَمة بالغة الأهمية لتحديد مدى أمان وفعالية أي علاج جديد يتم اكتشافه أو تطويره من قِبَل العلماء.

ولكن في كثير من الأحيان، لا يُفصّل العلماء تفاصيل تجاربهم بشكل كامل، بما يُتيح للباحثين الآخرين تقييم مدى جودة تصميمهم وإجرائهم لتلك الدراسات.

استخدم فريق نظام Bridges-2 التابع لمركز PSC لتدريب أدوات الذكاء الاصطناعي على رصد أي نقص في تقرير بحثي معين.

يهدف الفريق إلى تطوير أداة ذكاء اصطناعي مفتوحة المصدر، يمكن للمؤلفين والمجلات استخدامها لرصد هذه الأخطاء وتحسين تخطيط التجارب السريرية وإجرائها والإبلاغ عن نتائجها.

عندما يتعلق الأمر بإثبات سلامة وفعالية العلاجات الطبية الجديدة، فإن أفضل دليل ممكن يأتي من التجارب العشوائية المُحكمة. ويعني ذلك، في أبسط صوره، توزيع المرضى عشوائيًا إما على مجموعة تتلقى علاجًا تجريبيًا أو مجموعة ضابطة لا تتلقى علاجًا.

الفكرة هي أنه إذا وزعتَ المرضى دون هذا التوزيع العشوائي، فقد تُوزّع المرضى الأكثر مرضًا على مجموعة واحدة، ولن تكون المقارنة عادلة.

ومن معايير الجودة المهمة الأخرى أن يُحدّد العلماء الذين يُجرون الدراسة أهدافهم وتعريفهم للنجاح مُسبقًا، ولا يبحثون عن "نتائج جيدة" لم يكونوا يبحثون عنها.

أحيانًا يتصرف العلماء بشكل صحيح، لكنهم لا يُسجلونه بدقة في تقاريرهم المكتوبة.

أحيانًا، تُعدّ المعلومات غير الكاملة في التقارير مؤشرًا على إغفال أمر مهم.

في كلتا الحالتين، فإنّ الكمّ الهائل من التجارب السريرية المُبلّغ عنها سنويًا يفوق بكثير قدرة البشر على تقييم الخطوات المفقودة.

تُعتبر التجارب السريرية أفضل أنواع الأدلة للرعاية السريرية، فإذا استُخدم دواءٌ لعلاج مرضٍ ما، فلا بد من إثبات سلامته وفعاليته، ولكن هناك العديد من المشاكل في نشر التجارب السريرية، فغالبًا ما تفتقر إلى التفاصيل الكافية، كما أنها لا تتسم بالشفافية بشأن ما تم إجراؤه بالضبط وكيفية إجرائه، لذا نواجه صعوبة في تقييم مدى دقة أدلتها، كما يقول خليل كيليك أوغلو.

أراد خليل كيليك أوغلو، الأستاذ المشارك في علوم المعلومات بجامعة إلينوي معرفة مدى إمكانية تدريب الذكاء الاصطناعي على فحص الأوراق العلمية بحثًا عن العناصر الأساسية لتجربة عشوائية محكمة سليمة، وتحديد العناصر التي لا تفي بالغرض.

كانت أداة فريقه لهذه المهمة هي الحاسوب العملاق الرائد "بريدجز-2" التابع لمركز PSC. وقد حصلوا على وقت على "بريدجز-2" من خلال برنامج ACCESS التابع لمؤسسة العلوم الوطنية الأمريكية، والذي تُعد PSC عضوًا رائدًا فيه.

كيف ساعدت PSC؟

كنقطة انطلاق، اعتمد العلماء على بيان CONSORT لعام 2010 وبيان SPIRIT لعام 2013.

تحدد هذه الإرشادات 83 بندًا موصىً به ضروريًا لإجراء تجربة سليمة، وضعها علماء رائدون في هذا المجال.

لاختبار طرق مختلفة لجعل الذكاء الاصطناعي يُقيّم الأوراق العلمية من حيث الالتزام بمعايير SPIRIT/CONSORT، استخدم فريق إلينوي نوعًا من الذكاء الاصطناعي يُسمى معالجة اللغة الطبيعية (NLP). واختبروا عدة أنظمة ذكاء اصطناعي من هذا النوع.

يُعد نظام Bridges-2 مناسبًا تمامًا لهذا العمل، ويرجع ذلك جزئيًا إلى قدرته على التعامل مع الكم الهائل من البيانات اللازمة لدراسة 200 مقالة تصف التجارب السريرية التي حددها الفريق في الأدبيات الطبية بين عامي 2011 و2022، كما يوفر النظام وحدات معالجة رسومية قوية (GPUs)، تُستخدم لتدريب نماذج الذكاء الاصطناعي استنادًا إلى شبكة عصبية متطورة تُسمى Transformer.

يُمكّن هذا أنظمة الذكاء الاصطناعي من التمييز بين ممارسات إعداد التقارير الجيدة والسيئة.

استخدم فريق إلينوي جزءًا من المقالات عشوائيًا كبيانات تدريب.

في بيانات التدريب، وُسمت الإجابات الصحيحة.

سمح هذا للنموذج بمعرفة الأنماط في النص المرتبطة بالإجابات الصحيحة، ثم عدّل النموذج روابطه الداخلية، معززًا تلك التي أدت إلى تنبؤات صحيحة ومضعفًا تلك التي لم تُحقق ذلك.

مع تقدم التدريب، تحسّن أداء النموذج، وعندما لم يعد التدريب الإضافي يُسفر عن أي تحسينات، اختبر الباحثون الذكاء الاصطناعي على المقالات المتبقية.

قيّمت مجموعة كيليك أوغلو نتائج الذكاء الاصطناعي باستخدام مقياس يُسمى F₁، وهو نوع من المتوسط ​​الحسابي بين قدرة الذكاء الاصطناعي على تحديد بنود قائمة المراجعة المفقودة في ورقة بحثية معينة، وقدرته على تجنب الإشارة الخاطئة إلى ورقة بحثية اتبعت الإجراءات الصحيحة.

الدرجة المثالية لـ F₁ هي 1، وأسوأ درجة هي 0.

كانت النتائج الأولية للذكاء الاصطناعي المُحسّن مُشجعة، فقد حصلت أفضل برامج معالجة اللغة الطبيعية على درجة F₁ قدرها 0.742 على مستوى الجمل الفردية و0.865 على مستوى المقالات الكاملة.

نشر العلماء نتائجهم في مجلة " البيانات العلمية".

يشعر كيليك أوغلو وزملاؤه بالتفاؤل إزاء نتائجهم، لكنهم يرون إمكانية تحسينها.

ومن بين الطرق التي يخططون لتحقيق ذلك تضمين المزيد من البيانات، وزيادة عدد الأبحاث التي يستخدمونها لتدريب واختبار أنظمة الذكاء الاصطناعي.

كما يتطلعون إلى استخدام أدوات إضافية لتحسين عملية تعلم الذكاء الاصطناعي، بما في ذلك عملية التقطير.

في هذه العملية، يُدرّب ذكاء اصطناعي كبير مُطوّر على حاسوب فائق ذكاءً اصطناعيًا أصغر، يُمكن تشغيله على حاسوب شخصي، على تحديد مدى التزام أنظمة SPIRIT/CONSORT.

ستكون الخطوة الأخيرة مهمة لتحقيق هدف الفريق النهائي، وهو تزويد المجلات والعلماء بأدوات الذكاء الاصطناعي هذه مجانًا.

باستخدام هذه الأداة، يمكن للعلماء إدخال مسودات أبحاثهم في الذكاء الاصطناعي، والتعرف فورًا على أي خطوة نسيوها.

يمكن للمجلات استخدامها كجزء من عملية مراجعة المقالات، وإعادة المقالات إلى مؤلفيها لتصحيحها عند وجود أي بند مفقود في قائمة المراجعة.

في نهاية المطاف، يتمثل هدف العلماء في مساعدة مجال البحث الطبي على تحسين أدائه بما يعود بالنفع على المرضى.