أداة ذكاء اصطناعي قد تجعل عملية التصوير الطبي أكثر كفاءة
عندما يُحلل الأطباء صورةً طبيةً لعضوٍ أو منطقةٍ في الجسم، يجب إعطاء كل جزءٍ من الصورة تسميةً تشريحيةً.
على سبيل المثال، إذا كان الدماغ قيد الفحص، فيجب تسمية أجزائه المختلفة على هذا النحو، بكسلًا بكسلًا: القشرة المخية، جذع الدماغ، المخيخ، إلخ.
تُوجِّه هذه العملية، التي تُسمى تجزئة الصور الطبية، التشخيصَ وتخطيطَ الجراحة والبحثَ.
في زمن ما قبل الذكاء الاصطناعي والتعلم الآلي، كان الأطباء يُجرون هذه المهمة الحاسمة، وإن كانت شاقة وتستغرق وقتًا طويلاً، يدويًا، لكن على مدار العقد الماضي، أصبحت شبكات U-nets، وهي نوع من هياكل الذكاء الاصطناعي المُصممة خصيصًا لتجزئة الصور الطبية، هي الخيار الأمثل.
ومع ذلك، تتطلب شبكات U-nets كميات هائلة من البيانات والموارد لتدريبها.
قال كوشال فياس، المؤلف الأول للورقة البحثية: "بالنسبة للصور الكبيرة و/أو ثلاثية الأبعاد، فإن هذه المطالب مكلفة".
وأضاف: "في هذه الدراسة، اقترحنا MetaSeg، وهي طريقة جديدة تمامًا لتجزئة الصور".
في التجارب التي استخدمت بيانات التصوير بالرنين المغناطيسي للدماغ ثنائية وثلاثية الأبعاد، تبين أن MetaSeg يحقق نفس أداء التجزئة مثل U-Nets مع الحاجة إلى معلمات أقل بنسبة 90% - المتغيرات الرئيسية التي تستمدها نماذج الذكاء الاصطناعي/التعلم الآلي من بيانات التدريب وتستخدمها لتحديد الأنماط وإجراء التنبؤات.
فازت الدراسة بجائزة أفضل ورقة بحثية في MICCAI، حيث تم الاعتراف بها من بين مجموعة تضم أكثر من 1000 ورقة بحثية مقبولة.
وقال فياس: "بدلاً من شبكات U-Nets، تستفيد MetaSeg من التمثيلات العصبية الضمنية - وهو إطار عمل للشبكة العصبية لم يُعتقد حتى الآن أنه مفيد أو تم استكشافه لتجزئة الصور".

التمثيل العصبي الضمني
التمثيل العصبي الضمني (INR) عبارة عن شبكة ذكاء اصطناعي تفسر الصورة الطبية كصيغة رياضية تأخذ في الاعتبار قيمة الإشارة (اللون والسطوع وما إلى ذلك) لكل بكسل في صورة ثنائية الأبعاد أو كل فوكسل في صورة ثلاثية الأبعاد.
في حين أن INRs تقدم طريقة مفصلة للغاية ومختصرة لتمثيل المعلومات، فهي أيضًا محددة للغاية، مما يعني أنها تعمل بشكل جيد عادةً فقط للإشارة/الصورة الفردية التي تم تدريبها عليها: لا يمكن لـ INR المدرب على تصوير الدماغ بالرنين المغناطيسي عادةً تعميم القواعد حول شكل أجزاء مختلفة من الدماغ، لذلك إذا تم تزويدها بصورة لدماغ مختلف، فإن INR عادةً ما يتعثر.
وقال فياس: "لقد تم استخدام INRs في مجتمعات الرؤية الحاسوبية والتصوير الطبي لمهام مثل إعادة بناء المشهد ثلاثي الأبعاد وضغط الإشارة، والتي تتطلب فقط نمذجة إشارة واحدة في كل مرة".
وأضاف: "مع ذلك، لم يكن من الواضح قبل MetaSeg كيفية استخدامها لمهام مثل التجزئة، والتي تتطلب أنماط التعلم عبر العديد من الإشارات."
لجعلها مفيدة في تجزئة الصور الطبية، درّب الباحثون نسب INR على التنبؤ بقيم الإشارة وعلامات التجزئة المحددة لصورة معينة.
ولتحقيق ذلك، استخدموا التعلم الفوقي، وهو استراتيجية تدريب ذكاء اصطناعي تُترجم حرفيًا إلى "تعلم التعلّم"، مما يساعد النماذج على التكيف بسرعة مع المعلومات الجديدة.
وقال فياس: "نقوم بتحضير معلمات نموذج INR بطريقة تسمح بتحسينها بشكل أكبر على صورة غير مرئية في وقت الاختبار، مما يمكّن النموذج من فك تشفير ميزات الصورة إلى تسميات دقيقة".
يتيح هذا التدريب الخاص لـ INRs ليس فقط ضبط نفسها بسرعة لتتناسب مع وحدات البكسل أو وحدات البكسل في صورة طبية لم يسبق رؤيتها من قبل، ولكن أيضًا فك تشفير علاماتها، والتنبؤ على الفور بالمكان الذي يجب أن تذهب إليه الخطوط العريضة للمناطق التشريحية المختلفة.
قال جوها بالاكريشنان، الأستاذ المساعد في الهندسة الكهربائية والحاسوبية في جامعة رايس وعضو معهد كين كينيدي التابع للجامعة: "يقدم MetaSeg منظورًا جديدًا وقابلًا للتطوير لمجال تقسيم الصور الطبية الذي كانت تسيطر عليه شبكات U-Nets لمدة عقد من الزمان".
وأضاف: "تبشر نتائج أبحاثنا بجعل تقسيم الصور الطبية أكثر فعالية من حيث التكلفة مع تقديم أعلى مستوى من الأداء".

