تولید خودکار گزارش برای تصاویر قفسه سینه با استفاده از ترکیب مدل کانولوشنی بازگشتی و معماری توجه محور

قادری, فردین; خدابخشی, محمدباقر; جاماسب, شهریار

doi:10.22075/jme.2025.35811.2749

تولید خودکار گزارش برای تصاویر قفسه سینه با استفاده از ترکیب مدل کانولوشنی بازگشتی و معماری توجه محور

مقالات آماده انتشار

نوع مقاله : مقاله کامپیوتر

نویسندگان

¹ کارشناسی ارشد، گروه مهندسی پزشکی، دانشکده مهندسی پزشکی و مکانیک، دانشگاه صنعتی همدان، همدان، ایران

² استادیار گروه مهندسی پزشکی- دانشگاه صنعتی همدان

³ دانشیار، گروه مهندسی پزشکی، دانشکده مهندسی پزشکی و مکانیک، دانشگاه صنعتی همدان، همدان، ایران

10.22075/jme.2025.35811.2749

چکیده

در مطالعات علوم پزشکی، از تصاویر پزشکی برای تشخیص و طراحی پروتکل درمان بیماری ها بصورت گسترده استفاده می‌شود. برای پزشکان کم‌تجربه، نوشتن گزارش پزشکی به شکل متنی ممکن است مستعد خطا باشد، زیرا این کار نیازمند درک عمیق نسبت به بیماری و تجزیه و تحلیل آن است. همچنین برای متخصصان، این کار به دلیل تعدد بیمارانی که در یک روز مراجعه می‌کنند زمان‌بر و پر زحمت است. از دیدگاه دیگر، وجود گزارش های الگو برای پزشکان می‌تواند به میزان قابل توجهی دقت آن ها را در تشخیص بیماری افزایش دهد و خطای ناشی از عدم توجه به جزئیات را کاهش دهد. این پژوهش یک مدل مبتنی بر یادگیری عمیق را برای تولید خودکار گزارش‌های تصاویر رادیولوژی ارائه نموده است. این مدل بر پایه ترکیب یک ساختار کانولوشنی بازگشتی و معماری توجه محور است که با نام Res-LSTM-Attn معرفی گردیده است. در این مدل ابتدا از تصاویر پزشکی با استفاده از شبکه عصبی کانولوشنی رِزنت ویژگی ها استخراج خواهند شد و بر اساس یک مدل چند برچسبی کلمات یک گزارش پیش بینی خواهند شد. در ادامه با استفاده از شبکه عصبی بازگشتی LSTM و لایه های توجه چندسر گزارش نهایی تولید می‌شود. عملکرد مدل های پیشنهادی بر اساس معیارهای BLEU 1-4 و ROUGE-L و CIDEr-D مورد ارزیابی قرار گرفت. نتایج نشان داد مدل پیشنهادی از نظر معیار CIDEr-D و ROUGE-L در تولید گزارشات طولانی بر مطالعات پیشین غلبه کرده است و این مقادیر بترتیب به میزان 7/2 و 3/2 درصد بهبود یافته اند.

کلیدواژه‌ها

موضوعات

مهندسی پزشکی (بیوالکتریک)

عنوان مقاله [English]

Medical Report Generation for Chest X-rays Using Convolutional Recurrent and Attention-Based Architectures

نویسندگان [English]

Fardin Ghaderi ¹
Mohammad Bagher Khodabakhshi ²
Shahriar Jamasb ³

¹ MSc, Biomedical Engineering Department, Hamedan University of Technology, Hamedan, Iran

² Assistant Professor, Biomedical Engineering Department- Hamedan University of Technology

³ Associate Professor, Biomedical Engineering Department, Hamedan University of Technology, Hamedan, Iran

چکیده [English]

Medical images are extensively used in medical science for diagnosis and treatment protocol design. Writing medical reports in text form can be error-prone for inexperienced physicians due to the deep understanding of the disease and its analysis. It is also time-consuming and laborious for experts due to the large number of patients they see in a day. Also, the existence of template reports for physicians can significantly increase their accuracy in diagnosing diseases and reduce errors caused by inattention to details. This research presents a deep learning-based model for the automatic generation of radiology reports. This model is based on a combination of a convolutional recurrent structure and an attention-based architecture called Res-LSTM-Attn. In this model, features are first extracted from medical images using a convolutional residual network, and based on a multi-label word model, a report is predicted. Then, using the LSTM recurrent neural network and multi-head attention layers, the final report is generated. The performance of the proposed models was evaluated based on the BLEU 1-4, ROUGE-L, and CIDEr-D criteria. The results showed that the proposed model outperformed previous studies in generating long reports in terms of CIDEr-D and ROUGE-L metrics, with improvements of 7.2% and 3.2%, respectively.

کلیدواژه‌ها [English]

Medical image processing
Recurrent deep neural networks
Automatic image captioning
Encoder
Decoder
Attention mechanism

مقالات آماده انتشار، پذیرفته شده
انتشار آنلاین از تاریخ 23 شهریور 1404

فایل ها

سابقه مقاله

تاریخ دریافت: 15 آبان 1403
تاریخ بازنگری: 09 خرداد 1404
تاریخ پذیرش: 31 خرداد 1404

تعداد مشاهده مقاله: 321
تعداد دریافت فایل اصل مقاله: 27

تولید خودکار گزارش برای تصاویر قفسه سینه با استفاده از ترکیب مدل کانولوشنی بازگشتی و معماری توجه محور

Medical Report Generation for Chest X-rays Using Convolutional Recurrent and Attention-Based Architectures

مقالات آماده انتشار، پذیرفته شده
انتشار آنلاین از تاریخ 23 شهریور 1404

فایل ها

سابقه مقاله

هم رسانی

ارجاع به این مقاله

آمار

تولید خودکار گزارش برای تصاویر قفسه سینه با استفاده از ترکیب مدل کانولوشنی بازگشتی و معماری توجه محور

Medical Report Generation for Chest X-rays Using Convolutional Recurrent and Attention-Based Architectures

مقالات آماده انتشار، پذیرفته شده انتشار آنلاین از تاریخ 23 شهریور 1404

فایل ها

سابقه مقاله

هم رسانی

ارجاع به این مقاله

آمار

مقالات آماده انتشار، پذیرفته شده
انتشار آنلاین از تاریخ 23 شهریور 1404