ترجمه تصویر حرارتی به نور مرئی با استفاده از شبکه‌های مولد تخاصمی

نوع مقاله : مقاله کامپیوتر

نویسندگان

دانشگاه سمنان

چکیده

سیستم‌های تصویربرداری حرارتی، با توجه به ویژگی‌های منحصربه‎‎فرد خود، مانند توانایی ثبت تصاویر در شرایط آب‎و‎هوای مختلف، ثبت تصاویر در شب و یا دارا بودن خاصیت ضد‎جعل، کاربرد‌های نظامی، امنیتی و قضایی ویژه‌ای دارند. با این حال، تصاویر ثبت‎شده توسط دوربین‌های حرارتی، با استفاده از چشم انسان قابل‎تشخیص نبوده و شناسایی چهره تصاویر حرارتی، برای انسان بسیار سخت است. تبدیل تصاویر حرارتی به تصاویر نور مرئی، در حوزه انتقال محتوای تصویر یا ترجمه تصویر به تصویر قرار دارد. تاکنون، مدل‌های یادگیری عمیق بسیاری برای تبدیل تصاویر حرارتی به نور مرئی معرفی شده‌اند. از بین این مدل‌ها، شبکه‌های مولد تخاصمی توانسته‌اند به پیشرفت قابل‎توجهی در این زمینه دست پیدا کنند. در این مقاله، سعی شد تا شبکه‌ ClawGAN که به‌طور خاص برای تبدیل تصاویر حرارتی به نور مرئی ارائه شده‌است، بهبود داده‌شود. راهکار ما بر پایه‌ی ادغام تکنیک‌های موثر نظیر Unet++، Unet3+، شبکه خودتوجه در مولد معماری پایه است. بدین‎صورت، شبکه قادر خواهد بود تا در زمان انتقال محتوا از دامنه‌ حرارتی به دامنه‌ی نور مرئی، تصاویر با کیفیت بالاتری را تولید کند که قابل‎تشخیص از طریق چشم انسان بوده و دارای کمترین اعوجاج، تاری و نویز باشند. نتایج بدست‎آمده نشان داد که مولد پیشنهادی توانست باعث بهبود قابل‎توجه معیار‎های ارزیابی مانند MSE، PSNR، RMSE، UQI و PSNR-B شود.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Facial Thermal Image Translation to RGB Visible Light using GAN

نویسندگان [English]

  • Nastaran Malekpoor
  • Mohammad Javad Fadaeieslam
Semnan University
چکیده [English]

Thermal imaging systems, due to their unique features, such as the ability to record images in different weather conditions, recording images at night, or having anti-counterfeiting properties, have special military, security and judicial applications. However, the images recorded by thermal cameras cannot be recognized by the human eye, and it is very difficult for humans to recognize the faces of thermal images. Converting thermal images to visible light images is in the field of image-to-image content transfer or image to image translation. So far, many deep learning models have been introduced to convert thermal images into visible light. Among these models, adversarial networks have been able to achieve significant progress in this field. In this paper, an attempt was made to improve the ClawGAN network, which is specifically designed to convert thermal images into visible light. Our method is based on the integration of effective techniques such as Unet++, Unet3+, self-attention network in the generator of the base model. In this way, the network will be able to produce higher quality images that can be recognized by the human eye and have minimal distortion, blur and noise when transferring content from the thermal domain to the visible light domain. The obtained results showed that the proposed generator was able to significantly improve the evaluation criteria such as MSE, PSNR, RMSE, UQI and PSNR-B

کلیدواژه‌ها [English]

  • Image-to-image translation
  • Thermal image
  • RGB visible light image
  • Generative Adversarial Network
  • Self attention