بهبود تشخیص هرزنامه‌های تصویری با استفاده از روشی نوین در انتخاب ویژگی‌های بافت تصویر

نوع مقاله : مقاله کامپیوتر

نویسندگان

1 دانشکده کامپیوتر، دانشگاه آزاد اسلامی واحد بروجرد، بروجرد، ایران

2 دانشکده فنی و مهندسی، دانشگاه آزاد اسلامی واحد تهران مرکز، تهران، ایران

3 دانشکده ریاضیات و کامپیوتر، دانشگاه شاهد، تهران، ایران

چکیده

هرزنامه از معضلاتی است که جوامع بشری را درگیر خود کرده است. با اینکه تحقیقات زیادی در این زمینه صورت گرفته است اما چون هرزنامه‌نویسان مانند ویروس‌ها مدام روش خود را تغییر می‌دهند، لذا همواره نیاز به ارائه راه‌کارهای جدید در این زمینه مشاهده می‌شود. هدف از این پژوهش، استفاده از ویژگی‌های بافت تصویر در تشخیص هرزنامه‌های تصویری می‌باشد. تاکنون از 22 ویژگی بافت تصویر به‌صورت یکجا جهت تشخیص هرزنامه تصویری استفاده نشده است. در این مقاله، روشی ترکیبی جهت استخراج ویژگی‌های کلیدی استفاده می‌شود. در روش ترکیبی پیشنهادی، از ماتریس هم‌رخداد سطح خاکستری، مربع کای و آستانه تغییرات مقدار ویژگی‌ها استفاده می‌شود. مراحل ذکر شده تاثیر بسیار زیادی در عملکرد دسته‌بندها داشته و باعث بهبود دقت تشخیص می‌شود. در مرحله دسته‌بندی از پرکاربردترین الگوریتم‌های یادگیری ماشین برای تشخیص هرزنامه‌های تصویری استفاده می‌شود؛ همچنین پس از بدست آوردن نتایج هر دسته‌بند به بررسی و مقایسه خروجی الگوریتم‌های بکار برده شده بر روی تصاویر هرزنامه و معتبر پرداخته می‌شود. نتایج بدست آمده نشان می‌دهد که می‌توان با کمک روش پیشنهادی به دقت تشخیص خوبی نسبت به سایر روش‌ها رسید. در بین الگوریتم‌های بررسی شده، الگوریتم شبکه عصبی بهترین عملکرد را از خود نشان می‌دهد. الگوریتم مفروض در سایر مقالات دقت تشخیص کمتری را نسبت به مقاله حاضر نشان می‌دهد اما در روش پیشنهادی به دقت تشخیص 99.29 درصد می‌رسد.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Improving Image Spam Detection Using a New Image Texture Features Selection

نویسندگان [English]

  • Azam Shekari Shahrak 1
  • Seyed javad Mirabedini 2
  • Nasser Mikaeilvand 2
  • Seyed Hamid Haj Seyed Javadi 3
1 Department of Computer Engineering, Borujerd Branch, Islamic Azad University, Borujerd, Iran
2 Department of Computer Engineering, Central Tehran Branch, Islamic Azad University, Tehran, Iran
3 Department of Mathematics and Computer Science, Shahed University, Tehran, Iran
چکیده [English]

Spam is one of the problems that has plagued human societies. Although a lot of research has been done in this field, because spammers keep changing their methods like viruses, so there is always a need to provide new solutions in this field. The purpose of the research is to use image texture features to detect image spam. So far, 22 features of image texture have not been used in one place to detect image spam. In this paper, a hybrid method is used to extract key features. In the proposed hybrid method, the co-occurrence matrix of the gray level and chi-square and the threshold of changes in the value of the features are used. The steps mentioned have a great impact on the performance of the categories and improve the accuracy of detection. In the classification stage, the most widely used machine learning algorithms are used to detect image spams, and after obtaining the results of each category, the output of the algorithms used on spam and valid images is examined and compared. The obtained results show that with the help of the proposed method, good detection accuracy can be achieved compared to other methods. Among the reviewed algorithms, the neural network algorithm shows the best performance. The assumed algorithm in other articles shows a lower detection accuracy than the present article, but in the proposed method, it reaches 99.29% detection accuracy.

کلیدواژه‌ها [English]

  • Spam
  • Image
  • Machine learning
  • Neural network
[1] N. Saidani, K. Adi, and M.S. Allili. "A semantic-based classification approach for an enhanced spam detection." Computers & Security 94 (2020): 101716.‏ ‏
[2] N. El-Mawass, P. Honeine, and L. Vercouter. "SimilCatch: Enhanced social spammers detection on twitter using Markov random fields." Information Processing & Management 57, no. 6 (2020): 102317.‏
[3] J. Yang, T. Li, G. Liang, Y.P. Wang, T.Y. Gao, and F.D. Zhu. "Spam transaction attack detection model based on GRU and WGAN-div." Computer Communications 161 (2020): 172-182.‏
[4] H. Mubarak, A. Abdelali, S. Hassan, and K. Darwish. "Spam detection on arabic twitter." In Social Informatics: 12th International Conference, SocInfo 2020, Pisa, Italy, October 6–9, 2020, Proceedings 12, pp. 237-251. Springer International Publishing, 2020.‏
[5] S. Bosaeed, I. Katib, and R. Mehmood. "A fog-augmented machine learning based SMS spam detection and classification system." In 2020 Fifth International Conference on Fog and Mobile Edge Computing (FMEC), pp. 325-330. IEEE, 2020.‏
[6] Y. Tian, M. Mirzabagheri, P. Tirandazi, and S.M. Hosseini Bamakan. "A non-convex semi-supervised approach to opinion spam detection by ramp-one class SVM." Information Processing & Management 57, no. 6 (2020): 102381.‏
[7] L. You, Q. Peng, Z. Xiong, D. He, M. Qiu, and X. Zhang. "Integrating aspect analysis and local outlier factor for intelligent review spam detection." Future Generation Computer Systems 102 (2020): 163-172.‏
[8] N. Sun, G. Lin, J. Qiu, and P. Rimba. "Near real-time twitter spam detection with machine learning techniques." International Journal of Computers and Applications 44, no. 4 (2022): 338-348.‏
[9] D. Komarasamy, O. Duraisamy, S. Krishnamoorthy, S.K. Rajendran, and M.K. Dharani. "Spam Email Filtering using Machine Learning Algorithm." In 2023 7th International Conference on Computing Methodologies and Communication (ICCMC), pp. 1-5. IEEE, 2023.               ‏
[10] A.M. Salih, and B.N. Dhannoon. "Weighted k-Nearest Neighbour for Image Spam Classification." Iraqi Journal of Science (2021): 1036-1045.‏ ‏
[11] N.H. Imam, V.G. Vassilakis, and D. Kolovos. "OCR post-correction for detecting adversarial text images." Journal of Information Security and Applications 66 (2022): 103170.‏‏
[12] C. Sayallar, A. Sayar, and N. Babalık. "An OCR engine for printed receipt images using deep learning techniques." International Journal of Advanced Computer Science and Applications 14, no. 2 (2023).
[13] L. Sun, S. Cheng, Y. Zheng, Z. Wu, and J. Zhang. "SPANet: Successive pooling attention network for semantic segmentation of remote sensing images." IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing 15 (2022): 4045-4057.                   
[14] Y.K. Yaseen, A.K. Abbas, and A.M. Sana. "Image spam detection using machine learning and natural language processing." Journal of Southwest Jiaotong University 55, no. 2 (2020).
[15] H. Jelodar, S.J. Mirabedini, and A. Haroonabadi. "Presenting a Fuzzy System for Identifying Persian Advertising Websites." Modern Applied Science 9, no. 1 (2015): 129.         
[16] A. Sadia, F. Bashir, R.Q. Khan, and A. Khalid. "Comparison of Machine Learning Algorithms for Spam Detection." Journal of Advances in Information Technology 14, no. 2 (2023): 178-184.                           
[17] F. Hossain, M.N. Uddin, and R.K. Halder. "Analysis of optimized machine learning and deep learning techniques for spam detection." In 2021 IEEE International IOT, Electronics and Mechatronics Conference (IEMTRONICS), pp. 1-7. IEEE, 2021.‏ ‏
[18] S. Srinivasan, V. Ravi, V. Sowmya, M. Krichen, D.B. Noureddine, S. Anivilla, and K.P. Soman. "Deep convolutional neural network based image spam classification." In 2020 6th Conference on Data Science and Machine Learning Applications (CDMA), pp. 112-117. IEEE, 2020.‏ ‏
[19] N.N. Abuzaid, and H.Z. Abuhammad. "Image SPAM Detection Using ML and DL Techniques." International Journal of Advances in Soft Computing & Its Applications 14, no. 1 (2022).
[20] M. Sumathi, and S.P. Raja. "Machine learning algorithm-based spam detection in social networks." Social Network Analysis and Mining 13, no. 1 (2023): 104.‏
[21] A. Kaşoğlu, and O. Yaman. "LBP Feature Extraction and Statistical Pooling-Based Image Spam Detection Model." Computer Science 8, no. 1 (2023): 24-35.‏