تشخیص نویسنده از دست‌خط‌های برون‌خط مستقل از زبان نوشتاری مبتنی بر بافت با بهره‌گیری از تبدیل موجک در محیط دو زبانه فارسی - انگلیسی

نوع مقاله : مقاله کامپیوتر

نویسندگان

1 گروه مهندسی کامپیوتر، دانشگاه صنعتی بیرجند، بیرجند، ایران

2 دانش آموخته کارشناسی ارشد، گروه مهندسی کامپیوتر، دانشگاه آزاد اسلامی، بیرجند

3 دانشجوی پسادکتری، گروه مهندسی کامپیوتر، دانشگاه قطر

10.22075/jme.2021.21786.1993

چکیده

پیشرفت‌های اخیر در فناوری اطلاعات و همچنین نیاز روزافزون به امنیت بیشتر، منجر به توسعه سریع سیستم‌های هوشمند تشخیص هویت براساس خصوصیات بیومتریک شده است. پژوهش‌های اخیر اثبات نموده‌اند که دست‌خط افراد نیز منحصر به فرد بوده و می-تواند به عنوان یکی از روش‌های احراز هویت مورد استفاده قرار بگیرد. تاکنون مطالعات بسیاری بر روی دست‌نوشته‌های فرد بر پایه یک زبان مشخص، انجام شده اما این روش‌ها استقلال از زبان نوشتاری نداشته‌اند. از طرف دیگر، حتی بانک اطلاعاتی نیز برای این‌کار نیز موجود نمی‌باشد. در این مقاله برای اولین بار، بانک اطلاعاتی دست‌خط ۳۰۰ نفر در دو زبان فارسی و انگلیسی جمع‌آوری گردید. هدف این مقاله، ارائه مدلی به منظور شناسایی نویسنده از روی دست‌خط، مستقل از زبان نوشته شده در زبان‌های فارسی و انگلیسی می-باشد. پس از اعمال پیش‌پردازش بر روی تصاویر، دست‌خط هر فرد به بلاک‌هایی با اندازه-های مشخص تبدیل شده که بافت نامیده می‌شود. سپس، با استفاده از این بافت‌ها که بر روی دست‌خط هر فرد در زبان فارسی و انگلیسی ایجاد شده، ویژگی‌های مورد نظر استخراج می‌شود. به منظور استخراج این ویژگی‌ها ابتدا تبدیل موجک دو بعدی بر روی تصویر اعمال شده و سپس با استفاده از الگوریتم جدید محاسبه بعد فرکتالی که برای اولین بار در این حوزه استفاده می‌شود، بردار ویژگی به دست می‌آید. در انتها نیز با استفاده از شبکه‌های عصبی پرسپترون چند لایه طبقه‌بندی دست‌خط افراد صورت می‌گیرد و نتایج در سناریوهای مختلف گزارش می‌شود.

کلیدواژه‌ها


عنوان مقاله [English]

Script independent offline writer identification from handwriting samples based on texture using wavelet transform in Persian-English languages

نویسندگان [English]

  • Mostafa Sabzekar 1
  • Reyhane Khazaei 2
  • Vahide Babaiyan 1
  • Younes Akbari 3
1 Department of Computer Engineering, Birjand University of Technology, Birjand, Iran
2 Department of Computer Engineering, Islamic Azad University, Birjand
3 Department of Computer Engineering, Qatar University, Qatar
چکیده [English]

Recent advances in information technology and the need for more security have led to the rapid development of intelligent biometric identification systems. Recent studies have proven that handwriting of each person is unique and can be used as one of the authentication methods. There are many researches in the literature for writer identification on a specific language. Unfortunately, there are no necessary data sets for this purpose. In this paper, for the first time, a handwritten data set of 300 persons in both Persian and English languages was collected. The main goal of this paper is to provide a model to identify the writer independent of the language written in Persian and English. After pre-processing stage, each person's handwriting is converted into blocks of a certain size called a texture. Then, using these textures, the desired features are extracted. In order to extract these features, first a two-dimensional wavelet transform is applied to each image and then, using the new algorithm for calculating the fractal dimension, which is used for the first time in this field, the feature vector is obtained. Finally, MLP neural networks are utilized for classification step. The performance of the proposed method is evaluated in different scenarios.

کلیدواژه‌ها [English]

  • Writer identification
  • Language-independent handwriting recognition
  • Creating textures
  • Wavelet Transform
  • Fractal dimension