ارائه یک روش نوین و کارآمد استخراج ویژگی برای بازشناسی گفتار مقاوم مبتنی بر تبدیل فوریه کسری و بهینه ساز تکامل تفاضلی

نوع مقاله: مقاله برق

نویسندگان

1 دانشگاه صنعتی شاهرود

2 دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی شاهرود

10.22075/jme.2020.19267.1821

چکیده

یکی از چالش های اساسی در تشخیص گفتار، استخراج ویژگی مقاوم نسبت به نویز می-باشد. در این مقاله یک الگوریتم استخراج ویژگی جدید که الگوریتم استخراج ضرائب کپسترال توان نرمالیزه شده کسری وفقی نامیده می‌شود، بعنوان یک روش مقاوم در برابر نویز برای کاربرد بازشناسی گفتار ارائه شده است. این روش استخراج ویژگی پیشنهادی مبتنی بر تبدیل فوریه گسسته کسری زمان کوتاه می‌باشد. از آنجایی که انتخاب ضریب تبدیل کسری برای تحلیل های مناسب سیگنال های چند جزئی از قبیل گفتار همچنان مورد بحث است، در این روش پیشنهادی با استفاده از الگوریتم فرا ابتکاری تکامل تفاضلی، پارامتر بهینه α برای تبدیل فوریه کسری با توجه به کلاس نویز موجود در محیط بصورت وفقی بدست می‌آید. همچنین از دادگان TI Digit و Noisex-92 به منظور ارزیابی میزان مقاومت و دقت بازشناسی سیستم بازشناس گفتار خودکار استفاده شده است. نتایج شبیه سازی بیانگر مقاومت بیشتر و دقت بازشناسی بالاتر روش استخراج ویژگی پیشنهادی در قیاس با سایر روش‌های استخراج ویژگی در محیط‌های نویزی و بدون نویز می باشد. در سیستم ASR پیشنهادی از طبقه بند ماشین بردار پشتیبان با کرنل غیرخطی استفاده شده است. لازم به ذکر است که تمامی شبیه‌سازی‌های انجام شده توسط نرم افزار MATLAB صورت گرفته است.

کلیدواژه‌ها


عنوان مقاله [English]

A New and Efficient Feature Extraction Method for Robust Speech Recognition Based on Fractional Fourier Transform and Differential Evolution Optimizer

نویسندگان [English]

  • Mohsen Sadeghi 1
  • Hossein Marvi 2
  • Ali Reza Ahmadyfard 2
1 Shahrood University of Technology
2 Faculty of Electrical and Computer Engineering, Shahrood University of Technology
چکیده [English]

One of the main challenges in speech recognition is noise resistant feature extraction. In this paper, a new feature extraction algorithm, called Fractional and Adaptive Power Normalized Cepstral Coefficients Algorithm, has been proposed as a noise-resistant method for speech recognition. This proposed feature extraction method is based on a fractional short-term Fourier Transform. The selection of fractional conversion coefficient is important for proper analysis of multi-component signals like speech. Therefore, the proposed method obtains the optimum parameter of α for fractional Fourier Transform based on the noise class in the environment, adaptively by the Differential Evolution meta-heuristic algorithm. Moreover, TI Digit and Noisex-92 are used for evaluation of the resistance and accuracy of the recognition of the automatic speech recognition system. Simulation results show more resistance and higher recognition accuracy of the proposed feature extraction method rather than other methods in noisy and without noise environments. In the proposed ASR system, the Support Vector Machine (SVM) classifier with a nonlinear kernel has been used. Also, all the simulations are performed in MATLAB.

کلیدواژه‌ها [English]

  • Fractional Fourier Transform
  • Differential evolution algorithm
  • Robust Feature Extraction
  • Robust Speech Recognition
  • Classifier
  • ASR