طبقه بند مبتنی بر K نزدیکترین همسایه ها با استفاده از جمع وزن دار خطاهای بازسازی

نوع مقاله : مقاله برق

نویسندگان

1 دانشکده مهندسی فناوریهای نوین/ دانشگاه تخصصی فناوریهای نوین آمل

2 دانشکده مهندسی فناوریهای نوین / دانشگاه تخصصی فناوریهای نوین آمل

چکیده

در این مقاله، طبقه‌بندی مبتنی بر طبقه‌بند K نزدیکترین همسایه‌ها و خطای بازسازی، جهت دسته‌بندی داده‌ها معرفی شده است. در روش پیشنهادی، ابتدا K نزدیکترین داده (همسایه) به داده‌ی آزمون، از هر دسته موجود در داده‌های آموزش، محاسبه می‌گردد. سپس به بازسازی داده‌ی آزمون، بر حسب تعداد مختلفی از نزدیکترین همسایه‌ها (از یک تا K)، در هر دسته پرداخته شده و میزان خطای بازسازی به ازای هر تعداد همسایه به طور مجزا محاسبه می‌گردد. در گام بعد، در هر دسته، میزان خطا به صورت جمع وزندار خطای حاصل از تمامی بازسازی‌ها محاسبه می‌گردد. وزن خطای بازسازی، متناسب با تعداد همسایه‌های دخیل در آن در نظر گرفته شده است بدین ترتیب که خطای بازسازی در تعداد همسایه‌های آن ضرب می‌شود. در آخر، داده‌ی آزمون به دسته‌ای تعلق دارد که کمترین میزان خطای کل را دارا است. این عمل موجب می‌گردد تا ترکیبی از طبقه‌بندهای مبتنی بر K نزدیکترین همسایه به صورت هم‌افزایی در طبقه‌بندی داده‌ها نقش ایفا نمایند. در این مقاله از 10 دسته‌مجموعه متعلق به پایگاه داده‌ی سری-زمانی UCR و پنج دسته-مجموعه متعلق به پایگاه داده‌ی دسته‌بندی UCI جهت ارزیابی روش پیشنهادی استفاده شده است. نتایج بدست آمده از این ارزیابی‌ها نشان می‌دهد که روش پیشنهادی، عملکرد طبقه‌بندهای KNN مبتنی بر کمترین خطای بازسازی را به میزان زیادی بهبود بخشیده و نرخ بازشناسی در برخی K‌ ها را در حدود 5 درصد بهتر نموده و متوسط نرخ بازشناسی به ازای تمامی Kها (از 2 الی 15) در حدود 1.6 درصد بهبود یافته است.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

A classifier based on K-nearest neighbors using weighted summation of reconstruction errors

نویسندگان [English]

  • Rassoul Hajizadeh 1
  • Mohammad Ali Hosseinzadeh 2
1 Faculty of Engineering Modern Technologies/ Amol University of Special Modern Technologies
2 Faculty of Engineering Modern Technologies / Amol University of Special Modern Technologies
چکیده [English]

In this paper, a classifier is introduced based on the nearest neighbor classifier and the reconstruction error for data classification. In the proposed method, first, K nearest data points (neighbors) from each category in the training data are calculated for the test data point. Then, the reconstruction of the test data is performed based on different numbers of nearest neighbors (from one to K) in each category, and the reconstruction error is calculated separately for each number of neighbors. In the next step, for each category, the error is calculated as the weighted sum of the errors obtained from all reconstructions. The weight of the reconstruction error is proportional to the number of neighbors involved in it, so the reconstruction error is multiplied by the number of neighbors. Finally, the test data belongs to the category with the lowest overall error. This process allows a combination of K nearest neighbor classifiers to play a role in data classification. In this paper, 10 datasets from the UCR time series database and five datasets from the UCI classification database are used to evaluate the proposed method. The results of these evaluations show that the proposed method significantly improves the performance of the minimum reconstruction error based KNN classifiers, achieving approximately 5% better recognition rate for some K values and an average recognition rate improvement of about 1.6% for all K values (from 2 to 15).

کلیدواژه‌ها [English]

  • Classifier
  • Recognition rate
  • K-nearest neighbors
  • Linear reconstruction
  • Weighted combination