نقش شبکه‌های اجتماعی در پیش‌بینی نرخ ابتلا به کرونا‌ویروس

نوع مقاله : مقاله کامپیوتر

نویسندگان

دانشکده مهندسی کامپیوتر، دانشگاه صنعتی شاهرود، شاهرود، ایران.

چکیده

از آن‌جایی که کروناویروس به‌عنوان یک بیماری عفونی همه‌گیر در سال 2019 شناخته شد بیشتر مردم در طول این همه‌گیری مجبور به ماندن در خانه‌های خود شدند. با توجه به این که شبکه‌های اجتماعی به‌عنوان یک رسانه محبوب در بین مردم و در زمان همه‌گیری شناخته شده است، بنابراین تحلیل محتوای اجتماعی تولید شده توسط کاربران می‌تواند بینش‌های جدیدی را ارائه کند و برای ردیابی وقوع همه‌گیری در طول زمان موثر باشند. . این پژوهش با هدف ارائه مدلی برای پیش‌بینی نرخ بروز کووید-19 در موج اول همه‌گیری در ایران، از طریق تحلیل پست‌های اینستاگرامی فارسی انجام شد. با استفاده از تکنیک هم‌افزایی، سه ویژگی شباهت معنایی، احساس ترس و احساس امید از پست‌های اینستاگرامی استخراج شد. برای این منظور، تکنیک‌های تعبیه کلمه (Word2Vec, Glove, FastText) برای محاسبه شباهت معنایی و مدل طبقه‌بند مبتنی بر BERT برای شناسایی احساسات ترس و امید به کار گرفته شد. همچنین برای بهبود عملکرد، از مدل SBERT به‌جای روش‌های کلاسیک تعبیه نیز استفاده شد. سپس مدل رگرسیون بردار پشتیبان (SVR) با استفاده از شاخص‌های آماری مبتنی بر این ویژگی‌ها برای پیش‌بینی نرخ بروز روزانه کووید-19 آموزش داده شدند. نتایج نشان داد که هم‌افزایی ویژگی‌های شباهت معنایی و احساس ترس با استفاده از SBERT در مدل SVM بالاترین عملکرد را با ضریب تعیین (R²) 0.52 ارائه می‌دهد، که نسبت به روش‌های پایه بهبود قابل‌توجهی نشان می‌دهد. این یافته‌ها نشان می‌دهند که ترکیب خودکار ویژگی‌های معنایی و احساسی می‌تواند شاخصی مؤثر برای پایش بیماری‌های همه‌گیر از طریق شبکه‌های اجتماعی باشد.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

The Role of Social Networks in Predicting the Coronavirus Infection Rate

نویسندگان [English]

  • fahimeh hafezi
  • maryam khodabakhsh
Faculty of Computer Engineering, Shahrood University of Technology, Shahrood, Iran.
چکیده [English]

Since the coronavirus was recognized as a pandemic infectious disease in 2019, most people were forced to stay at home during the pandemic. Given that social networks are a popular medium among people and during the pandemic, the analysis of user-generated social content can provide new insights and be effective for tracking the occurrence of the pandemic over time. This study aimed to provide a model to predict the incidence rate of COVID-19 in the first wave of the pandemic in Iran, through the analysis of Persian Instagram posts. Using the synergetic technique, three features of semantic similarity, fear feeling, and hope feeling were extracted from Instagram posts. For this purpose, word embedding techniques (Word2Vec, Glove, FastText) were used to calculate semantic similarity, and a BERT-based classifier model was used to identify fear and hope feelings. To improve performance, the SBERT model was also used instead of classical embedding methods. Then, a support vector regression (SVR) model was trained using statistical indices based on these features to predict the daily incidence rate of COVID-19. The results showed that the synergy of semantic similarity and fear sentiment features using SBERT in the SVM model provided the highest performance with a coefficient of determination (R²) of 0.52, which showed a significant improvement over the baseline methods. These findings indicate that the automatic combination of semantic and sentiment features can be an effective indicator for monitoring epidemics through social networks.

کلیدواژه‌ها [English]

  • Coronavirus
  • Social media
  • Incidence rate estimation
  • Synergy
  • sentiment analysis

مقالات آماده انتشار، پذیرفته شده
انتشار آنلاین از تاریخ 13 مهر 1404
  • تاریخ دریافت: 18 تیر 1403
  • تاریخ بازنگری: 19 خرداد 1404
  • تاریخ پذیرش: 01 مهر 1404