Сравнительный анализ выявления слухов в социальных сетях с использованием различных классификаторов
Ключевые слова:
обнаружение слухов, машинное обучение, социальные сети, SVC, градиентный бустинг, наивный байесовский классификаторАннотация
По мере того, как число пользователей социальных сетей растет, создание и распространение информации увеличиваются каждый день в огромных масштабах. Люди могут делиться своими идеями и мнениями на этих платформах. Сайт микроблогов в социальных сетях, таких как Facebook или Twitter, является предпочтительным средством обсуждения любого важного события, и информация передается немедленно. Это приводит к быстрому распространению слухов и распространению неточной информации, что вызывает у людей беспокойство. Поэтому важно оценить и подтвердить уровень достоверности такой информации. Из-за сложности текста автоматическое обнаружение слухов на ранних стадиях затруднительно. В данном исследовании используются различные методы NLP для извлечения информации из твитов, а затем применяются различные модели машинного обучения, чтобы определить, является ли информация слухом. Классификация выполняется с использованием трех классификаторов, таких как SVC (Support Vector Classifier), Gradient Boosting и классификаторы Naive Bayes для пяти различных событий из набора данных PHEME. Существуют некоторые недостатки: ограниченная обработка несбалансированных данных, трудность улавливания сложных лингвистических шаблонов, отсутствие интерпретируемости, сложности с обработкой больших пространств признаков и нечувствительность к порядку слов и контексту при использовании вышеуказанных классификаторов. Подход суммирования используется для преодоления вышеуказанных недостатков, при котором выходные данные комбинированных классификаторов представляют собой ансамбль с LSTM. Была проанализирована производительность моделей. Экспериментальные результаты показывают, что ансамблевая модель дает эффективные результаты по сравнению с другими классификаторами с точностью 93,59%.
Литература
2. He Z., Li C., Zhou F., Yang Y. Rumor detection on social media with event augmentations. Proceedings of the 44th International ACM SIGIR Conference on Research and Development in Information Retrieval. 2021. pp. 2020–2024.
3. Pathak A.R., Mahajan A., Singh K., Patil A., Nair A. Analysis of techniques for rumor detection in social media. Procedia Computer Science. 2020. vol. 167. pp. 2286–2296.
4. Xuan K., Xia R. Rumor stance classification via machine learning with text, user and propagation features. International Conference on Data Mining Workshops (ICDMW). 2019. pp. 560–566.
5. Shi A., Qu Z., Jia Q., Lyu C. Rumor detection of COVID-19 pandemic on online social networks. IEEE/ACM Symposium on Edge Computing (SEC). 2020. pp. 376–381.
6. Gidwani M., Rao A. Early Identification of Rumors in Social Media: A Survey. Modern Approaches in Machine Learning & Cognitive Science: A Walkthrough. 2022. pp. 305-316. DOI: 10.1007/978-3-030-96634-8_28.
7. Hassan N.Y., Gomaa W.H., Khoriba G.A., Haggag M.H. Supervised learning approach for Twitter credibility detection. 13th International Conference on computer engineering and Systems (ICCES). 2018. pp. 196–201.
8. Zhao Z., Resnick P., Mei Q. Enquiring minds: Early detection of rumors in social media from enquiry posts. Proceedings of the 24th international conference on world wide web. 2015. pp. 1395–1405.
9. Zubiaga A., Liakata M., Procter R. Learning reporting dynamics during breaking news for rumour detection in social media. Computer Science. arXiv preprint arXiv:1610.07363. 2016. 20 p.
10. Kandasamy N., Murugasamy K. Detecting and filtering rumor in social media using news media event. Concurrency and Computation: Practice and Experience. 2021. vol. 33(5). DOI:10.1002/cpe.6329.
11. Kumar A., Bhatia M.P.S., Sangwan S.R. Rumour detection using deep learning and filter-wrapper feature selection in benchmark Twitter dataset. Multimedia Tools and Applications. 2022. vol. 81. no. 24. pp. 34615–34632.
12. Ahmad I., Yousaf M., Yousaf S., Ahmad M.O. Fake news detection using machine learning ensemble methods. Complexity. 2020. vol. 2020. pp. 1–11.
13. Zubiaga A., Aker A., Bontcheva K., Liakata M., Procter R. Detection and resolution of rumours in social media: A survey. ACM Computing Surveys (CSUR). 2018. vol. 51. no. 2. pp. 1–36.
14. Kotteti C.M.M., Dong X., Li N., Qian L. Fake news detection enhancement with data imputation. IEEE 16th Intl Conf on Dependable, Autonomic and Secure Computing, 16th Intl Conf on Pervasive Intelligence and Computing, 4th Intl Conf on Big Data Intelligence and Computing and Cyber Science and Technology Congress (DASC/PiCom/DataCom/CyberSciTech). 2018. pp. 187–192.
15. Li Z., Zhang Q., Du X., Ma Y., Wang S. Social media rumor refutation effectiveness: Evaluation, modelling and enhancement. Information Processing & Management. 2021. vol. 58(1), 102420.
16. Zubiaga A., Wong Sak Hoi G., Liakata M., Procter R. PHEME dataset of rumours and non-rumours. 2016. DOI: 10.6084/M9.FIGSHARE.4010619.V1.
17. Karkali M., Rousseau F., Ntoulas A., Vazirgiannis M. Efficient online novelty detection in news streams. Proceedings of International Conference on Web Information Systems Engineering. 2013. pp. 57–71. DOI: 10.1007/978-3-642-41230-1_5.
18. Vijayaraghavan S., Wang Y., Guo Z., Voong J., Xu W., Nasseri, A., Cai J., Li L., Vuong K., Wadhwa E. Fake news detection with different models. arXiv preprint arXiv:2003.04978. 2020. DOI: 10.48550/arXiv.2003.04978.
19. Vinothkumar S., Varadhaganapathy S., Ramalingam M., Ramkishore D., Rithik S., Tharanies K.P. Fake News Detection Using SVM Algorithm in Machine Learning. Proceedings of International Conference on Computer Communication and Informatics (ICCCI). 2022. pp. 1–7. DOI: 10.1109/ICCCI54379.2022.9740886.
20. Birunda S.S., Devi R.K. A novel score-based multi-source fake news detection using gradient boosting algorithm. Proceedings of International Conference on Artificial Intelligence and Smart Systems (ICAIS). 2021. pp. 406–414.
21. Granik M., Mesyura V. Fake news detection using naive Bayes classifier. Proceedings of IEEE first Ukraine conference on electrical and computer engineering (UKRCON). 2017. pp. 900–903.
Опубликован
Как цитировать
Раздел
Copyright (c) Манья Гидвани, Ашвини Рао
Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.
Авторы, которые публикуются в данном журнале, соглашаются со следующими условиями: Авторы сохраняют за собой авторские права на работу и передают журналу право первой публикации вместе с работой, одновременно лицензируя ее на условиях Creative Commons Attribution License, которая позволяет другим распространять данную работу с обязательным указанием авторства данной работы и ссылкой на оригинальную публикацию в этом журнале. Авторы сохраняют право заключать отдельные, дополнительные контрактные соглашения на неэксклюзивное распространение версии работы, опубликованной этим журналом (например, разместить ее в университетском хранилище или опубликовать ее в книге), со ссылкой на оригинальную публикацию в этом журнале. Авторам разрешается размещать их работу в сети Интернет (например, в университетском хранилище или на их персональном веб-сайте) до и во время процесса рассмотрения ее данным журналом, так как это может привести к продуктивному обсуждению, а также к большему количеству ссылок на данную опубликованную работу (Смотри The Effect of Open Access).