НЕСБАЛАНСИРОВАННОСТЬ КЛАССОВ ПРИ РЕШЕНИИ ЗАДАЧИ КЛАССИФИКАЦИИ ПОЛЬЗОВАТЕЛЕЙ СОЦИАЛЬНЫХ СЕТЕЙ ПО ПРОФЕССИОНАЛЬНОЙ ОРИЕНТАЦИИ
DOI:
https://doi.org/10.31618/nas.2413-5291.2021.2.68.449Ключевые слова:
классификация; несбалансированность классов; парадокс точности; точность распознавания.Аннотация
Проблему несбалансированности данных часто недооценивают при решении задач классификации. Модель классификации, так на первый взгляд хорошо обученная на ваших данных и дающая хороший процент распознавания, может оказаться недостоверной. Рассмотрение данной проблемы в контексте конкретной задачи классификации пользователей социальных сетей по профессиональной ориентации позволит понять, как, зачем и, самое важное, когда нужно избавляться от несбалансированности данных.
Библиографические ссылки
8 taktik dlya borby s nesbalansirovannymi klassami v vashem nabore dannyh mashinnogo obucheniya – rezhim dostupa: https://www.machinelearningmastery.ru/tactics-tocombat-imbalanced-classes-in-your-machine-learningdataset/
Samir, A. Transfer learning for class imbalance problems with inadequate data / A. Samir, K. R. Chandan // Knowl Inf Syst 48. — 2015. — P. 201–228.
Weka Wiki – rezhim dostupa: https://waikato.github.io/weka-wiki/
Mahsotova, C. V. Issledovanie metodov klassifikacii pri nesbalansirovannosti klassov / C. V. Mahsotova // Nauchnyj zhurnal. – 2017. – № 5(18). – S. 35-36.
Starovojtov V. V. Ob ocenke rezultatov klassifikacii nesbalansirovannyh dannyh po matrice oshibok / V. V. Starovojtov, Yu. I. Golub // Informatika. – 2021. − T. 18, № 1. – S. 61–71.
Загрузки
Опубликован
Выпуск
Раздел
Лицензия
Это произведение доступно по лицензии Creative Commons «Attribution-NoDerivatives» («Атрибуция — Без производных произведений») 4.0 Всемирная.
CC BY-ND
Эта лицензия позволяет свободно распространять произведение, как на коммерческой, так некоммерческой основе, при этом работа должна оставаться неизменной и обязательно должно указываться авторство.