НЕСБАЛАНСИРОВАННОСТЬ КЛАССОВ ПРИ РЕШЕНИИ ЗАДАЧИ КЛАССИФИКАЦИИ ПОЛЬЗОВАТЕЛЕЙ СОЦИАЛЬНЫХ СЕТЕЙ ПО ПРОФЕССИОНАЛЬНОЙ ОРИЕНТАЦИИ

Авторы

  • V. Obrubova "Vladimir State University named after Alexander Grigorievich and Nikolai Grigorievich Stoletovs" (VlSU)
  • M. Ozerova "Vladimir State University named after Alexander Grigorievich and Nikolai Grigorievich Stoletovs" (VlSU)

DOI:

https://doi.org/10.31618/nas.2413-5291.2021.2.68.449

Ключевые слова:

классификация; несбалансированность классов; парадокс точности; точность распознавания.

Аннотация

Проблему несбалансированности данных часто недооценивают при решении задач классификации. Модель классификации, так на первый взгляд хорошо обученная на ваших данных и дающая хороший процент распознавания, может оказаться недостоверной. Рассмотрение данной проблемы в контексте конкретной задачи классификации пользователей социальных сетей по профессиональной ориентации позволит понять, как, зачем и, самое важное, когда нужно избавляться от несбалансированности данных.

Биографии авторов

V. Obrubova , "Vladimir State University named after Alexander Grigorievich and Nikolai Grigorievich Stoletovs" (VlSU)

2nd year master's student of the Department of Information Systems and Software Engineering

M. Ozerova , "Vladimir State University named after Alexander Grigorievich and Nikolai Grigorievich Stoletovs" (VlSU)

candidate of technical sciences, associate professor

Библиографические ссылки

8 taktik dlya borby s nesbalansirovannymi klassami v vashem nabore dannyh mashinnogo obucheniya – rezhim dostupa: https://www.machinelearningmastery.ru/tactics-tocombat-imbalanced-classes-in-your-machine-learningdataset/

Samir, A. Transfer learning for class imbalance problems with inadequate data / A. Samir, K. R. Chandan // Knowl Inf Syst 48. — 2015. — P. 201–228.

Weka Wiki – rezhim dostupa: https://waikato.github.io/weka-wiki/

Mahsotova, C. V. Issledovanie metodov klassifikacii pri nesbalansirovannosti klassov / C. V. Mahsotova // Nauchnyj zhurnal. – 2017. – № 5(18). – S. 35-36.

Starovojtov V. V. Ob ocenke rezultatov klassifikacii nesbalansirovannyh dannyh po matrice oshibok / V. V. Starovojtov, Yu. I. Golub // Informatika. – 2021. − T. 18, № 1. – S. 61–71.

Загрузки

Опубликован

2021-07-10

Выпуск

Раздел

Статьи