Dengesiz sınıf durumunda ikili sınıflandırma yöntemlerinin karşılaştırılması
Abstract
Bu çalışmada dengesiz sınıf dağılımı durumunda ikili sınıflandırma problemi incelenmiştir. Dengesiz sınıf dağılımı olduğu durumda örnekleme yöntemlerinden yararlanılmaktadır. Böylece, dengeli bir sınıf dağılımı elde edilmektedir. Bu amaçla SMOTE-NC algoritması kullanılmıştır. Lojistik regresyon, destek vektör makineleri ve gradient boosting modellerinin SMOTE-NC algoritması altında elde edilen dengeli veri setlerindeki performansları incelenmiştir. Elde edilen sonuçlara göre SMOTE-NC algoritmasının gradient boosting ile birlikte kullanımı dengesiz sınıf dağılımı durumunda ikili sınıflandırma başarısını artırmaktadır. SMOTE-NC algoritması azınlık sınıfın doğru sınıflandırma oranını yükseltmektedir. This study investigates the binary classification problem in the case of imbalanced class distribution. In case of imbalanced class distribution, sampling methods are utilized. In this way, a balanced class distribution is obtained. SMOTE-NC algorithm is used for this purpose. The performances of logistic regression, support vector machines and gradient boosting models on balanced data sets obtained under SMOTE-NC algorithm are analyzed. According to the obtained results, the use of SMOTE-NC algorithm together with gradient boosting increases the binary classification performance in case of imbalanced class distribution. SMOTE-NC algorithm increases the correct classification rate of the minority class.