Gelişmiş Arama

Basit öğe kaydını göster

dc.contributor.authorTiryaki, Hande
dc.contributor.authorUysal, Alper Kürşat
dc.date.accessioned2023-11-01T08:16:24Z
dc.date.available2023-11-01T08:16:24Z
dc.date.issued03.05.2023en_US
dc.identifier.citationTiryaki, H. & Uysal, A. K. (2023). Dengesiz Metin Sınıflandırmada Öznitelik Seçim Yöntemlerinin Etkililiği . Afyon Kocatepe Üniversitesi Fen Ve Mühendislik Bilimleri Dergisi , 23 (2) , 370-379 . DOI: 10.35414/akufemubid.1172637en_US
dc.identifier.urihttps://doi.org/10.35414/akufemubid.1172637
dc.identifier.urihttps://dergipark.org.tr/tr/download/article-file/2639544
dc.identifier.urihttps://hdl.handle.net/11630/11309
dc.description.abstractMetin verilerinin sınıflar arasında dağılımı genellikle eşit değildir. Bu durum, metin sınıflandırma işleminde sınıflandırıcıların performansına olumsuz yansımaktadır. Dengesiz metin sınıflandırma ile ilgili birçok çalışma yapılmıştır. Metin sınıflandırma işleminin önemli aşamalarından olan öznitelik seçim aşaması, dengesiz metin probleminde de kritik öneme sahiptir. Öznitelik seçme metotlarının dengesiz metinlerin sınıflandırılması üzerindeki etkisi bu çalışmada etraflıca araştırılmıştır. Bu doğrultuda, iki farklı veri seti üzerinde üç farklı sınıflandırıcı ve dokuz farklı öznitelik seçim metodu ile birçok deney yapılmıştır. Ayrıca öznitelik seçim yöntemlerinin başarıları farklı öznitelik sayılarında da gözlemlenmiştir. NDM, DFSS, PFS, POISSON, CHI2, IG, GINI, DFS ve MDFS olarak adlandırılan 9 farklı öznitelik seçim metodu değerlendirilmiştir. Destek Vektör Makinesi (SVM), Karar Ağacı (DTREE) ve Basit Bayes (MNB) sınıflandırıcıları ile deneysel sonuçlar elde edilmiştir. Reuters-21578 veri setinde DFS ve CHI2 öznitelik seçim yöntemleri Makro-F1 değerlendirme metriği üzerinden yaklaşık en yüksek 80 değerini alırken, SPAM SMS veri setinde, DFS öznitelik seçim yöntemi en yüksek skor olarak 95 ve CHI2 öznitelik seçim yöntemi 94 değerlerini almıştır. Öznitelik seçme metotlarından DFS ve CHI2’nin dengesiz metin sınıflandırmada daha başarılı olduğu görülmektedir.en_US
dc.description.abstractThe distribution of text data across classes is often imbalanced. This situation has a negative impact on the performance of classifiers in the text classification process. Many studies have been performed on imbalanced text classification. The feature selection stage, which is one of the important stages of the text classification process, is also critical in the imbalanced text classification problem. The effect of feature selection methods on the classification of imbalanced texts has been thoroughly investigated in this study. In this direction, many experiments were carried out with three different classifiers and nine different feature selection methods on two different data sets. In addition, the success of feature selection methods has been observed employing different number of features. Nine different feature selection methods called NDM, DFSS, PFS, POISSON, CHI2, IG, GINI, DFS and MDFS were evaluated. Experimental results obtained with Support Vector Machines (SVM), Decision Tree (DTREE), and Naïve Bayes (MNB) classifiers. On the Reuters-21578 dataset, DFS and CHI2 feature selection methods obtained approximately 80 as the highest Macro-F1 score. On the SPAM SMS dataset, DFS feature selection method obtained 95 and CHI2 feature selection method obtained 94 as the highest Macro-F1 score. It is seen that feature selection methods DFS and CHI2 are more successful than the others for imbalanced text classification.en_US
dc.language.isoturen_US
dc.publisherAfyon Kocatepe Üniversitesien_US
dc.identifier.doi10.35414/akufemubid.1172637en_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectDengesiz Metin Sınıflandırmaen_US
dc.subjectBoyut İndirgemeen_US
dc.subjectÖznitelik Seçimien_US
dc.subjectTerim Seçimien_US
dc.subjectImbalanced Text Classificationen_US
dc.subjectDimension Reductionen_US
dc.subjectFeature Selectionen_US
dc.subjectTerm Selectionen_US
dc.titleDengesiz metin sınıflandırmada öznitelik seçim yöntemlerinin etkililiğien_US
dc.title.alternativeThe effectiveness of feature selection methods for ımbalanced text classificationen_US
dc.typearticleen_US
dc.relation.journalAfyon Kocatepe Üniversitesi Fen ve Mühendislik Bilimleri Dergisien_US
dc.departmentAfyon Kocatepe Üniversitesien_US
dc.authorid0000-0002-1533-6901en_US
dc.authorid0000-0002-4057-934Xen_US
dc.identifier.volume23en_US
dc.identifier.startpage370en_US
dc.identifier.endpage379en_US
dc.identifier.issue2en_US
dc.relation.publicationcategoryMakale - Ulusal Hakemli Dergi - Başka Kurum Yazarıen_US


Bu öğenin dosyaları:

Thumbnail

Bu öğe aşağıdaki koleksiyon(lar)da görünmektedir.

Basit öğe kaydını göster