Turkish text classification based on wrapper feature selection using particle swarm optimization

dc.contributor.authorZorarpacı, Ezgi
dc.date.accessioned2025-06-04T13:44:00Z
dc.date.available2025-06-04T13:44:00Z
dc.date.issued01.10.2024en_US
dc.departmentSeçinizen_US
dc.description.abstractThe vast majority of the digital era data is stored as text. Text mining is an integral part of data mining. Text classification (TC) is a natural language processing (NLP) operation often needed in text mining. This operation is needed in numerous kinds of research such as information retrieval, document classification, language detection, sentiment analysis, etc. According to the literature, the filter feature selection methods have often been applied to reduce the dimensionality of data in Turkish TC. However, the wrapper-based feature selection methods can provide better classification accuracies than the filter methods. Motivated by this idea, a Turkish TC method based on wrapper feature selection using particle swarm optimization algorithm (PSO) and multinomial naive bayes (MNB) classifier is proposed in this study. TTC-3600 Turkish news texts are used for TC in the experiments. The proposed method achieves a classification accuracy of 94.55% on TTC-3600 Turkish news text dataset by using stemming Tf-Idf features. Hence, it produces competitive accuracies to the cutting-edge Turkish TC methods.en_US
dc.description.abstractDijital çağ verilerinin büyük çoğunluğu metin olarak depolanmaktadır. Metin madenciliği veri madenciliğinin ayrılmaz bir parçasıdır. Metin sınıflandırma (TC), metin madenciliğinde sıklıkla ihtiyaç duyulan bir doğal dil işleme (NLP) işlemidir. Bu işleme bilgi erişimi, belge sınıflandırma, dil tespiti, duygu analizi vb. birçok araştırmada ihtiyaç duyulmaktadır. Literatüre göre, Türkçe TC'de veri boyutunun azaltması için filtre öznitelik seçme yöntemleri sıklıkla uygulanmaktadır. Ancak sarmalayıcı tabanlı öznitelik seçme yöntemleri, filtre yöntemlerine kıyasla daha iyi sınıflandırma doğruluğu sağlayabilir. Bu fikirden hareketle, bu çalışmada parçacık sürüsü optimizasyon algoritması (PSO) ve çok terimli naive bayes (MNB) sınıflandırıcısını kullanan sarmalayıcı öznitelik seçim yöntemi tabanlı bir Türkçe TC metodu önerilmektedir. Deneylerde TC için TTC-3600 Türkçe haber metinleri kullanılmıştır. Önerilen yöntem, köklerine ayrılmış (stemming) Tf-Idf özniteliklerini kullanarak TTC-3600 Türkçe haber metni veri kümesinde %94,55'lik bir sınıflandırma doğruluğuna ulaşmaktadır. Böylece en son Türkçe TC yöntemleriyle rekabet edebilen sınıflandırma doğrulukları üretmektedir.en_US
dc.identifier.citationZorarpacı, E. (2024). Turkish Text Classification Based On Wrapper Feature Selection Using Particle Swarm Optimization. Afyon Kocatepe Üniversitesi Fen Ve Mühendislik Bilimleri Dergisi, 24(5), 1180-1188. https://doi.org/10.35414/akufemubid.1420120en_US
dc.identifier.doi10.35414/akufemubid.1420120
dc.identifier.endpage1188en_US
dc.identifier.issue5en_US
dc.identifier.orcid0000-0003-0974-7584en_US
dc.identifier.startpage1180en_US
dc.identifier.urihttps://dergipark.org.tr/tr/download/article-file/3661301
dc.identifier.urihttps://hdl.handle.net/11630/12955
dc.identifier.volume24en_US
dc.language.isoen
dc.publisherAfyon Kocatepe Üniversitesien_US
dc.relation.ispartofFen ve Mühendislik Bilimleri Dergisi
dc.relation.publicationcategoryMakale - Ulusal Hakemli Dergi - Başka Kurum Yazarıen_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectFeature Selectionen_US
dc.subjectNatural Language Processingen_US
dc.subjectText Classificationen_US
dc.subjectText Miningen_US
dc.subjectÖznitelik Seçimien_US
dc.subjectDoğal Dil İşlemeen_US
dc.subjectMetin Sınıflandırmaen_US
dc.subjectMetin Madenciliğien_US
dc.titleTurkish text classification based on wrapper feature selection using particle swarm optimizationen_US
dc.title.alternativeParçacık sürü optimizasyonunu kullanan sarmalayıcı öznitelik seçimine dayalı Türkçe metin sınıflandırmaen_US
dc.typeArticle

Dosyalar

Orijinal paket

Listeleniyor 1 - 1 / 1
Yükleniyor...
Küçük Resim
İsim:
10.35414-akufemubid.1420120-3661301.pdf
Boyut:
655.14 KB
Biçim:
Adobe Portable Document Format
Açıklama:
Makale Dosyası

Lisans paketi

Listeleniyor 1 - 1 / 1
Yükleniyor...
Küçük Resim
İsim:
license.txt
Boyut:
1.44 KB
Biçim:
Item-specific license agreed upon to submission
Açıklama: