Destek Vektör Makineleri İle Doküman Sınıflandırma
Abstract
Bu tezde, çevrimiçi Destek Vektör Makineleri (DVM) kullanılarak doküman sınıflandırma çalışması yapılmıştır. Lasvm algoritması eşli çekirdek yöntemi ile çalışacak şekilde adapte edilmiştir. İlk olarak, seçilen çekirdek fonksiyonun etkileri ve parametreler belirlenmiştir. Bunun için doğrusal bir karar sınırı ile sınıflanacak dokümanlar yüksek boyutlu bir uzaya gömülmüştür. Bu nedenle veri gömme prosedürü ve çekirdek hilesi detayları örneklerle açıklanmıştır. Optimal hiper parametreler belirlendikten sonra eşli eğitim ve test verilerinin farklı kombinasyonları ile deneyler yapılmıştır. DVM modellerinin performansları doğru sınıflandırma oranı ve ROC eğrisi altında kalan alan kriterleri ile değerlendirilmiştir. Sonuçlar, çevrimiçi sınıflandırmanın ikili ve çok sınıflı, sınıflandırma işlemlerine iyi bir alternatif metot olduğunu göstermiştir. Bu doküman sınıflandırma işleminde, eldeki verilerin yüksek boyutlu olması nedeniyle doğrusal eşli çekirdekler, gauss eşli çekirdeklerine göre daha iyi sonuçlar vermiştir.
Collections
- Yüksek Lisans Tezleri [879]