Ö N E Ç I K A N L A R Konuşmacıları yaş ve cinsiyetlerine göre sınıflandıran yeni bir sistem önerilmiştir 954 kişinin 47 saatlik telefon konuşmaları kullanılmıştır Önerilen sistem için en uygun bileşen sayısı ve konuşma süresi belirlenmiştir Makale Bilgileri ÖZET Geliş: 26.11.201426.11. Kabul: 24.05.2016 DOI:Bu çalışmada konuşmacıları yaş ve/veya cinsiyet özelliklerine göre otomatik olarak sınıflandıran bir sistem önerilmiştir. Açık ve kapalı mekanlarda cep telefonu ve karasal bağlantılarla yapılan telefon konuşmalarının giriş olarak kullanıldığı bu sistemde konuşmacıların cinsiyetlerine göre üç (erkek, bayan, çocuk), yaşlarına göre dört (çocuk, genç yetişkin ve yaşlı) ve her iki özelliğine göre ise yedi sınıfa ayrılması amaçlanmıştır. Bu amaçla konuşmaların yalnızca sesli bölümlerinden elde edilen MFCC katsayıları ile oluşturulan GKM modelleri süpervektörlere dönüştürülerek DVM sınıflandırıcısına uygulanmıştır. Çalışmada konuşmaların ses içeren bölümlerinin belirlenmesinde sinyalin enerji özelliği kullanılırken GKM modellerinin eğitiminde ise geniş bir veritabanı ile eğitilen genel arka plan modelinin (GAM) uyarlanması yaklaşımı tercih edilmiştir. Çalışmada ayrıca farklı sayıda bileşenle oluşturulan GKM modelleri farklı uzunluklu konuşmalarla test edilerek GKM bileşen sayısı ve konuşma süresinin yaş ve cinsiyet tespiti üzerindeki etkisi de araştırılmıştır. Yapılan testlerde en yüksek sınıflandırma başarıları 16 saniyelik konuşmaların 64 bileşenli GKM'lerle modellenmesi sonucunda elde edilmiştir. Bu oranlar cinsiyet kategorisinde %92,42, yaş kategorisinde %60,10 ve yaş&cinsiyet kategorisinde ise %60,02 olarak ölçülmüştür.
DOIIn this study, a system classifying speakers according to their age and/or genders is proposed. In this system phone conversations including mobile calls that took place indoor or outdoor are used as inputs. It is aimed to classify the speakers according to their genders into three classes as male, female and child, according to their ages into four classes as child, youth, adult and senior, and finally according to both gender and age into seven classes. For this aim, GMM models that are created with MFCC coefficients obtained by the voiced parts of the conversations are transformed into supervectors. These supervectors are applied to SVM classifier. Signal energy is used for determining the voiced parts of conversations. For the training of GMM models, the adaptation approach of UBM is preferred. Also, by testing GMM models that are created with different number of components and different length conversations, the impact of GMM components number and speech duration on the age and gender identification is investigated. At the end of these tests, the highest classification success rates are obtained by modeling 16-second speeches with 64-component GMMs. The rates obtained from these tests are measured as 92.42% for gender category, 60.10% for age category and 60.02% for age&gender category.