Lie Detection From Voice and Heart Rate
Abstract
Son zamanlarda yapılan duygu analizi, cinsiyet tahmini, yaş tahmini ve yalan tespiti çalışmalarının da içinde olduğu araştırmalar ses verisinden birçok bilgi elde edildiğini ortaya koymuştur. Bu çalışmanın amacı ses ve nabız verilerini kullanarak yalan tespiti yapmak ve farklı makine öğrenmesi algoritmalarında uygulanarak başarı sonuçlarının karşılaştırılmasıdır. Literatürde yalan tespiti üzerine birçok çalışma bulunmasına rağmen bizim çalışmamız yalan tahmininde sadece ses üzerine değil nabız verisine de odaklanmaktadır. Bu çalışma için 15 kadın 15 erkek konuşmacı seçilmiştir. Her bir konuşmacıya 10 soru sorulmuştur ve toplamda 300 ses dosyası harici profesyonel bir mikrofon kullanılarak toplanmıştır. Her konuşmacıdan nabız verilerinin alınması için akıllı bileklik kullanılmıştır. Asıl odak noktamızın ses ve nabız olmasına rağmen katılımcılara kişilik testi de uygulanmıştır. Mel frekans kepstrum katsayıları (MFCC) kullanılarak ses verisinden 12 tane özellik çıkarılmıştır. Her ses dosyası için en düşük, en yüksek ve ortalama nabız verileri hesaplanmıştır. Bu çalışmada destek vektör makineleri, yapay sinir ağları, lojistik regresyon ve karar ağaçları metotlarının yalan tespiti sonuçları karşılaştırılmıştır. Kullanılan yöntemler arasında lojistik regresyon algoritmasında 19 öznitelik ile %66,67 oranında en yüksek doğruluk oranı elde edilmiştir. Tüm metotların doğruluk oranları göz önünde bulundurulduğunda ses verisine nabız, yaş, cinsiyet ve kişilik tipleri eklendikten sonra yalan tespiti yapmak için daha iyi sonuçlar elde edildiği sonucuna varılmıştır. Bu çalışmanın temel bulgusu yalnızca ses ve nabız verisinin yalan tespitinde etkili sonuçlar vermediğidir. Bununla birlikte, eklenen her yeni özniteliğin sonuçları iyileştirmediği görülmüştür. Bu çalışma sonucunda öznitelik seçiminin önemini ve özniteliklerin bir arada kullanılmasının önemi öğrenilmiştir.
Collections
- Yüksek Lisans Tezleri [230]