Günümüzde ses kayıtları üzerinde yapılan oynamalardan Ses birleştirme (Audio Splicing) sahteciliği veri bütünlüğünü ihlal eden, etkili, gerçekleştirmesi kolay ve oldukça yaygın olarak gerçekleştirilen bir sahteciliktir. İki farklı ses kaydının birleştirilmesiyle gerçekleştirilen bu sahteciliğin, saldırganlar tarafından sahtecilik izlerini gizlemek için uygulanan son işlem operasyonları ile tespitini oldukça zordur. Bu amaçla ses birleştirme sahteciliğini tespit etmek için kokleagram görüntülerini kullanan CNN tabanlı yeni bir yöntem önerilmiştir. Önerilen CNN mimarisine giriş olarak sesin kokleagram görüntüsü verilmektedir. Kokleagram görüntüleriyle eğitilen mimari, şüpheli bir test dosyası verildiğinde, ses dosyasını sahte/orijinal olarak etiketlemektedir. Ayrıca, literatürde genel bir veri tabanı bulunmadığından, bu çalışmada önerilen yöntemin performansını test etmek için TIMIT veri tabanı kullanılarak 2 sn ve 3 sn’lik iki ayrı ses birleştirme sahteciliği veri tabanı SET2 ve SET3 oluşturulmuştur. Önerilen yöntemle SET2 veri seti üzerinde 0.95 Doğruluk, 0.97 Kesinlik, 0.93 Duyarlılık ve 0.95 F1-skor, SET3 veri setinde 0.98 Doğruluk, 0.98 Kesinlik, 0.97 Duyarlılık ve 0.97 F1-skor değerleri alınmıştır. Ayrıca önerilen yöntem, NOIZEUS-4 veri seti üzerinde de test edilmiş ve oldukça yüksek sonuçlar elde edilmiştir. Elde edilen sonuçlar önerilen yöntemin gürültüye karşı dayanıklı ve ses birleştirme sahteciliği tespitini literatürdeki diğer çalışmalara göre oldukça etkin bir şekilde gerçekleştirdiğini göstermektedir.
Audio splicing is an effective, easy-to-perform and widespread forgery that violates data integrity. This forgery, which is performed by combining two different audio recordings, is very difficult to detect with the post-processing operations applied by the attackers to hide the forgery traces. For this purpose, a new CNN-based method using cochleagram images is proposed to detect audio fusion forgery. The cochleagram image of the audio is given as input to the proposed CNN architecture. The architecture trained with the cochleagram images, given a suspicious test file, labels the audio file as forged/original. In addition, since there is no general database in the literature, two separate 2 s and 3 s audio merging forgery databases SET2 and SET3 are created using the TIMIT database to test the performance of the proposed method in this study. With the proposed method, 0.95 Accuracy, 0.97 Precision, 0.93 Sensitivity and 0.95 F1-score were obtained on SET2 dataset, while 0.98 Accuracy, 0.98 Precision, 0.97 Sensitivity and 0.97 F1-score were obtained on SET3 dataset. In addition, the proposed method was also tested on the NOIZEUS-4 dataset and very high results were obtained. The results obtained show that the proposed method is robust to noise and performs audio splicing forgery detection in a very effective way compared to other studies in the literature.
Primary Language | Turkish |
---|---|
Subjects | Computer Forensics |
Journal Section | Computer Engineering |
Authors | |
Publication Date | December 3, 2024 |
Submission Date | July 1, 2024 |
Acceptance Date | August 28, 2024 |
Published in Issue | Year 2024 |