Küresel dijital iletişimin artışı, nefret söylemi ve uygunsuz dil içeren metinlerin yayılmasına yol açmış ve bu durum toplumsal refahı tehdit etmektedir. Yapay zekâ, siber güvenlik zorlukları yaratırken, aynı zamanda bu sorunların çözülmesinde de kritik bir rol oynamaktadır. Araştırmacılar, algoritmaların yanlış kullanımını azaltmak ve siber güvenliği sağlamak için çok disiplinli bir yaklaşım benimsemelidir. Bu çalışmada, Twitter verisi üzerinde yapay zekâ destekli metin analiziyle uygunsuz kelimeler içeren metni tespit etmek amacıyla Tri-Gömülü Temsiller (Tri-Embeddings) adı verilen yenilikçi bir yöntem sunulmaktadır. Bu yöntem, Word2Vec, FastText ve Universal Sentence Encoder (USE) gibi önceden eğitilmiş modelleri birleştirir. Semantik incelikleri yakalamak ve modelin uygunsuz kelimeler içeren metindeki ince farkları tespit etme yeteneğini artırmak için yapılan bu entegrasyon, doğruluk ve sağlamlık açısından önemli gelişmeler sağlamıştır. Ek olarak, DistilBERT gibi büyük bir dil modelinin önerilen yönteme dâhil edilmesinin etkisi de incelenmiştir. Bulgular, yüksek doğruluk, duyarlılık ve F1 skoru değerleriyle yöntemin etkinliğini göstermektedir. Bu yaklaşım, etik ihlalleri azaltarak daha güvenli ve kapsayıcı bir çevrimiçi ortam yaratmaya yardımcı olmaktadır.
Saldırgan dil nefret söylemi makine öğrenimi doğal dil işleme sosyal ağ analizi
The rise in global digital communication has led to an increase in hate speech and offensive language, posing significant threats to societal well-being. While AI presents cybersecurity challenges, it also plays a crucial role in addressing these issues. Researchers must develop AI with a multidisciplinary approach, mitigating algorithmic misuse and ensuring cybersecurity. This study introduces Tri-Embeddings, an innovative method for detecting abusive language using AI-powered text analysis, applied to Twitter data. The method combines pre-trained models such as Word2Vec, FastText, and Universal Sentence Encoder (USE). Additionally, this study explores the impact of integrating a large language model, DistilBERT, into the proposed unified embedding framework. The findings demonstrate the method’s effectiveness, with high precision, recall, and F1 scores, showing its potential to reduce the spread of offensive and hateful language. This approach helps mitigate ethical breaches and creates a safer, more inclusive online space.
Abusive language hate Speech machine learning natural language processing social networks analysis.
| Birincil Dil | İngilizce |
|---|---|
| Konular | Doğal Dil İşleme |
| Bölüm | Araştırma Makalesi |
| Yazarlar | |
| Gönderilme Tarihi | 18 Nisan 2025 |
| Kabul Tarihi | 5 Aralık 2025 |
| Yayımlanma Tarihi | 3 Mart 2026 |
| DOI | https://doi.org/10.17780/ksujes.1679361 |
| IZ | https://izlik.org/JA76LG63HW |
| Yayımlandığı Sayı | Yıl 2026 Cilt: 29 Sayı: 1 |