Duygu analizi ve fikir madenciliği, kişilerin, bir konu, grup, ürün, marka veya durum ile ilgili görüşlerini belirttiği metinleri, doğal dil işleme, yapay zeka veya istatistik alanlarından uygulamalar yardımıyla analiz ederek anlamlandırma çalışmalarıdır. Son yıllarda, sosyal medya ve kullanıcıların fikir paylaştığı diğer platformların kullanımının artmasıyla saatte terabaytlar seviyesine ulaşan veri miktarı, duygu analizi ve fikir madenciliği konularına verilen önemi artırmıştır.
Bu çalışma kapsamında, duygu analizinde makine öğrenimi yaklaşımları, sözlük tabanlı yaklaşımlar ve hibrit yaklaşım üzerine güncel makaleler incelenerek, makaleler ile ilgili literatür çalışması araştırmacılara sunulmuştur. İncelenen makalelerden, makalenin yayınlanma tarihi, araştırma problemi, yaklaşım, önişleme ve öznitelik seçme metotları, sınıflandırma algoritması, model başarı ölçütü, başarı oranı en yüksek algoritma ve başarı oranı, veri kaynağı bilgilerinin yer aldığı bir tablo oluşturulmuştur. Makine öğrenimi tabanlı yöntemlerin sıklıkla tercih edilmesi ve çalışma sayısının diğer yöntemlerden fazla olması sebebiyle, denetimli, denetimsiz, yarı denetimli ve derin öğrenme başlıkları altında ayrı ayrı ele alınmıştır. Çalışma sonucunda, incelenen makaleler ışığında genel bir değerlendirme ile sonuç çıkarılarak çalışma tamamlanmıştır.
Sentiment analysis and opinion mining are the studies of interpretation by analyzing texts in which people express their opinions about a subject, group, product, brand, or situation with applications with natural language processing, artificial intelligence, or statistics. In recent years, with the increase in the use of social media and other platforms where users share ideas, the amount of data reaching the level of terabytes per hour has increased the importance given to sentiment analysis and opinion mining.
Within the scope of this study, a literature review on current articles and articles on machine learning approaches, lexicon-based approaches, and hybrid approach in sentiment analysis is presented to the researchers. From the articles examined, a table containing the publication date of the article, research problem, approach, preprocessing and feature selection methods, classification algorithm, model success criterion, an algorithm with the highest success rate and success rate, data source information was created. Since machine learning-based methods are frequently preferred and the number of studies is higher than other methods, they are discussed separately under the titles of supervised, unsupervised, semi-supervised, and deep learning. At the end of the study, the study was completed by making a general evaluation in light of the articles examined.
Primary Language | Turkish |
---|---|
Subjects | Computer Software |
Journal Section | Reviews |
Authors | |
Publication Date | June 2, 2021 |
Submission Date | November 1, 2020 |
Published in Issue | Year 2021 |