Araştırma Makalesi

İSTEM MÜHENDİSLİĞİNİN BÜYÜK DİL MODELLERİNİN PERFORMANSINDAKİ ROLÜ: ANALİZ VE UYGULAMA ÖRNEKLERİ

Cilt: 27 Sayı: 4 3 Aralık 2024
PDF İndir
TR EN

İSTEM MÜHENDİSLİĞİNİN BÜYÜK DİL MODELLERİNİN PERFORMANSINDAKİ ROLÜ: ANALİZ VE UYGULAMA ÖRNEKLERİ

Öz

İstem mühendisliği, büyük dil modellerinin yeteneklerini artırmak için kritik bir teknik olarak ortaya çıkmıştır. İstem adı verilen talimatlar ile model parametrelerini değiştirmeden ince ayar yapma imkânı sunarak, bu modellerin çeşitli görevlerde üstün performans göstermesini sağlar. Bu çalışmanın temel amacı, büyük dil modeli performansını iyileştirmek, hesaplama maliyetlerini azaltmak ve kullanıcı deneyimini geliştirmek için istem mühendisliğinin nasıl etkili kullanılacağını göstermektir. Çalışmada, farklı uygulama alanlarına göre kategorize edilen ve son teknoloji 15 istem mühendisliği tekniği analiz edilmiştir. Bu teknikler, sıfır atış ve birkaç atış istemlerinden düşünce zinciri ve otomatik düşünce zinciri istemlerine kadar çeşitlilik göstermektedir. Her bir tekniğin avantajları ve dezavantajları detaylı olarak değerlendirilmiş ve performans artışının nasıl sağlandığı örnek senaryolarla gösterilmiştir. Araştırmanın sonuçları, istem mühendisliğinin büyük dil modellerinin çeşitli görev ve uygulamalarda performansını artırmada önemli bir rol oynadığını göstermektedir. Özellikle az verili öğrenme senaryolarında verimliliği artırmak ve önyargı, tutarsızlık gibi zorlukları azaltmak için yenilikçi istem mühendisliği tekniklerinin başarılı performans sergiledikleri görülmüştür. Bu bulgular, araştırmacılar ve uygulayıcılar için yol gösterici bir kaynak olarak hizmet edecek ve büyük dil modellerinin geniş çapta uygulanabilirliğini artıracaktır. Çalışmamız, istem mühendisliğinin daha iyi anlaşılmasına katkı sağlayacak ve gelecekteki araştırmalara ışık tutacaktır.

Anahtar Kelimeler

Kaynakça

  1. Brown, T., Mann, B., Ryder, N., Subbiah, M., Kaplan, J. D., Dhariwal, P., … Amodei, D. (2020). Language Models are Few-Shot Learners. Içinde H. Larochelle, M. Ranzato, R. Hadsell, M. F. Balcan, & H. Lin (Ed.), Advances in Neural Information Processing Systems (C. 33, ss. 1877-1901). Curran Associates, Inc. Geliş tarihi gönderen https://proceedings.neurips.cc/paper_files/paper/2020/file/1457c0d6bfcb4967418bfb8ac142f64a-Paper.pdf
  2. Chen, S., Wang, W., Chen, X., Lu, P., Yang, Z., & Du, Y. (2024). LLaMA-LoRA Neural Prompt Engineering: A Deep Tuning Framework for Automatically Generating Chinese Text Logical Reasoning Thinking Chains. Data Intelligence, 1-53. https://doi.org/10.1162/dint_a_00251
  3. Kojima, T., Gu, S. (Shane), Reid, M., Matsuo, Y., & Iwasawa, Y. (2022). Large Language Models are Zero-Shot Reasoners. Içinde S. Koyejo, S. Mohamed, A. Agarwal, D. Belgrave, K. Cho, & A. Oh (Ed.), Advances in Neural Information Processing Systems (C. 35, ss. 22199-22213). Curran Associates, Inc. Geliş tarihi gönderen https://proceedings.neurips.cc/paper_files/paper/2022/file/8bb0d291acd4acf06ef112099c16f326-Paper-Conference.pdf
  4. Lester, B., Al-Rfou, R., & Constant, N. (2021). The Power of Scale for Parameter-Efficient Prompt Tuning. Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing, 3045-3059. Stroudsburg, PA, USA: Association for Computational Linguistics. https://doi.org/10.18653/v1/2021.emnlp-main.243
  5. Liu, J., Liu, A., Lu, X., Welleck, S., West, P., Bras, R. Le, … Hajishirzi, H. (2021). Generated Knowledge Prompting for Commonsense Reasoning. arXiv . https://doi.org/10.48550/arXiv.2110.08387
  6. Long, J. (2023). Large Language Model Guided Tree-of-Thought. arXiv . https://doi.org/10.48550/arXiv.2305.08291
  7. Ma, R., Zhou, X., Gui, T., Tan, Y., Li, L., Zhang, Q., & Huang, X. (2021). Template-free Prompt Tuning for Few-shot NER. arXiv . https://doi.org/10.48550/arXiv.2109.13532
  8. Paranjape, B., Lundberg, S., Singh, S., Hajishirzi, H., Zettlemoyer, L., & Ribeiro, M. T. (2023). ART: Automatic multi-step reasoning and tool-use for large language models. arXiv . https://doi.org/10.48550/arXiv.2303.09014

Ayrıntılar

Birincil Dil

Türkçe

Konular

Yapay Zeka (Diğer)

Bölüm

Araştırma Makalesi

Yayımlanma Tarihi

3 Aralık 2024

Gönderilme Tarihi

8 Mayıs 2024

Kabul Tarihi

25 Haziran 2024

Yayımlandığı Sayı

Yıl 2024 Cilt: 27 Sayı: 4

Kaynak Göster

APA
Tan, F. G., Yüksel, A. S., & Karabıyık, M. A. (2024). İSTEM MÜHENDİSLİĞİNİN BÜYÜK DİL MODELLERİNİN PERFORMANSINDAKİ ROLÜ: ANALİZ VE UYGULAMA ÖRNEKLERİ. Kahramanmaraş Sütçü İmam Üniversitesi Mühendislik Bilimleri Dergisi, 27(4), 1401-1420. https://doi.org/10.17780/ksujes.1480838
AMA
1.Tan FG, Yüksel AS, Karabıyık MA. İSTEM MÜHENDİSLİĞİNİN BÜYÜK DİL MODELLERİNİN PERFORMANSINDAKİ ROLÜ: ANALİZ VE UYGULAMA ÖRNEKLERİ. Kahramanmaraş Sütçü İmam Üniversitesi Mühendislik Bilimleri Dergisi. 2024;27(4):1401-1420. doi:10.17780/ksujes.1480838
Chicago
Tan, Fatma Gülşah, Asım Sinan Yüksel, ve Muhammed Abdulhamid Karabıyık. 2024. “İSTEM MÜHENDİSLİĞİNİN BÜYÜK DİL MODELLERİNİN PERFORMANSINDAKİ ROLÜ: ANALİZ VE UYGULAMA ÖRNEKLERİ”. Kahramanmaraş Sütçü İmam Üniversitesi Mühendislik Bilimleri Dergisi 27 (4): 1401-20. https://doi.org/10.17780/ksujes.1480838.
EndNote
Tan FG, Yüksel AS, Karabıyık MA (01 Aralık 2024) İSTEM MÜHENDİSLİĞİNİN BÜYÜK DİL MODELLERİNİN PERFORMANSINDAKİ ROLÜ: ANALİZ VE UYGULAMA ÖRNEKLERİ. Kahramanmaraş Sütçü İmam Üniversitesi Mühendislik Bilimleri Dergisi 27 4 1401–1420.
IEEE
[1]F. G. Tan, A. S. Yüksel, ve M. A. Karabıyık, “İSTEM MÜHENDİSLİĞİNİN BÜYÜK DİL MODELLERİNİN PERFORMANSINDAKİ ROLÜ: ANALİZ VE UYGULAMA ÖRNEKLERİ”, Kahramanmaraş Sütçü İmam Üniversitesi Mühendislik Bilimleri Dergisi, c. 27, sy 4, ss. 1401–1420, Ara. 2024, doi: 10.17780/ksujes.1480838.
ISNAD
Tan, Fatma Gülşah - Yüksel, Asım Sinan - Karabıyık, Muhammed Abdulhamid. “İSTEM MÜHENDİSLİĞİNİN BÜYÜK DİL MODELLERİNİN PERFORMANSINDAKİ ROLÜ: ANALİZ VE UYGULAMA ÖRNEKLERİ”. Kahramanmaraş Sütçü İmam Üniversitesi Mühendislik Bilimleri Dergisi 27/4 (01 Aralık 2024): 1401-1420. https://doi.org/10.17780/ksujes.1480838.
JAMA
1.Tan FG, Yüksel AS, Karabıyık MA. İSTEM MÜHENDİSLİĞİNİN BÜYÜK DİL MODELLERİNİN PERFORMANSINDAKİ ROLÜ: ANALİZ VE UYGULAMA ÖRNEKLERİ. Kahramanmaraş Sütçü İmam Üniversitesi Mühendislik Bilimleri Dergisi. 2024;27:1401–1420.
MLA
Tan, Fatma Gülşah, vd. “İSTEM MÜHENDİSLİĞİNİN BÜYÜK DİL MODELLERİNİN PERFORMANSINDAKİ ROLÜ: ANALİZ VE UYGULAMA ÖRNEKLERİ”. Kahramanmaraş Sütçü İmam Üniversitesi Mühendislik Bilimleri Dergisi, c. 27, sy 4, Aralık 2024, ss. 1401-20, doi:10.17780/ksujes.1480838.
Vancouver
1.Fatma Gülşah Tan, Asım Sinan Yüksel, Muhammed Abdulhamid Karabıyık. İSTEM MÜHENDİSLİĞİNİN BÜYÜK DİL MODELLERİNİN PERFORMANSINDAKİ ROLÜ: ANALİZ VE UYGULAMA ÖRNEKLERİ. Kahramanmaraş Sütçü İmam Üniversitesi Mühendislik Bilimleri Dergisi. 01 Aralık 2024;27(4):1401-20. doi:10.17780/ksujes.1480838

Cited By

DİZİNLENME ve ARŞİVLEME

download?token=eyJhdXRoX3JvbGVzIjpbXSwiZW5kcG9pbnQiOiJqb3VybmFsIiwib3JpZ2luYWxuYW1lIjoiaW1hZ2UucG5nIiwicGF0aCI6IjAzNTkvYmZjYS81YjQyLzY5ZjFkM2E4NWY2YWY3Ljg1NjQ2NDgxLnBuZyIsImV4cCI6MTc3NzQ1OTY0MCwibm9uY2UiOiI1NTUzYmJiN2U5NGNkMjdkYWNhMTRlMDZiYjc1OTY4NCJ9.nCVoSJClEIC9bWK5gGCmjHyTNRz2N0DhYKVJzJZR9Bs

 

download?token=eyJhdXRoX3JvbGVzIjpbXSwiZW5kcG9pbnQiOiJqb3VybmFsIiwib3JpZ2luYWxuYW1lIjoiaW1hZ2UucG5nIiwicGF0aCI6Ijg5YmUvODZlOC8wYzY0LzY5ZjFkNWE4MWJmYzY0LjM0OTM2NzM1LnBuZyIsImV4cCI6MTc3NzQ2MDE1Miwibm9uY2UiOiI3OWE1Mzk0OWRhMTk0Mjg0OGYzZTUxOWQyNTU5MjdjMSJ9.XxqhJ36woCZcO1DV_I9Mogpgg86-bwM454jQiOcqpS0 

Bu eser, Creative Commons Atıf 4.0 Uluslararası Lisansı ile lisanslanmıştır.