Research Article

İSTEM MÜHENDİSLİĞİNİN BÜYÜK DİL MODELLERİNİN PERFORMANSINDAKİ ROLÜ: ANALİZ VE UYGULAMA ÖRNEKLERİ

Volume: 27 Number: 4 December 3, 2024
TR EN

İSTEM MÜHENDİSLİĞİNİN BÜYÜK DİL MODELLERİNİN PERFORMANSINDAKİ ROLÜ: ANALİZ VE UYGULAMA ÖRNEKLERİ

Abstract

İstem mühendisliği, büyük dil modellerinin yeteneklerini artırmak için kritik bir teknik olarak ortaya çıkmıştır. İstem adı verilen talimatlar ile model parametrelerini değiştirmeden ince ayar yapma imkânı sunarak, bu modellerin çeşitli görevlerde üstün performans göstermesini sağlar. Bu çalışmanın temel amacı, büyük dil modeli performansını iyileştirmek, hesaplama maliyetlerini azaltmak ve kullanıcı deneyimini geliştirmek için istem mühendisliğinin nasıl etkili kullanılacağını göstermektir. Çalışmada, farklı uygulama alanlarına göre kategorize edilen ve son teknoloji 15 istem mühendisliği tekniği analiz edilmiştir. Bu teknikler, sıfır atış ve birkaç atış istemlerinden düşünce zinciri ve otomatik düşünce zinciri istemlerine kadar çeşitlilik göstermektedir. Her bir tekniğin avantajları ve dezavantajları detaylı olarak değerlendirilmiş ve performans artışının nasıl sağlandığı örnek senaryolarla gösterilmiştir. Araştırmanın sonuçları, istem mühendisliğinin büyük dil modellerinin çeşitli görev ve uygulamalarda performansını artırmada önemli bir rol oynadığını göstermektedir. Özellikle az verili öğrenme senaryolarında verimliliği artırmak ve önyargı, tutarsızlık gibi zorlukları azaltmak için yenilikçi istem mühendisliği tekniklerinin başarılı performans sergiledikleri görülmüştür. Bu bulgular, araştırmacılar ve uygulayıcılar için yol gösterici bir kaynak olarak hizmet edecek ve büyük dil modellerinin geniş çapta uygulanabilirliğini artıracaktır. Çalışmamız, istem mühendisliğinin daha iyi anlaşılmasına katkı sağlayacak ve gelecekteki araştırmalara ışık tutacaktır.

Keywords

References

  1. Brown, T., Mann, B., Ryder, N., Subbiah, M., Kaplan, J. D., Dhariwal, P., … Amodei, D. (2020). Language Models are Few-Shot Learners. Içinde H. Larochelle, M. Ranzato, R. Hadsell, M. F. Balcan, & H. Lin (Ed.), Advances in Neural Information Processing Systems (C. 33, ss. 1877-1901). Curran Associates, Inc. Geliş tarihi gönderen https://proceedings.neurips.cc/paper_files/paper/2020/file/1457c0d6bfcb4967418bfb8ac142f64a-Paper.pdf
  2. Chen, S., Wang, W., Chen, X., Lu, P., Yang, Z., & Du, Y. (2024). LLaMA-LoRA Neural Prompt Engineering: A Deep Tuning Framework for Automatically Generating Chinese Text Logical Reasoning Thinking Chains. Data Intelligence, 1-53. https://doi.org/10.1162/dint_a_00251
  3. Kojima, T., Gu, S. (Shane), Reid, M., Matsuo, Y., & Iwasawa, Y. (2022). Large Language Models are Zero-Shot Reasoners. Içinde S. Koyejo, S. Mohamed, A. Agarwal, D. Belgrave, K. Cho, & A. Oh (Ed.), Advances in Neural Information Processing Systems (C. 35, ss. 22199-22213). Curran Associates, Inc. Geliş tarihi gönderen https://proceedings.neurips.cc/paper_files/paper/2022/file/8bb0d291acd4acf06ef112099c16f326-Paper-Conference.pdf
  4. Lester, B., Al-Rfou, R., & Constant, N. (2021). The Power of Scale for Parameter-Efficient Prompt Tuning. Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing, 3045-3059. Stroudsburg, PA, USA: Association for Computational Linguistics. https://doi.org/10.18653/v1/2021.emnlp-main.243
  5. Liu, J., Liu, A., Lu, X., Welleck, S., West, P., Bras, R. Le, … Hajishirzi, H. (2021). Generated Knowledge Prompting for Commonsense Reasoning. arXiv . https://doi.org/10.48550/arXiv.2110.08387
  6. Long, J. (2023). Large Language Model Guided Tree-of-Thought. arXiv . https://doi.org/10.48550/arXiv.2305.08291
  7. Ma, R., Zhou, X., Gui, T., Tan, Y., Li, L., Zhang, Q., & Huang, X. (2021). Template-free Prompt Tuning for Few-shot NER. arXiv . https://doi.org/10.48550/arXiv.2109.13532
  8. Paranjape, B., Lundberg, S., Singh, S., Hajishirzi, H., Zettlemoyer, L., & Ribeiro, M. T. (2023). ART: Automatic multi-step reasoning and tool-use for large language models. arXiv . https://doi.org/10.48550/arXiv.2303.09014

Details

Primary Language

Turkish

Subjects

Artificial Intelligence (Other)

Journal Section

Research Article

Publication Date

December 3, 2024

Submission Date

May 8, 2024

Acceptance Date

June 25, 2024

Published in Issue

Year 2024 Volume: 27 Number: 4

APA
Tan, F. G., Yüksel, A. S., & Karabıyık, M. A. (2024). İSTEM MÜHENDİSLİĞİNİN BÜYÜK DİL MODELLERİNİN PERFORMANSINDAKİ ROLÜ: ANALİZ VE UYGULAMA ÖRNEKLERİ. Kahramanmaraş Sütçü İmam Üniversitesi Mühendislik Bilimleri Dergisi, 27(4), 1401-1420. https://doi.org/10.17780/ksujes.1480838
AMA
1.Tan FG, Yüksel AS, Karabıyık MA. İSTEM MÜHENDİSLİĞİNİN BÜYÜK DİL MODELLERİNİN PERFORMANSINDAKİ ROLÜ: ANALİZ VE UYGULAMA ÖRNEKLERİ. KSU J. Eng. Sci. 2024;27(4):1401-1420. doi:10.17780/ksujes.1480838
Chicago
Tan, Fatma Gülşah, Asım Sinan Yüksel, and Muhammed Abdulhamid Karabıyık. 2024. “İSTEM MÜHENDİSLİĞİNİN BÜYÜK DİL MODELLERİNİN PERFORMANSINDAKİ ROLÜ: ANALİZ VE UYGULAMA ÖRNEKLERİ”. Kahramanmaraş Sütçü İmam Üniversitesi Mühendislik Bilimleri Dergisi 27 (4): 1401-20. https://doi.org/10.17780/ksujes.1480838.
EndNote
Tan FG, Yüksel AS, Karabıyık MA (December 1, 2024) İSTEM MÜHENDİSLİĞİNİN BÜYÜK DİL MODELLERİNİN PERFORMANSINDAKİ ROLÜ: ANALİZ VE UYGULAMA ÖRNEKLERİ. Kahramanmaraş Sütçü İmam Üniversitesi Mühendislik Bilimleri Dergisi 27 4 1401–1420.
IEEE
[1]F. G. Tan, A. S. Yüksel, and M. A. Karabıyık, “İSTEM MÜHENDİSLİĞİNİN BÜYÜK DİL MODELLERİNİN PERFORMANSINDAKİ ROLÜ: ANALİZ VE UYGULAMA ÖRNEKLERİ”, KSU J. Eng. Sci., vol. 27, no. 4, pp. 1401–1420, Dec. 2024, doi: 10.17780/ksujes.1480838.
ISNAD
Tan, Fatma Gülşah - Yüksel, Asım Sinan - Karabıyık, Muhammed Abdulhamid. “İSTEM MÜHENDİSLİĞİNİN BÜYÜK DİL MODELLERİNİN PERFORMANSINDAKİ ROLÜ: ANALİZ VE UYGULAMA ÖRNEKLERİ”. Kahramanmaraş Sütçü İmam Üniversitesi Mühendislik Bilimleri Dergisi 27/4 (December 1, 2024): 1401-1420. https://doi.org/10.17780/ksujes.1480838.
JAMA
1.Tan FG, Yüksel AS, Karabıyık MA. İSTEM MÜHENDİSLİĞİNİN BÜYÜK DİL MODELLERİNİN PERFORMANSINDAKİ ROLÜ: ANALİZ VE UYGULAMA ÖRNEKLERİ. KSU J. Eng. Sci. 2024;27:1401–1420.
MLA
Tan, Fatma Gülşah, et al. “İSTEM MÜHENDİSLİĞİNİN BÜYÜK DİL MODELLERİNİN PERFORMANSINDAKİ ROLÜ: ANALİZ VE UYGULAMA ÖRNEKLERİ”. Kahramanmaraş Sütçü İmam Üniversitesi Mühendislik Bilimleri Dergisi, vol. 27, no. 4, Dec. 2024, pp. 1401-20, doi:10.17780/ksujes.1480838.
Vancouver
1.Fatma Gülşah Tan, Asım Sinan Yüksel, Muhammed Abdulhamid Karabıyık. İSTEM MÜHENDİSLİĞİNİN BÜYÜK DİL MODELLERİNİN PERFORMANSINDAKİ ROLÜ: ANALİZ VE UYGULAMA ÖRNEKLERİ. KSU J. Eng. Sci. 2024 Dec. 1;27(4):1401-20. doi:10.17780/ksujes.1480838

Cited By

INDEXING & ABSTRACTING & ARCHIVING

download?token=eyJhdXRoX3JvbGVzIjpbXSwiZW5kcG9pbnQiOiJqb3VybmFsIiwib3JpZ2luYWxuYW1lIjoiaW1hZ2UucG5nIiwicGF0aCI6IjAzNTkvYmZjYS81YjQyLzY5ZjFkM2E4NWY2YWY3Ljg1NjQ2NDgxLnBuZyIsImV4cCI6MTc3NzQ1OTY0MCwibm9uY2UiOiI1NTUzYmJiN2U5NGNkMjdkYWNhMTRlMDZiYjc1OTY4NCJ9.nCVoSJClEIC9bWK5gGCmjHyTNRz2N0DhYKVJzJZR9Bs

download?token=eyJhdXRoX3JvbGVzIjpbXSwiZW5kcG9pbnQiOiJqb3VybmFsIiwib3JpZ2luYWxuYW1lIjoiaW1hZ2UucG5nIiwicGF0aCI6Ijg5YmUvODZlOC8wYzY0LzY5ZjFkNWE4MWJmYzY0LjM0OTM2NzM1LnBuZyIsImV4cCI6MTc3NzQ2MDE1Miwibm9uY2UiOiI3OWE1Mzk0OWRhMTk0Mjg0OGYzZTUxOWQyNTU5MjdjMSJ9.XxqhJ36woCZcO1DV_I9Mogpgg86-bwM454jQiOcqpS0 

This work is licensed under a Creative Commons Attribution 4.0 International License (CC BY 4.0).