Stop Thinking, Just Do!

Sungsoo Kim's Blog

Application Development using Large Language Models

tagsTags

27 March 2024


Article Source


Application Development using Large Language Models

Abstract

The rise of large language models (LLMs) offers a new approach for quickly building AI applications. While LLMs such as ChatGPT, Bard, and Bing chat are widely understood as consumer tools, the best practices for developers to effectively use these models through API calls remain poorly understood. This tutorial will share with the NeurIPS audience best practices for building AI applications using LLMs.

This course will include, but also go significantly beyond, “prompt engineering.” We will share best practices for integrating LLMs into more complex software systems, evaluating and continually improving their performance, and enhancing their safety. We will discuss best practices for using LLMs in common operations such as summarizing, making inferences, transforming text, and expanding text, as well as in-context learning, fine-tuning, and the utilization of both open-source and proprietary cloud-hosted LLMs.

LLMs are transforming the development process of AI applications. For example, a sentiment classifier that used to take weeks to build, via a process of collecting and labeling training examples, tuning a supervised model, and then finally deploying the model to make inferences, can now be built in hours by prompting an LLM API.

Through this tutorial, we hope to connect research and practice, and also inspire researchers to pursue new directions relevant to how LLMs are being used today.

대규모 언어 모델(LLM)을 활용한 인공지능 응용 프로그램 개발 최적 실행 방안

최근 대규모 언어 모델(LLM)의 등장은 인공지능(AI) 응용 프로그램을 빠르게 구축할 수 있는 새로운 접근 방식을 제공합니다. ChatGPT, Bard, Bing chat과 같은 LLM은 일반적으로 소비자 도구로 인식되지만, 개발자가 API 호출을 통해 이러한 모델을 효과적으로 사용하는 최적의 실행 방법은 아직 잘 알려져 있지 않습니다. 이 강좌는 NeurIPS 참가자들에게 LLM을 활용하여 인공지능 응용 프로그램을 구축하는 최적의 실행 방안을 공유합니다.

이 강좌는 “프롬프트 엔지니어링(prompt engineering)” 이상의 내용을 다루며 좀 더 복합적인 소프트웨어 시스템에 LLM을 통합하고, 성능을 평가 및 지속적으로 개선하며, 안전성을 향상시키는 방법에 대한 최적의 실행 방안을 제시합니다. 텍스트 요약, 추론 수행, 텍스트 변환 및 확장과 같은 일반적인 작업에서 LLM을 사용하는 방법과 컨텍스트 학습, 미세 조정, 오픈 소스 및 독점 클라우드 호스팅 LLM 활용 방법에 대한 최적 실행 방안을 논의할 것입니다.

LLM은 인공지능 응용 프로그램의 개발 프로세스를 변화시키고 있습니다. 예를 들어, 과거 수집 및 레이블링된 훈련 예시를 통해 지도 학습 모델을 튜닝하고 최종적으로 모델을 배포하여 추론을 수행하는 과정을 통해 몇 주가 걸렸던 감정 분류기는 이제 LLM API를 프롬프팅하는 방식으로 몇 시간 만에 구축할 수 있습니다.

이 강좌를 통해 연구와 실무를 연결하고, 연구원들이 오늘날 LLM이 사용되는 방식과 관련된 새로운 연구 방향을 추구하도록 영감을 주고자 합니다.


comments powered by Disqus