DataCook

AI의 잠재력을 최대한 발휘하다: 효과적인 LLM Prompt(프롬프트) 작성법

Machine Learning 2023. 11. 7. 16:13

인공지능의 발전은 우리의 상상력을 현실로 만드는 데 한걸음 더 다가가게 해주었습니다. Large Language Models (LLM)은 특히 텍스트 기반 작업을 자동화하고 인간처럼 소통할 수 있는 능력을 제공합니다. 그러나 이 기술의 놀라운 잠재력을 최대한 활용하기 위해서는 올바른 프롬프트 작성이 필수적입니다. 이 블로그에서는 LLM에 사용할 프롬프트를 효과적으로 작성하는 방법에 대해 상세하게 설명해 드리겠습니다. 클리어하고 구체적인 목표 설정 명확성: 프롬프트는 LLM에게 분명한 지시를 제공해야 합니다. 무엇을 요청하는지, 어떤 정보가 필요한지, 또는 어떤 종류의 작업을 완수해야 하는지 명확히 하세요. 구체성: 가능한 한 구체적이어야 합니다. "비즈니스 이메일 작성"보다는 "고객에게 새로운 상품 출시..

기준 금리, 가산 금리의 이해와 그 영향

경제 관련 2023. 11. 7. 16:05

금리는 경제의 핏줄이라 할 수 있습니다. 단순히 은행에서 돈을 빌릴 때 지불하는 비용이라는 개념을 넘어, 전체 경제에 영향을 미치는 중요한 변수입니다. 이 글에서는 금리의 개념, 금리 변동의 긍정적 및 부정적 측면, 그리고 기준금리와 가산금리의 차이에 대해 설명하겠습니다. 또한, 세계 경제에서 미국 금리의 중요성에 대해서도 논의해 보겠습니다. 금리란? 금리는 돈을 빌리는 대가로 지불하는 비용으로 표현됩니다. 은행이나 다른 금융 기관에서 돈을 빌릴 때, 그 기관은 특정 비율의 금리를 부과하여 이자 형태로 수익을 얻습니다. 반대로, 저축이나 투자를 할 때는 이 금리가 수익률로 작용합니다. 금리 상승의 긍정적 측면: 저축 증가: 금리가 오르면 저축에 대한 보상이 커지기 때문에 개인이나 기업의 저축을 장려할 수..

테이퍼링(Tapering)이란 무엇인가?

경제 관련 2023. 11. 7. 15:58

경제학에서 중앙은행의 정책 변화를 이해하기 경제학의 세계에서 '테이퍼링'이라는 용어는 중앙은행, 특히 연방준비제도(Fed, 미국 중앙은행) 같은 기관들이 통화정책을 변경할 때 자주 사용됩니다. 테이퍼링은 기본적으로 중앙은행이 경제를 자극하기 위해 실시했던 양적 완화 정책을 천천히 줄여나가는 과정을 의미합니다. 이 포스트에서는 테이퍼링이 무엇인지, 왜 중요한지, 그리고 그것이 우리의 경제와 투자에 어떤 영향을 미치는지에 대해 자세히 살펴보겠습니다. 테이퍼링의 배경: 양적 완화 테이퍼링을 이해하기 위해서는 먼저 양적 완화의 개념을 이해할 필요가 있습니다. 양적 완화는 중앙은행이 금융위기와 같은 비상 상황에서 시장에 유동성을 공급하고 경제 활동을 촉진하기 위해 대규모로 자산을 매입하는 정책입니다. 이러한 자산..

How to Optimize FastAPI for ML Model Serving

Programming/Python 2023. 10. 4. 10:14

https://luis-sena.medium.com/how-to-optimize-fastapi-for-ml-model-serving-6f75fb9e040d How to Optimize FastAPI for ML Model Serving If you do I/O alongside ML model serving, this will definitely make your FastAPI service faster. luis-sena.medium.com

Docker Image 경량화 방법 - 1부

Programming/Docker 2023. 8. 8. 12:41

제가 사용하는 방식은 Develop Image의 용량이 너무 커서, 줄이는 방법을 고안하면서 터득했던 방법론을 공유하고자 합니다. 실제 개발에 사용하고 있고, 많은 테스트를 진행한 결과입니다. 3부작으로 나누었습니다. 1부 일반적인 패키지 관리 방법 2부 멀티스테이징 빌드 3부 ENTRYPOINT를 활용한 마지막 경량화 대부분 Deploy 이미지를 구축하는 방법에 대해서는 많은 레퍼런스가 있기 때문에 그런 부분부터 보고 오시면 조금 더 이해가 쉬울 수 있습니다. 일단 Docker Image는 다수의 이미지 레이어의 결합체입니다. 예를들어서, 이런 이미지와 FROM ubuntu:20.04 RUN apt-get update --yes RUN apt-get install --yes --no-install-re..

Transformer의 설명이 좋은 글 공유

Machine Learning 2023. 8. 4. 09:10

https://deeprevision.github.io/posts/001-transformer/ AI Research Blog - The Transformer Blueprint: A Holistic Guide to the Transformer Neural Network Architecture A deep dive into Transformer a neural network architecture that was introduced in the famous paper “attention is all you need” in 2017, its applications, impacts, challenges and future directions deeprevision.github.io 사실상 LLM의 기초가 되는..

빈 컨테이너 실행 방법 - docker image debug

OS 2023. 8. 4. 08:25

Docker Image를 만들다 보면 이게 잘 만들어졌는지 테스트가 필요할 때가 많은데, 이럴 때마다 entrypoint를 실행하기까지 조금 부담스러울 때, 사용되는 방법입니다. 파일이 어떤 형식으로 배치 되었는지, 불필요한 파일과 필요한 파일을 분리하거나, 필요없는 dependency가 설치되었는지, 내가 원하는 실행 파일이 설치 되었는지 확인이 필요할 때가 많습니다. 아무것도 실행하지 않는 도커 컨테이너를 실행하는 방법은 여러 가지가 있습니다. 아래의 방법 중 하나를 선택하여 사용할 수 있습니다. 빈 컨테이너 실행: 가장 간단한 방법은 빈 컨테이너를 실행하는 것입니다. 이렇게 하면 실행 중인 프로세스가 없는 컨테이너가 생성됩니다. docker run -d --name empty_container ub..

LLM Model의 새로운 Fine-tuning 방식 - LoRA Tuning

Machine Learning 2023. 7. 28. 09:47

사실 이 개념은 나온지는 오래된 개념이지만Bert, RoBERTa처럼 그렇게 크지 않은 모델을 사용할 때는 그냥 Full-fine tuning을 진행하지 굳이 LoRA를 사용하지는 않았습니다.Bert-Base: 450M, RoBERTa: 1.3GB 정도입니다.Llama가 나오면서 이 모델들을 Full Fine tuning을 하기에는 컴퓨팅 소스가 매우 크기 때문에 LoRA가 빛을 발했다고 저는 생각합니다.개념은 기존의 Pre-trained Layer의 가중치는 고정을 한체, 새로운 레이어의 가중치만을 학습을 시키는데도, 실제 성능의 차이가 많지 않다고 합니다.동작 방식은 기존 LLM Model은 RAM에 저장을 하고 CPU inference만 진행하고, LoRA 가중치는 GPU에 저장을 해서 학습을 진행..

ABOUT ME

DataCook DataCook

티스토리툴바

ABOUT ME

전체 글

티스토리툴바