-
Transformer의 설명이 좋은 글 공유Machine Learning 2023. 8. 4. 09:10반응형
https://deeprevision.github.io/posts/001-transformer/
AI Research Blog - The Transformer Blueprint: A Holistic Guide to the Transformer Neural Network Architecture
A deep dive into Transformer a neural network architecture that was introduced in the famous paper “attention is all you need” in 2017, its applications, impacts, challenges and future directions
deeprevision.github.io
사실상 LLM의 기초가 되는 transformer의 encoder, decoder 기반 설명과 encoder, decoder를 이루고 있는 레이어들의 설명도 추가되어 있습니다.
좋은 자료라서, 공유 해놓고 까먹을 때마다 봐야겠네요...
반응형'Machine Learning' 카테고리의 다른 글
Llama3 출시 및 사용법, fine-tuning code (0) 2024.04.19 AI의 잠재력을 최대한 발휘하다: 효과적인 LLM Prompt(프롬프트) 작성법 (0) 2023.11.07 LLM Model의 새로운 Fine-tuning 방식 - LoRA Tuning (0) 2023.07.28 LLM Model을 가정 GPU에서 사용하는 방법 - Quantization 방법론 - GPTQ (1) 2023.07.28 Llama 2 설명 및 ChatGPT를 활용한 논문 요약 (0) 2023.07.19