Developer/AI

· Developer/AI
들어가며안녕하세요~!오늘은 요즘 핫한 LLM(Large Language Model)의 구조와 동작 방식에 대해 이해하기 쉽게 한번 정리해보려 합니다.깊게 들어가면 들어갈수록 수학적인 공식과, 논문 레벨 단위로 설명을 해야 되는데, 그렇게 deep 한 level 은 다루진 않고이해하기 쉽게 풀어가며 정리해보려고 합니다 😁ArchitectureLLM 은 기본적으로 언어(Language)를 기반으로 다음에 나올 Token 을 예측하여 확률을 할당하는 모델입니다.수십억개의 파라미터를 가진 신경망(Neural Network) 구조를 기반으로 하고 있습니다. 예전에는 통계(ex. Linear Regression)를 기반으로 한 모델들도 있었지만, 요즘은 신경망(Neural Network) 을 기반으로 하는 것이 ..
huisam
'Developer/AI' 카테고리의 글 목록