본문 바로가기

Information

페이스북 META, GPT-3보다 우수한 LLaMA 모델 공개! 토렌트 유출로 논란, ChatGPT보다 더 대단할까?[

페이스북 META, GPT-3보다 우수한 LLaMA 모델 공개! 토렌트 유출로 논란, ChatGPT보다 더 대단할까?

최근, Meta의 대형 언어 모델 LLaMa가 온라인으로 유출되었다고 합니다.  이 모델은 보통 선별된 연구자, 정부 관계자, 민간 단체 회원들에게만 제한적으로 사용 가능한 모델이었는데, 4chan에 업로드 된 토렌트 파일을 통해 누구나 다운로드할 수 있게 된 것입니다.

https://boards.4channel.org/g/thread/91848262#p91850335

 

/g/ - /aicg/ - AI Chatbot General - Technology - 4chan

 

boards.4channel.org

https://github.com/facebookresearch/llama/pull/73/files

 

Save bandwidth by using a torrent to distribute more efficiently by ChristopherKing42 · Pull Request #73 · facebookresearch/ll

 

github.com

 

LLaMa (Large Language Model Meta AI) 모델은 페이스북  메타에서 만든 언어모델 입니다. 65억 개의 매개 변수로 구성되어 있으며, 그 크기는 OpenAI의 GPT-3와 유사하며, Google의 PaLM 및 DeepMind의 Chinchilla와 같은 다른 대형 언어 모델과 경쟁할 만큼 충분히 크다고 알려져 있다. 이러한 모델은 인공 지능 분야에서 다양한 작업에 사용되며, 대표적인 예로 자연어 이해, 챗봇, 기계 번역, 요약, 질문 답변 등이 있습니다.

반면에 ChatGPT는 OpenAI에서 개발한 모델로, 큰 특징은 대화를 자연스럽게 이어나갈 수 있도록 사전 학습된 데이터를 사용해 학습하는 것입니다.  GPT(Generative Pre-trained Transformer) 시리즈의 최신 버전으로, LLaMa와 마찬가지로 대용량 언어 모델로 분류됩니다. ChatGPT는 대화형 인공 지능에 매우 적합한 모델로, 챗봇, 자동 완성, 기계 번역 등에서 사용됩니다.