Meta의 Llama 3.1 405B: 가장 큰 오픈 소스 AI 모델 공개

2024년 07월 27일

Meta의 Llama 3.1 405B: 가장 큰 오픈 소스 AI 모델 공개

2024년 7월 23일, Meta는 자사의 최신이자 가장 큰 오픈 소스 AI 모델인 Llama 3.1 405B를 발표했습니다. Llama 시리즈는 Meta의 대표적인 AI 모델로, 이전 버전들인 Llama 2와 Llama 3이 큰 인기를 끌었습니다. Llama 3.1 405B는 이러한 전통을 이어받아 더욱 강력한 성능과 확장성을 제공하기 위해 개발되었습니다.

Microsoft Designer 제작

1. 모델 규모와 성능

Llama 3.1 405B는 4050억 개의 매개변수를 가진 Meta의 가장 큰 오픈소스 AI 모델입니다.
16,000대의 Nvidia H100 GPU를 사용해 훈련되었습니다.
성능면에서 OpenAI의 GPT-4와 비슷한 수준이며, GPT-4o 및 Anthropic의 Claude 3.5 Sonnet과 경쟁력 있는 결과를 보여줍니다.

2. 주요 특징

8개 언어(영어, 독일어, 프랑스어, 이탈리아어, 포르투갈어, 힌디어, 스페인어, 태국어)로 문서 요약 가능
코딩, 기본 수학 문제 해결 등 다양한 작업 수행 가능
128,000 토큰의 컨텍스트 윈도우 (약 50페이지 분량의 책)
Brave Search, Wolfram Alpha API, Python 인터프리터 등 외부 도구 사용 가능

3. 훈련 데이터

15조 개의 토큰 (약 7500억 단어)을 사용해 훈련
2024년까지의 데이터 포함
합성 데이터를 사용해 미세 조정

4. 라이선스 및 배포

개발자들이 Llama 3.1 모델의 출력을 사용해 제3자 AI 생성 모델을 개발할 수 있도록 라이선스 업데이트
월 사용자 7억 명 이상의 앱 개발자는 Meta의 특별 라이선스 필요

5. 기타 모델

Llama 3.1 8B와 Llama 3.1 70B도 함께 공개
이 소형 모델들도 128,000 토큰의 컨텍스트 윈도우 제공

Meta의 Llama 3.1 405B는 그 규모와 성능 면에서 현존하는 가장 큰 오픈 소스 AI 모델 중 하나입니다. 이를 통해 다양한 AI 응용 프로그램이 개발되고, 더 나은 성능을 제공할 수 있게 되었습니다. Meta는 앞으로도 AI 기술의 발전을 위해 지속적으로 노력할 것이며, Llama 3.1 405B와 같은 모델을 통해 더 많은 사람들이 AI의 혜택을 누릴 수 있도록 할 것입니다.



위 글은 AI로 작성하였습니다.

← GPT-4o Mini: 차세대 경량 AI 모델 랜딩페이지란? 성공적인 온라인 마케팅의 필수 도구 →