프랑스의 AI 스타트업 미스트랄이 새로운 대형 언어 모델(LLM)을 발표하면서 AI 업계에 새로운 파란을 일으켰습니다. 이번에 공개된 '라지(Large) 2' 모델은 매개변수가 1230억 개에 달하며, 메타의 최신 모델 라마 3.1과 동등한 성능을 자랑한다고 합니다. AI 기술이 하루가 다르게 발전하는 이 시점에, 라지 2 모델의 출시는 많은 이들의 관심을 모으고 있습니다.
AI 기술의 끝없는 발전
인공지능 기술은 우리의 일상에 깊이 침투하며 빠르게 발전하고 있습니다. 최근 몇 년간 AI의 발전 속도는 놀라울 정도로 빠르게 진행되어 왔고, 다양한 AI 모델들이 선보여지면서 그 가능성은 무한해 보입니다. 특히 대형 언어 모델(LLM)은 자연어 처리, 코드 생성, 데이터 분석 등 다양한 분야에서 혁신을 이끌고 있습니다. 이번에 발표된 미스트랄의 '라지 2' 모델은 이러한 AI 발전의 최전선에 서 있는 모델로, 많은 기대를 모으고 있습니다.
미스트랄 '라지 2' 모델의 등장과 성능
프랑스의 AI 스타트업 미스트랄이 공개한 '라지 2' 모델은 무려 1230억 개의 매개변수를 가지고 있으며, 12만8000 토큰의 컨텍스트 창을 제공합니다. 이는 메타의 라마 3.1 모델 중 가장 큰 모델(4050억 개 매개변수)에 비해 매개변수 크기가 3분의 1도 안 되지만, 성능 면에서는 동등하거나 더 뛰어난 것으로 평가받고 있습니다.
1. 라지 2의 다국어 및 코드 생성 기능
라지 2 모델은 이전 버전인 라지 모델을 기반으로 성능을 대폭 개선했습니다. 특히 추론, 코드 생성, 수학 등 다양한 영역에서 뛰어난 성능을 자랑합니다. 또한, 한국어를 포함해 영어, 프랑스어, 독일어, 스페인어, 이탈리아어, 포르투갈어, 아랍어, 힌디어, 러시아어, 중국어, 일본어 등 12개 언어와 80개의 코딩 언어를 지원합니다. 이러한 다국어 지원은 전 세계 사용자가 편리하게 AI를 활용할 수 있도록 도와줍니다.
2. 고급 기능 및 벤치마크 성능
라지 2는 고급 함수 호출 및 검색 등 새로운 기능을 제공합니다. 미스트랄은 라지 2 모델이 합성 텍스트 생성, 코드 생성, 검색 증강 생성(RAG)와 같이 높은 추론 능력이 필요하거나 매우 특수화된 작업에 효과적이라고 설명합니다. 특히, 라지 2 모델은 MMLU, HumanEval, MultiPL-E, GSM8K, 매스 인스트럭트 등의 다양한 벤치마크에서 뛰어난 성능을 보였습니다.
라지 2 모델은 추론 능력 측정 벤치마크인 MMLU에서 라마 3.1-405B와 동등한 성능을 보였으며, 코드 생성을 위한 휴먼 이밸(HumanEval) 및 휴먼 이밸 플러스 벤치마크에서 GPT-4o에 이어 2위를 차지했습니다. 함수 호출 벤치마크에서는 GPT-4o, 클로드 3.5 소네트, 클로드 3 오퍼스를 제치고 1위를 차지하는 등, 라지 2 모델의 성능은 매우 우수하다는 것이 입증되었습니다.
AI 기술의 새로운 가능성을 열다
미스트랄의 '라지 2' 모델은 AI 기술의 새로운 가능성을 열었습니다. 비록 멀티모달 기능이 빠져 있긴 하지만, 텍스트 생성과 코드 생성 등에서 뛰어난 성능을 보이며, 상업적 용도로도 큰 가능성을 보여주고 있습니다. 구글 버텍스 AI, 아마존 베드록, 애저 AI 스튜디오, IBM 왓슨xi 등 다양한 플랫폼에서 사용할 수 있으며, 미스트랄의 AI 챗봇 '르샤(le Chat)'를 통해 무료로 테스트해 볼 수도 있습니다.
하지만, 라지 2 모델은 비상업적 연구 용도로만 공개되어, 상업 및 기업용 애플리케이션에 사용하려면 별도의 라이선스 및 사용 계약이 필요합니다. 이는 오픈 소스로 공개된 라마 3.1과는 차별화되는 점이기도 합니다.
결국, 미스트랄의 '라지 2' 모델은 AI 업계에 큰 반향을 일으키며, 앞으로의 AI 발전에 중요한 이정표가 될 것입니다. 이 모델의 등장은 AI 기술이 얼마나 빠르게 발전하고 있는지를 잘 보여주며, 앞으로의 AI 혁신에 대한 기대감을 더욱 높여줍니다.
당신을 위한 3줄 요약
프랑스의 AI 스타트업 미스트랄이 매개변수 1230억 개를 가진 대형 언어 모델 '라지 2'를 발표했습니다. 이 모델은 메타의 라마 3.1과 동등한 성능을 자랑하며, 다양한 언어와 코딩 언어를 지원합니다. 고급 함수 호출 및 검색 등 새로운 기능을 제공하며, 여러 벤치마크에서 뛰어난 성능을 보였습니다. 비상업적 연구 용도로 공개된 이 모델은 AI 기술의 새로운 가능성을 열며, 앞으로의 AI 발전에 중요한 역할을 할 것으로 기대됩니다.
'인공지능 > 인공지능 뉴스' 카테고리의 다른 글
일론 머스크, 10만 GPU 클러스터로 '그록-3' 개발! 오픈AI 챗GPT를 능가할까? (1) | 2024.07.29 |
---|---|
구글 주가 급락 원인: 서치GPT의 등장 (0) | 2024.07.27 |
Llama 3.1: 최신 오픈소스 AI 모델의 혁신과 활용 방법 (0) | 2024.07.25 |
애플의 AI 혁명: Mistral과 Hugging Face를 넘어서다! (0) | 2024.07.25 |
구글 딥마인드, AI로 날씨 예측의 새로운 장을 열다: '뉴럴GCM' 시뮬레이터 개발 (2) | 2024.07.24 |