본문 바로가기
인공지능/인공지능 뉴스

애플의 AI 혁명: Mistral과 Hugging Face를 넘어서다!

by Maccrey 2024. 7. 25.
반응형

요즘 AI 세계는 그야말로 폭풍 같은 변화를 겪고 있습니다.

오늘은 바로 그 중심에 있는 애플의 새로운 AI 모델에 대해 이야기해보려고 합니다.

GPT-4o-mini로 세상을 깜짝 놀라게 한 애플이 이번에는 더 강력하고 효율적인 AI 모델을 출시했습니다.

특히 Mistral과 Hugging Face의 모델을 뛰어넘는 성능을 보여주며 주목받고 있습니다.

그럼 애플이 어떻게 이러한 놀라운 성과를 이루었는지, 그리고 이 모델들이 실제로 어떤 의미를 가지는지 함께 알아보겠습니다.

 

DataComp 프로젝트와 DCLM 모델의 탄생

애플의 최신 AI 모델은 DataComp for Language Models 프로젝트의 산물입니다.

이 프로젝트는 애플, 워싱턴 대학교, 텔아비브 대학교, 토요타 연구소 등 다양한 기관의 협력으로 이루어졌습니다.

DataComp 프로젝트는 고품질 데이터셋을 구축하고 이를 통해 뛰어난 성능의 AI 모델을 훈련시키는 것을 목표로 합니다.

특히 모델 기반 필터링 기법을 통해 대규모 데이터셋에서 고품질 데이터를 자동으로 선택하는 방법을 사용합니다.

 

이번에 공개된 DCLM 모델은 두 가지 주요 모델로 구성되어 있습니다.

7억 개의 매개변수를 가진 모델과 1.4억 개의 매개변수를 가진 모델입니다.

이 두 모델 모두 영어 언어 모델로, 7B 모델은 2.5조 개의 토큰을 사용하여 훈련되었으며, 1.4B 모델은 2.6조 개의 토큰을 사용하여 훈련되었습니다.

특히, 7B 모델은 OpenLM 프레임워크를 기반으로 한 사전 훈련 레시피를 사용하여 2K 컨텍스트 윈도우를 제공하며, MMLU에서 63.7%의 5-샷 정확도를 기록했습니다.

이는 이전까지 최고 성능을 자랑했던 MAP-Neo보다 6.6% 포인트 높은 수치입니다.

뛰어난 성능과 효율성

 

DCLM 모델의 성능은 단연코 인상적입니다.

MMLU 테스트에서 7B 모델은 63.7%의 정확도를 기록하며 Mistral-7B-v0.3(62.7%), Llama3 8B(66.2%), Google의 Gemma(64.3%)와 같은 선도적인 공개 모델들과 어깨를 나란히 하고 있습니다.

 

또한, 컨텍스트 길이를 8K로 확장하면서 추가적인 100B의 훈련을 통해 코어 및 확장된 벤치마크에서도 성능이 향상되었습니다.

다만 MMLU 결과는 그대로 유지되었습니다.

 

더 작은 1.4B 모델도 주목할 만합니다.

이 모델은 토요타 연구소와 공동으로 훈련되었으며, MMLU 테스트에서 41.9%의 점수를 기록했습니다.

이는 같은 카테고리의 다른 모델들, 예를 들어 Hugging Face의 SmolLM(39.97%), Qwen-1.5B(37.87%), Phi-1.5B(35.90%)보다 높은 수치입니다.

오픈 소스와 상업적 사용

애플은 DCLM 모델의 가치를 높이기 위해 완전히 오픈 소스로 공개했습니다.

7B 모델은 애플의 샘플 코드 라이선스 하에 제공되며, 1.4B 모델은 Apache 2.0 라이선스 하에 제공되어 상업적 사용, 배포, 수정이 가능합니다.

특히 7B 모델의 인스트럭션 튜닝 버전도 Hugging Face 라이브러리에 공개되어 있습니다.

 

애플의 새로운 DCLM 모델은 AI 연구와 실용화에 큰 도약을 의미합니다.

모델 기반 데이터 필터링 기법을 통한 고품질 데이터셋 구축은 AI 모델의 성능을 크게 향상시킬 수 있음을 보여줍니다.

애플의 이 혁신적인 접근 방식은 다른 연구자들에게도 큰 영감을 줄 것입니다.

앞으로 더 많은 연구와 실험이 이어지며 AI의 미래를 더욱 밝게 만들 것입니다.

당신을 위한 3 요약

애플의 최신 DCLM AI 모델은 Mistral과 Hugging Face 모델을 뛰어넘는 성능을 자랑합니다.

DataComp 프로젝트를 통해 고품질 데이터셋을 구축하고 모델 기반 필터링 기법을 사용한 결과, 7B와 1.4B 모델 모두 뛰어난 성능을 보여주고 있습니다.

이 모델들은 오픈 소스로 공개되어 있으며, 상업적 사용도 가능합니다.

애플의 혁신적인 접근 방식은 AI 연구와 실용화에 큰 영향을 미칠 것입니다.

 

 

 

 

Tester Share [테스터쉐어] - Google Play 앱

Tester Share로 Google Play 앱 등록을 단순화하세요.

play.google.com

 

 

나비일기장 [수발일기장] - Google Play 앱

수형자 수발가족및 수발인을 위한 일기장으로 수형생활시기에 따른 정보를 얻을 수 있습니다.

play.google.com

 

반응형