안녕하세요.
오늘은 최근 애플이 공개한 오픈소스 언어모델 OpenELM에 대한 의미와 사용방법에 대해 알아보겠습니다.
애플 OpenSource LLM OpenELM
▣ OpenELM
애플 연구팀이 공개한 오픈소스 언어모델로, 애플 디바이스에서 동작 가능하도록 설계된 애플식 온디바이스 AI
- "Open-source Efficient Language Models"의 약자로, 2억 7천만에서 30억 개의 매개변수를 가진 8개의 모델로 구성됨
- 애플은 OpenELM 학습에 사용된 CoreNet 라이브러리의 코드와 재현 가능한 학습 레시피를 공개함 (아래 참조)
- 아직까지는 AI 언어모델 기능이 애플 기기에 통합되지 않았으나, 6월 WWDC(개발자 회의)에서 관련 내용이 공개될 것으로 예상됨
▣ OpenELM 사용해보기
- Hugging Face에서 Apple Sample Code License로 사용 가능하며, 라이선스에는 일부 제한이 있고 직접 다운로드할 수 있음
- 파라미터가 많은 버전일수록 평균적인 성능이 좋으며, 아래는 관련 모델들 리스트임 (출처 : Hugging Face)
- OpenELM-270M
- OpenELM-450M
- OpenELM-1_1B
- OpenELM-3B
- OpenELM-270M-Instruct
- OpenELM-450M-Instruct
- OpenELM-1_1B-Instruct
- OpenELM-3B-Instruct
- 간단하게 Chatbot으로 체험해보고 싶다면, Apple OpenELM-3B-instruct HuggingFace Demo 버전을 사용하면 됨
- 파라미터 개수가 여타 LLM에 비해 적은 편이고 온디바이스를 염두에 둔 모델이라 영어로 질문했을 때는 잘 대답을 하는 편이지만, 한국어에 대해서는 응답이 아직 제대로 되지 않음
- 최근 AI 추세가 SLM인 만큼 디바이스용 AI를 미리 체험해볼 수 있다는 정도로 생각하면 될 것 같음
References
반응형
'Programming > AI' 카테고리의 다른 글
Perplexity.ai 검색 엔진 소개 및 사용법 (5) | 2024.05.12 |
---|---|
마이크로소프트 AI SLM Phi-3 (6) | 2024.05.06 |
라마3 메타 오픈소스 모델 사용법 (3) | 2024.04.28 |
AI 노래 생성하기 Udio 사용법 (31) | 2024.04.21 |
LangChain LLM App 개발 프레임워크 (1) (3) | 2024.04.14 |
댓글