본문 바로가기
Programming/AI

멀티모달 AI & 대화형 챗봇(AI) 차이

by 코딩하는 금융인 2023. 12. 29.

안녕하세요.

오늘은 최근 핫한 AI 이슈인 멀티모달에 대해서 기존 AI와 비교하며 알아보겠습니다.

 

 멀티모달 AI 현황 및 비교

▣ 멀티모달 ai란?

텍스트, 이미지, 음성 등 여러 종류의 데이터를 동시에 처리할 수 있는 AI 기술
(멀티모달 AI에서 ‘모달(Modal)’은 ‘모달리티(Modality)’의 축약된 표현)

 

: 멀티모달 ai 현황
 - 오픈AI가 올 10월 보고 듣는 기능을 통합한 챗GPT(GPT-4)를 선보인 데 이어 구글도 12월 6일 멀티모달 AI ‘제미나이(Gemini)’를 공개함
 - 구글 '제미나이'뿐만 아니라 빅테크 기업들이 투자한 멀티모달 ai가 속속히 등장하고 있음
 - 메타(Meta)는 지난 8월 '심리스M4T(SeamlessM4T) '라는 멀티모달 AI 기반 번역 모델을 공개했는데, 100여개 언어에 대한 음성:텍스트의 4(=2X2)가지 번역 기능을 제공함
 - 마이크로소프트(MS)는 손쉽게 AI를 학습시킬 수 있는 로브(Lobe) 소프트웨어를 공개함, 3가지 단계(이미지 분류→물체 감지→데이터 분류)로 머신러닝 프로세스를 단순화하여 자동 학습을 시킬 수 있음
 - 아마존(AWS)도 자체 개발 LLM ‘타이탄’(이미지 생성기)의 멀티모달 버전을 지난 11월말 공개함

 

: 멀티모달 ai & 대화형 챗봇(ai) 차이점

 

 - 기존 AI가 대체로 한 가지 유형(텍스트/이미지)의 데이터를 처리할 수 있는 데 비해, 멀티모달 AI는 인간처럼 여러 데이터를 동시에 활용할 수 있어 더 풍부하고 복잡한 정보를 이해하고 처리할 수 있음

 - 일방향적인 대화형 챗봇 ai와 다르게, 인간처럼 의사결정을 맡기는 등 다양한 서비스 등장할 수 있음

 

 

반응형

댓글