구글 생성형 AI ‘제미나이’…모델별 특징·차이 한 방 정리
||2024.12.14
||2024.12.14
[디지털투데이 김예슬 기자] 제미나이(Gemini)는 구글의 대표 인공지능(AI) 라인이다. 제미나이는 무엇이고, 모델별 특징은 무엇인지, 다른 AI와는 어떻게 다른지 12일(현지시간) IT매체 테크크런치가 정리했다.
제미나이에는 제미나이 울트라, 제미나이 프로, 제미나이 플래시, 제미나이 나노의 총 4가지 유형이 있다. 모든 제미나이 모델은 기본적으로 멀티모달, 즉 단순한 텍스트 이상의 작업과 분석이 가능하도록 학습됐다. 이는 텍스트 데이터로만 학습된 구글의 람다(LaMDA)와 같은 모델과는 차별화되는 점이다.
제미나이는 멀티모달이기 때문에 음성을 필사하는 것부터 이미지와 비디오에 실시간으로 캡션을 넣는 것까지 다양한 작업을 수행할 수 있다. 이미지뿐만 아니라 음성 명령과 텍스트(PDF, 구글 드라이브 파일 포함)도 처리할 수 있다.
G메일이나 구글 닥스에서도 제미나이를 사용할 수 있다. 제미나이는 이메일 작성, 메시지 요약, 콘텐츠 편집, 아이디어 브레인스토밍 등의 기능을 제공한다. 구글 시트에서 데이터를 추적하고 정리해 표와 수식을 만드는 것도 가능하며, 구글 지도에서는 리뷰 요약, 여행 계획 등을 제공한다.
모델별로는 어떤 특징이 있을까.
우선 제미나이 울트라는 다양한 모드를 지원하기 때문에 숙제 풀기, 단계별 문제 해결, 실수 지적 등에 도움을 줄 수 있다. 또한 여러 논문에서 정보를 추출해 차트를 업데이트할 수도 있다.
제미나이 프로는 추론, 계획 및 이해 기능 면에서 람다보다 개선된 것이 특징이다. 제미나이 1.5 프로의 경우 최대 140만개의 단어, 2시간 분량의 비디오 또는 22시간 분량의 오디오를 처리할 수 있으며, 해당 데이터에 대해 추론하거나 질문에 답할 수 있다.
제미나이 플래시는 제미나이 프로의 파생 제품으로, 작고 효율적이며 좁은 범위 워크로드를 위해 개발됐다. 프로와 마찬가지로 오디오, 비디오, 이미지, 텍스트를 분석할 수 있지만 텍스트만 생성할 수 있다. 요약, 채팅 앱, 이미지 및 동영상 캡션, 긴 문서나 표에서 데이터 추출과 같은 작업에 적합하다고 한다.
제미나이 나노는 제미나이 프로 및 울트라 모델의 훨씬 작은 버전으로, 효율성이 특징이다. 신호나 와이파이 연결이 없어도 녹음 요약을 제공하고, 외부 서버로 작업을 보내지 않고 휴대폰 같은 기기에서 직접 실행할 수 있다.