어른 질문엔 신중하게, 아이 질문엔 비유로… 지니TV, 대화형 AI 플랫폼 진화
||2026.01.29
||2026.01.29
고도화된 자연어 처리 기술과 멀티턴 대화로 직관적이고 풍부해진 서비스 제공
멀티 LLM 전략…B2C 서비스에 GPT-4o 기반 한국적 AI 모델 SOTA K 최초 도입

KT는 지니 TV가 AI 에이전트 적용 후 사람과 자유롭게 대화할 수 있는 차세대 대화형 AI 플랫폼으로 진화하고 있다고 29일 밝혔다.
혁신 중심에는 마스터 에이전트(Master Agent)와 서브 에이전트(Sub Agent)의 협업 구조로 설계된 미디어 에이전트(Media Agent) 기술이 꼽힌다.
마스터 에이전트는 지니TV 대화 시스템의 중앙 제어 허브로, 사용자의 발화를 분석하고 대화의 맥락을 이해한 뒤 가장 적합한 서브 에이전트를 선택해 결과를 통합한다. 이렇게 호출된 서브 에이전트는 역할에 맞는 동작을 수행하며 최적의 응답을 생성한다.
서브 에이전트는 여러 분야별로 역할이 특화된 전문 모듈형 AI이다. 각 서브 에이전트는 모델이 해석 가능한 형태로 자연어를 정규화하고, 사고의 구조를 설정하며, 실제 동작을 수행하는 3단계 절차적 사고를 따른다. 이를 통해 불필요한 추론이나 환각을 최소화하고, 보다 정확하고 자연스러운 대화 경험을 제공한다.
이제 사용자는 줄거리나 간단한 설명만으로도 콘텐츠를 찾을 수 있다. “꽉 막힌 고가도로에서 사람들이 차에서 내려 춤추는 영화는?”과 같이 컨텐츠 내용의 일부 상황 묘사만으로도 영화 제목을 알아낼 수 있다. “학교를 주제로 한 영화를 찾아줘”라고 질문하면 지니 TV는 학교 관련 소재나 사물이 포함된 작품을 탐색해 정보를 제공한다.
지니 TV AI 에이전트는 단방향이나 일회성 음성 명령을 넘어 ‘멀티 턴(Multi-turn) 대화’ 서비스를 제공해 사람과 자연스럽게 이어지는 대화 경험을 제공한다. 음성 인식률도 95% 이상으로 크게 개선돼 보다 자연스럽고 인간에 가까운 대화가 가능하다.
발화 정보 저장 및 멀티 LLM 전략으로 사용자 맞춤형 대화 구현
지니 TV AI 에이전트는 개인의 취향을 반영하는 지능형 파트너이다. STM(Short-Term Memory)가 최근 대화 내용을 저장하면, LTM(Long-Term Memory)를 통해 장기적으로 의미 있는 정보를 추출해 기억한다.
LTM은 STM에 저장된 사용자의 발화 중 “안녕” 같은 즉흥적이거나 부정확한 내용은 제외하고 기억할 가치가 있는 정보만 남긴다. “나는 요즘 다큐멘터리를 자주 봐.”에서 “다큐멘터리 선호”와 같이 명시적으로 표현된 사실만을 저장하면, 기존 LTM와 비교해 정보를 정제한다. 이후 사용자의 프로필 정보와 행동 이력을 분리해 관리하며 개인화 응답에 활용한다.
여기에 멀티 LLM 전략을 통해 사용자의 질문 의도에 맞는 가장 적합한 모델을 자동 호출하며 대화의 품질을 유지한다.
지니 TV AI 에이전트는 멀티 LLM 전략의 일환으로 ▲마이크로소프트와 협력해 도입한 애저 오픈AI 서비스(Azure OpenAI Service) ▲GPT-4o 기반 한국적 AI 모델 SOTA K(Sota K built on GPT-4o) 등을 활용한다. KT는 한국 가정 댁내 최적화된 환경 제공을 위해 멀티 LLM 연동을 확장하고 멀티모달 모델 확보를 계속 추진할 계획이다.
한편 SOTA K의 지니 TV AI 에이전트 적용은 지난 9월 모델 출시 이후 최초로 B2C 서비스에 도입된 사례로, KT와 마이크로소프트의 전략적 협업 성과를 보여준다. SOTA K는 글로벌 최고 수준 성능의 GPT-4o에 한국어와 한국 사회·문화적 맥락을 정교하게 접목한 협업형 모델이다.
©(주) 데일리안 무단전재 및 재배포 금지
고객님만을 위한 맞춤 차량
