Google I/O 2026: Gemini Omni가 Veo 4를 대체하고 전 플랫폼에 깔린다
Google I/O는 오늘 모두가 묻던 질문에 답을 내놓으며 시작했다. 그렇다, 새 비디오 모델이 있다. 아니다, 이름은 Veo 4가 아니다. 그 모델은 Gemini Omni이고, 이름을 바꾼 것 자체가 전략이다. 구글은 비디오, 오디오, 이미지, 텍스트 생성을 Gemini라는 이름 아래 하나의 통합 모델로 합치고 있다. 별도 제품 라인이던 Veo와 Imagen은 사실상 여기로 흡수됐다.
Demis Hassabis가 I/O 2026 기조연설에서 Gemini Omni를 소개한다
Gemini Omni가 실제로 무엇인가
Omni는 텍스트, 이미지, 오디오, 비디오를 어떤 조합으로든 입력으로 받아 Gemini의 세계 지식에 근거한 고품질 비디오를 출력한다. 모델은 대화로 편집한다. 클립을 올리고, 프레이밍을 돌려 달라고 하고, 요소를 추가하고, 조명을 바꾸고, 배우의 의상을 갈아입힌다. 파이프라인이 하나로 통합돼 있어서, 같은 모델이 생성, 편집, 이어 붙이기를 한 번에 처리한다.
첫날 배포는 공격적이다. Gemini Omni Flash는 지금 Gemini 앱, Google Flow, YouTube Shorts에서 전 세계 AI Plus, Pro, Ultra 구독자를 대상으로 가동 중이다. 구글의 이전 어떤 AI 비디오 출시보다도 훨씬 넓은 노출 면적이고, 3주 전 Sora 종료에 대한 정면 대응이다. 구글은 Sora가 버린 사용자들이 곧바로 갈 수 있는 구글 소유의 목적지를 확실히 마련해 두고 있다.
경쟁 모델과 비교하면
Kling 3.0와 비교하면 Gemini Omni의 핵심 차별점은 멀티모달 입력이다. Kling의 강점은 멀티숏 연속성과 4K 출력이고, Omni의 강점은 여러 모달리티에 걸쳐 레퍼런스를 자유롭게 섞는 능력이다(음성 클립 + 레퍼런스 이미지 + 프롬프트 + 가이드 영상을 하나의 출력으로 섞어 넣는다).
통합 모델 방식은 편집 워크플로도 바꾼다. Kling과 Runway는 편집을 별도의 모델 패스로 취급하지만(보통 더 느리고 더 비싸다), Omni는 생성과 같은 디퓨전 패스 안에서 편집을 처리한다. 실제로는 반복 작업이 전통적인 비디오 도구보다 텍스트 채팅에 더 가깝게 느껴진다.
Pro 등급 가격은 기조연설 무대에서 공개되지 않았지만, Flash 변형이 Gemini 앱을 통해 배포된다는 건 대부분의 구독자가 기존 등급으로 무료로 쓸 수 있다는 뜻이다. 이 하나만으로도 AI 비디오 시장의 상당 부분을 구글의 중력권 안으로 끌어들일 것이다.
가장 인상적인 Gemini Omni 데모들을 정리한 독립 매체의 리캡
Gemini 3.5 Flash와 Google Antigravity
개발자에게 중요한 발표가 두 개 더 있다. Gemini 3.5 Flash는 새로운 중간 등급 모델로, Flash 등급의 속도와 가격을 유지하면서도 코딩과 에이전트 벤치마크에서 Gemini 3.1 Pro를 앞선다고 한다. 오늘 Gemini를 호출하는 어떤 앱이든, 마이그레이션은 순수하게 이득이다.
Google Antigravity는 구글의 에이전트 우선 개발 플랫폼이다. 개발자가 코드를 짜도록 돕는 도구를 만드는 대신, 개발자가 행동하도록 돕는 에이전트를 제공한다는 게 핵심이다. 구글의 여러 제품 면(Search, Workspace, Cloud, 그리고 새로운 Gemini Spark 어시스턴트)에 걸쳐 작동한다. computer use를 갖춘 Anthropic의 Claude, 그리고 OpenAI의 GPT 기반 에이전트 스택을 정면으로 겨냥했다.
Android XR 안경 프리뷰도 있었는데, 정말 흥미롭긴 하지만 게임과 창작자 워크플로에 의미를 가지기엔 1년쯤 이르다.
이것이 AI 비디오 시장에 의미하는 것
오늘 세 가지가 움직인다.
첫째, 2024년과 2025년을 정의했던 "전문화된 여러 모델" 패턴(텍스트용 하나, 이미지용 하나, 비디오용 하나, 오디오용 하나)이 그 패턴을 만드는 데 일조했던 연구소 중 하나에 의해 명시적으로 종결되고 있다. 이게 자리 잡을지는 Omni의 통합 출력 품질이 데모뿐 아니라 실제 사용에서도 모달리티 전반에 걸쳐 버텨 주느냐에 달려 있다.
둘째, 배포 해자가 방금 더 넓어졌다. Sora는 충분히 빨리 10억 사용자에 닿지 못해서 죽었다. Omni는 첫날부터 Gemini 앱, Google Flow, YouTube Shorts에서 출발한다. 이미 수십억 명이 비디오를 만들고 보는 곳이다.
셋째, 오픈소스 모델과 가격 경쟁력 있는 모델들(Kling 초당 0.07~0.14달러, LTX-2 오픈 웨이트, Wan2.2)은 흥미로운 위치에 놓인다. 구글의 번들 제안이 "월 20달러 Gemini 구독에 무료로 포함"이라면, 경쟁할 수 있는 자리는 위쪽(더 깊은 제어가 되는 프로 도구)이거나 아래쪽(자체 호스팅하는 오픈소스)뿐이다.
우리가 먼저 테스트할 것
창작자 도구를 만드는 사람이라면 당장의 질문은 Omni API가 I/O 개발자 데이에 나오는지, 가격이 어떻게 되는지, 속도 제한이 어떤지다. 마케팅 면(Gemini 앱, Flow, Shorts)은 구글에 묶여 있다. API는 Omni를 자신의 제품에 통합하는 유일한 길이다. 이 세부 사항이 나오면 이 글을 업데이트하겠다.
게임 스튜디오라면 특히 멀티숏 일관성 이야기가 지켜볼 대목이다. Omni가 Kling 3.0처럼 컷 전반에 걸쳐 캐릭터를 유지하면서 중간에 편집 가능한 제어까지 된다면, 버티컬 슬라이스 트레일러용 영화적 프로토타이핑 비용이 훨씬 싸진다.