Kling 3.0 글로벌 출시, 4K 영상과 네이티브 오디오, 멀티샷 생성까지

콰이쇼우는 2월 4일에 처음 발표했던 Kling 3.0을 전 세계에 출시했습니다. 이번 업데이트는 네이티브 4K/HDR 출력, 립싱크가 적용된 동기화 오디오, 멀티샷 내러티브 생성, 그리고 한 영상에서 움직임을 추출해 완전히 다른 캐릭터에 적용하는 모션 컨트롤을 제공합니다.

Kling 3.0의 새로운 기능 개요

네이티브 오디오를 갖춘 4K

Kling 3.0은 디퓨전 과정에서 직접 4K 해상도(3840x2160)와 30 FPS로 영상을 생성합니다. 생성 이후의 업스케일링 단계가 없습니다. 오디오 생성은 동일한 포워드 패스에 내장되어 있고, 영어, 중국어, 일본어, 한국어, 스페인어 다섯 가지 언어로 립싱크된 대사를 포함합니다. 이전 버전에서는 더빙과 오디오 동기화를 따로 거쳐야 했습니다. 이제 그럴 필요가 없습니다.

멀티샷 내러티브 시퀀스

가장 눈에 띄는 기능은 멀티샷 생성입니다. 한 세션에서 서로 연결된 최대 6개의 샷을 생성할 수 있고, 모델이 컷이 바뀌어도 캐릭터 일관성, 조명, 공간적 연속성을 유지합니다. 각 샷은 최대 15초까지 가능합니다.

이 기능은 숏폼 내러티브 콘텐츠를 정확히 겨냥합니다. 개별 클립을 따로 생성한 뒤 이어 붙이려 애쓰며 생성마다 어쩔 수 없이 생기는 캐릭터 변형까지 감당하는 대신, 시퀀스를 설명하기만 하면 같은 장면에 속한 듯 보이는 샷들을 돌려받습니다.

모션 컨트롤과 전이

Kling 3.0은 참조 영상에서 동작을 추출해 새로운 캐릭터에 적용할 수 있습니다. 춤 동작, 격투 안무, 특정 제스처를 한 영상에서 가져와 생성된 캐릭터에 매핑할 수 있습니다. 모델에는 프레임 단위 제어를 위한 모션 브러시와 정밀한 샷 구성을 위한 6축 카메라 컨트롤이 들어 있습니다.

프롬프트에는 @ 문법도 있어서 특정 캐릭터나 요소를 이름으로 참조할 수 있습니다. 한 번의 생성에서 캐릭터를 만들어 두었다면, 이후 프롬프트에서 그 캐릭터를 다시 불러올 수 있습니다.

Kling 3.0이 AI 영상에 가져오는 변화를 자세히 살펴보기

7-in-1 에디터

Kling 3.0에는 콰이쇼우가 "7-in-1 멀티모달 에디터"라고 부르는 기능이 함께 들어 있습니다. 텍스트-투-비디오, 이미지-투-비디오, 비디오-투-비디오, 모션 전이, 립싱크, 확장(extend), 리테이크(retake)를 하나의 작업 공간으로 통합합니다. AI 영상 제작이 보통 요구하는 분산된 도구 체인을 없애는 것이 목표입니다. 예전에는 생성, 더빙, 색 보정, 샷 조립을 위해 각각 다른 도구가 필요했습니다.

비교

Kling 3.0은 OpenAI의 Sora 2 Pro, Google의 Veo 3.1과 정면으로 경쟁합니다. 수치상으로 Kling은 해상도 우위(네이티브 4K 대 Sora의 1080p)와 가격 우위(초당 $0.07-0.14 대 Sora의 $0.10-0.50)를 가집니다. 또한 하루 66 크레딧이라는 넉넉한 무료 등급을 제공하는데, Sora에는 무료 등급이 없습니다.

Sora 2는 물리 시뮬레이션에서 여전히 앞서며, 빛의 굴절, 유체 역학, 충돌 물리를 더 설득력 있게 처리합니다. 나란히 놓고 비교하면 기본 시각적 충실도 점수도 더 높습니다. 대다수 리뷰어의 현실적인 조언은 둘 다 쓰면서 각 샷마다 더 나은 결과물을 고르라는 것입니다.

게임 개발자에게는 Kling 3.0의 멀티샷 생성과 모션 전이가 가장 흥미로운 기능입니다. 컷이 바뀌어도 캐릭터와 조명이 맞아떨어지는 일관된 영화적 샷 시퀀스를 생성할 수 있다는 점은 예고편 제작과 컷신 프로토타이핑에 바로 쓸 수 있습니다.

Kling 3.0 글로벌 출시, 4K 영상과 네이티브 오디오, 멀티샷 생성까지 ​

네이티브 오디오를 갖춘 4K ​

멀티샷 내러티브 시퀀스 ​

모션 컨트롤과 전이 ​

7-in-1 에디터 ​

비교 ​

참고 자료 ​

Kling 3.0 글로벌 출시, 4K 영상과 네이티브 오디오, 멀티샷 생성까지

네이티브 오디오를 갖춘 4K

멀티샷 내러티브 시퀀스

모션 컨트롤과 전이

7-in-1 에디터

비교

참고 자료