Skip to content

TRELLIS.2: 이미지를 몇 초 만에 PBR 에셋으로 만드는 Microsoft의 오픈소스 이미지-3D 모델

Microsoft Research가 TRELLIS.2를 공개했습니다. 40억 파라미터 규모의 이미지-3D 모델로, 완전한 PBR 머티리얼이 들어간 텍스처드 3D 에셋을 생성합니다. MIT 라이선스에 오픈소스이고 빠릅니다. NVIDIA H100 기준으로 512 큐브 해상도에서 3초, 1024 큐브에서 17초, 1536 큐브에서 60초가 걸립니다.

2D 이미지를 완전한 텍스처드 3D 모델로 바꾸는 Microsoft의 TRELLIS

무엇을 생성하나

기본 메시에 정점 색을 구워 넣는 정도였던 기존 이미지-3D 모델과 달리, TRELLIS.2는 완전한 PBR 머티리얼 맵을 만들어 냅니다. 알베도, 메탈릭, 러프니스, 노멀, 오패시티가 모두 포함됩니다. 게임 엔진과 렌더링 파이프라인이 기대하는 바로 그 맵들이라, 생성된 에셋을 머티리얼을 따로 설정할 필요 없이 Blender, Unreal Engine, Unity로 바로 가져갈 수 있습니다.

이 모델은 flow-matching transformer와 새로운 O-Voxel 표현을 사용합니다. O-Voxel은 16배 공간 압축을 적용한 "필드 없는(field-free)" 희소 복셀 구조로, 임의의 토폴로지를 처리합니다. 여기에는 기존 등치면(iso-surface) 방식으로는 표현할 수 없던 열린 표면, 비매니폴드 지오메트리, 내부 구조가 포함됩니다.

속도와 해상도

생성 속도는 해상도에 따라 달라집니다.

해상도시간 (H100)
512³약 3초
1024³약 17초
1536³약 60초

메시에서 O-Voxel로 변환하는 데는 CPU에서 10초 미만이 걸립니다. O-Voxel에서 다시 메시로 변환하는 데는 CUDA 가속으로 100밀리초 미만이 걸립니다.

TRELLIS 1과 비교하면

TRELLIS.2는 파라미터 수를 20억에서 40억으로 두 배 늘렸습니다. 원래 TRELLIS도 괜찮은 지오메트리를 생성할 수 있었지만 제대로 된 PBR 머티리얼이 없었습니다. 2버전은 전체 머티리얼 파이프라인을 추가했고, 더 복잡한 토폴로지를 처리하며, 더 높은 해상도에서 동작합니다.

튜토리얼: TRELLIS로 2D 이미지에서 3D 모델 만들기

사용하는 방법

TRELLIS.2를 실행하는 방법은 여러 가지입니다.

Hugging Face 데모. 무료 웹 데모에서 이미지를 업로드하면 별도의 로컬 설정 없이 3D 모델을 받을 수 있습니다.

로컬 배포. GitHub 저장소에 로컬 설치용 Docker 이미지가 포함되어 있습니다. 편하게 돌리려면 VRAM이 최소 24GB인 NVIDIA GPU가 필요합니다.

ComfyUI 통합. 커뮤니티에서 만든 ComfyUI 노드를 쓰면 TRELLIS.2를 다른 AI 도구들과 함께 기존 생성 워크플로에 넣을 수 있습니다.

왜 중요한가

오픈소스 이미지-3D는 꾸준히 좋아져 왔지만, 대부분의 모델은 지오메트리는 괜찮은데 텍스처가 나쁘거나, 겉보기에는 멋진데 토폴로지를 들여다보면 무너지는 식이었습니다. TRELLIS.2는 이 두 가지를 모두 해결합니다. 프로덕션에 쓸 만한 해상도에서 깔끔한 지오메트리와 제대로 된 PBR 머티리얼을 함께 생성합니다. MIT 라이선스라 제약 없이 상업적으로 쓸 수 있습니다.

게임 개발자와 3D 아티스트에게 이것은 쓸모 있는 프로토타이핑 도구입니다. 콘셉트 아트 이미지를 넣으면 몇 초 만에 텍스처드 3D 모델이 나오고, 거기서부터 다듬어 가면 됩니다.

참고 자료