구글 딥마인드와 월드 랩스(World Labs)가 3D 생성 AI 도구의 프리뷰를 발표했습니다. 특히 이 분야에서는 **’지니 2(Genie 2)’**라는 모델이 주목받고 있습니다.
주요 내용:
- 지니 2 (Genie 2): 대규모 파운데이션 월드 모델
- 구글 딥마인드가 개발한 ‘지니 2’는 텍스트 프롬프트나 단일 이미지만으로 무한한 3D 가상 세계를 생성할 수 있는 파운데이션 월드 모델입니다.
- 이는 2D 비디오 게임을 만들던 기존 ‘지니’의 업그레이드 버전으로, 이제는 이미지와 텍스트 설명을 기반으로 대화형(상호 작용 가능) 실시간 3D 장면을 생성할 수 있습니다.
- 사용자는 생성된 3D 환경을 마치 게임처럼 탐색하고, 캐릭터를 움직이거나 특정 물체와 상호 작용할 수 있습니다. 예를 들어, 특정 키보드 입력에 따라 로봇이 움직이거나 문을 열고 폭발물을 쏘는 등의 액션이 가능합니다.
- **”월드 모델”**이라는 개념은 이 모델이 가상 세계를 시뮬레이션하고, 사용자의 행동에 따른 결과를 예측하여 일관된 3D 환경을 유지할 수 있다는 것을 의미합니다.
- 월드 랩스의 기술:
- ‘AI의 대모’로 불리는 페이페이 리 교수의 월드 랩스 또한 단일 이미지를 3D 장면으로 전환하는 ‘월드 모델’ 기술을 선보인 바 있습니다. 이 모델 역시 상호 작용이 가능하고 수정이 가능하다는 점이 특징입니다.
- 월드 랩스는 이 기술을 통해 반 고흐의 작품을 3D 환경으로 구현하는 등 상징적인 예술 작품을 새로운 방식으로 경험하게 할 수 있다고 설명합니다.
- 기술의 활용 가능성:
- 이러한 3D 생성 AI 도구들은 게임 개발, 영화 제작, 시뮬레이터 구축, 메타버스 콘텐츠 생성 등 다양한 분야에서 패러다임을 바꿀 잠재력을 가지고 있습니다.
- 텍스트나 이미지 몇 장만으로도 복잡한 3D 환경과 스토리를 시각화할 수 있게 되어, 창작자와 개발자들에게 새로운 영감과 효율성을 제공할 것으로 기대됩니다.
이번 발표는 AI 기술이 단순한 이미지나 비디오 생성을 넘어, 사용자와 상호 작용하는 3D 가상 세계를 창조하는 단계로 진화하고 있음을 보여주는 중요한 진전입니다.