Google Lumiere: STUNet을 사용하여 사실적인 모션을 위한 AI 비디오 제작 재정의

ByJae-yoon Ryu

Published1월 29, 2024

STUNet 기술은 Google의 Lumiere를 불쾌한 계곡 너머로 데려가 거의 사실적인 비디오를 제작할 수 있는 잠재력을 보여줍니다.

Google의 Lumiere는 비디오 제작에서 인공 지능(AI)의 한계를 뛰어넘어 우리를 그 어느 때보다 현실감 있게 만들고 있습니다. 이 혁신적인 모델은 STUNet(Space-Time-U-Net)으로 알려진 선구적인 출판 기술을 사용하여 공간적 차원과 시간적 차원을 동시에 이해함으로써 비디오 제작 방식에 혁명을 일으켰습니다.

스틸 프레임을 연결하는 기존 방법과 달리 Lumiere는 전체 비디오를 하나의 응집력 있는 시퀀스로 생성하여 프로세스를 단순화합니다. 주어진 벡터에서 키프레임을 생성한 다음 STUNet 프레임워크를 사용하여 해당 프레임 내 객체의 움직임을 예측하고 프레임 간에 원활하게 전환하여 부드러운 모션을 생성합니다. 놀랍게도 Lumiere는 80프레임을 생성하는데, 이는 Stable Video Diffusion에서 일반적으로 생성되는 25프레임보다 훨씬 뛰어납니다.

시선을 사로잡는 클립과 그에 수반되는 과학 논문을 통해 Google은 놀라울 정도로 짧은 기간에 불쾌한 계곡에서 거의 현실감에 가까운 AI 기반 비디오 제작의 진화를 보여줍니다. Lumiere의 등장으로 Google은 Runway 및 Meta의 Emu와 같은 경쟁업체와 어깨를 나란히 하게 되었으며, 이는 AI 비디오 기술 환경에 변화를 가져왔습니다.

이전 모델이 진정성 문제로 어려움을 겪었던 반면, Lumiere는 정적 키프레임보다는 동적 액션에 중점을 두어 차별화되었습니다. 이 접근 방식을 사용하면 더욱 자연스럽고 생생한 비디오 시퀀스가 가능하며, 특히 피부 질감 및 항공 장면과 같은 미세한 디테일에서 아티팩트를 줄일 수 있습니다.

Google의 텍스트-비디오 분야 진출은 멀티미디어 AI 개발에 대한 Google의 초점이 진화하고 있음을 반영합니다. Lumiere가 Runway 및 Pika와 같은 고급 비디오 생성기 대열에 합류할 준비가 되어 있는 가운데 Google은 AI 기반 비디오 제작의 미래를 형성하는 데 있어 자신의 능력을 입증하고 있습니다.

텍스트-비디오 기능 외에도 Lumiere는 이미지-비디오 생성, 스타일화된 비디오 생성, 영화 클립 및 사용자 정의 가능한 편집 옵션을 위한 인라인 드로잉과 같은 다양한 애플리케이션에 대한 문을 열어줍니다. 그러나 Google은 가짜 콘텐츠나 악의적인 콘텐츠가 생성되지 않도록 보호 장치가 필요하다는 점을 인식하여 남용 가능성에 대해 계속 경계하고 있습니다.

READ Google Cloud Next: 2024년 회사의 첫 번째 AI 이벤트에서 발표된 5가지 주요 작업공간

결론적으로 Google의 Lumiere는 가상 현실과 현실 사이의 격차를 해소하는 AI 비디오 제작의 주요 발전을 나타냅니다. 최첨단 기술과 다양한 응용 프로그램은 책임 있는 사용과 윤리적 고려 사항에 대한 필요한 논의를 촉진하는 동시에 AI 기반 창의성의 지속적인 진화에 있어 이정표를 나타냅니다.

Jae-yoon Ryu

Jae-yoon Ryu는 Ulsanfocus.com의 필진으로, 국내외 주요 뉴스와 정치, 경제, 기술, 스포츠, 문화·연예, 라이프스타일 등 다양한 분야의 소식을 독자들에게 전달하고 있습니다. 정확하고 이해하기 쉬운 보도를 바탕으로 시의성 있는 이슈를 다루며, 독자들의 일상과 지역사회에 관련된 이야기를 균형 있게 전하는 데 집중합니다. 신뢰할 수 있는 정보와 유용한 관점을 제공하여 독자들이 현재의 흐름을 보다 쉽게 이해할 수 있도록 돕고 있습니다.

STUNet 기술은 Google의 Lumiere를 불쾌한 계곡 너머로 데려가 거의 사실적인 비디오를 제작할 수 있는 잠재력을 보여줍니다.

Leave a Reply Cancel reply