[Winter Blog Challenge] 텍스트만 입력하면 영화가 뚝딱? 구글 비오(Veo)를 만나다 (Team Member 김찬진)

GDG on Campus: SSWU 6th/Winter Blog Challenge

[Winter Blog Challenge] 텍스트만 입력하면 영화가 뚝딱? 구글 비오(Veo)를 만나다 (Team Member 김찬진)

gdgoc-sswu 2025. 3. 7. 04:26

안녕하세요 GDG on Campus: SSWU Core Member 김찬진 입니다~

요즘 생성형 AI가 정말 화제죠? 텍스트 몇 줄로 그림은 물론이고 이제는 동영상까지 만들어주는 시대가 열렸습니다. 오늘은 이 분야의 새로운 강자로 떠오른 구글 딥마인드(Google DeepMind)의 비오 2(Veo 2)를 소개해드리겠습니다!

https://www.youtube.com/watch?v=G9RDHs9nx04

https://deepmind.google/technologies/veo/veo-2/

Veo 2

Veo is our state-of-the-art video generation model. It creates high quality video clips that match the style and content of a user's prompts, in resolutions up to 4K resolution.

deepmind.google

"AI로 동영상을 만든다"라는 말, 이제는 더 이상 영화 속 이야기가 아닙니다. 구글이 선보인 비오 2는 텍스트, 비오 2(Veo 2)가 생성한 이미지를 HD급 고품질 영상을 생성할 수 있는 최첨단 AI입니다.

비오 2, 얼마나 특별할까?

AI 업계에서는 이미 오픈AI의 소라(Sora)와 구글의 비오 2가 비교 대상에 오르며 화제가 되고 있습니다.

저스틴 무어(앤드리슨 호로비츠 파트너)는 “소라는 동작 표현에 편향된 반면, 비오 2는 물리적 현실성과 정확성이 뛰어나다”고 평가했는데요.

그렇다면, 비오 2가 얼마나 대단한지 살짝 들여다볼까요?

https://www.youtube.com/watch?v=UL8SF-hthEE

Prompt: A cinematic, high-action tracking shot follows an incredibly cute dachshund wearing swimming goggles as it leaps into a crystal-clear pool. The camera plunges underwater with the dog, capturing the joyful moment of submersion and the ensuing flurry of paddling with adorable little paws. Sunlight filters through the water, illuminating the dachshund's sleek, wet fur and highlighting the determined expression on its face. The shot is filled with the vibrant blues and greens of the pool water, creating a dynamic and visually stunning sequence that captures the pure joy and energy of the swimming dachshund.
수영 고글을 쓴 사랑스러운 닥스훈트가 맑은 풀장으로 뛰어드는 역동적인 영화 같은 장면. 카메라는 닥스훈트를 따라가며 물속으로 함께 잠수하며, 작은 발로 물을 저으며 즐겁게 수영하는 모습을 포착합니다. 햇빛이 물을 통해 비치며 닥스훈트의 매끈한 젖은 털과 집중하는 표정을 강조하고, 풀장의 생동감 넘치는 파란색과 초록색이 어우러져 시각적으로 아름다운 장면을 연출합니다. 이 장면은 닥스훈트의 순수한 즐거움과 에너지를 생생하게 담아냅니다.

위와 같은 프롬프트를 입력하였을 때 VEO 2가 제작한 영상입니다. 정말 자연스럽지 않나요?

비오 2의 강력한 기능

1. 텍스트 기반 고화질 동영상 생성

비오 2는 텍스트 몇 줄만 입력하면 4K 해상도의 2분 이상 되는 비디오를 생성할 수 있습니다.

2. 물리적 현실성 강화

구글 딥마인드는 비오 2에 물리 법칙을 반영한 모델을 적용해, 사람, 동물, 사물의 움직임이 훨씬 자연스럽게 표현되도록 했습니다.

이는 기존 AI가 가진 ‘기괴한 움직임’ 문제를 대폭 개선한 부분으로 평가받고 있습니다.

3. 창의적 제어와 다양한 스타일

비오 2는 사실적 영상뿐만 아니라 애니메이션 스타일이나 초현실적 장면까지 다양한 영상 스타일을 구현할 수 있습니다.

사용자는 "타임랩스", "공중 촬영" 등 카메라 효과와 시네마틱 무드를 직접 설정할 수도 있습니다.

https://www.youtube.com/watch?v=gztv6XYUzTM

4. 사용자 프롬프트에 딱 맞는 결과물

구글 자체에서 테스트한 것에 따르면, 비오 2가 사용자가 입력한 프롬프트를 충실히 따라준다고 합니다.

https://www.youtube.com/watch?v=DkJ9e8T7zFU

영상의 더보기란에 프롬프트를 확인할 수 있습니다.

비오 2가 사용한 구글의 주요 핵심 AI 기술

GQN(Generative Query Network): 영상 장면의 구성을 일관성 있게 렌더링
DVD-GAN: 부드럽고 자연스러운 프레임 전환 구현
비디오포이엇(VideoPoet): 트랜스포머 아키텍처를 기반으로, 더 정확한 텍스트-영상 변환 지원
루미에르(Lumiere): 시공간 U-넷(U-Net) 구조를 활용해 전체 영상을 한 번에 생성, 처리 속도 개선

한계점

현재는 대중들을 상대로 공개하지 않아, 구글의 AI 영상 모델 Veo2에 베타 테스터로 선정된 영상을 보면, 수많은 장점들도 소개하고 있지만 한계들도 소개하고 있습니다.

https://www.youtube.com/watch?v=Eyj-i0euL9M

외부의 이미지를 활용할 수 있는 기능이 아직 존재하지 않는다고 합니다.
커스터마이징 즉 사용자가 원하는대로 제작이 어렵다고 합니다.
사람의 움직임에는 아직 오류가 많다고 합니다.
캐릭터의 일관성이 부족하다고 합니다.
일관성이 부족하면 상업적인 용도로 사용하기엔 부족하겠죠?

현재 가장 독보적인 구글의 비오 2(Veo2)는 단순히 영상 생성 기술을 넘어, 영화 제작의 새로운 도구로 자리 잡을 가능성을 보여줍니다.

텍스트 프롬프트 몇 줄만으로 고화질 영상을 생성하고, 다양한 영화적 연출을 적용할 수 있는 비오 2는 영상 제작의 시간과 비용을 획기적으로 절감하는 기술입니다.

앞으로 구글 비오 2가 대중화되면서 누구나 크리에이터가 되는 시대가 열릴 수 있을지, 그리고 이 기술이 영화, 교육, 마케팅 산업에 얼마나 큰 변화를 가져올지 기대해 봅니다.

저작자표시 비영리 동일조건 (새창열림)

'GDG on Campus: SSWU 6th > Winter Blog Challenge' 카테고리의 다른 글

[Winter Blog Challenge] 웹 API (Chapter Member 이하경) (0)	2025.03.27
[Winter Blog Challenge] SQL vs. NoSQL (Chapter Member 김예린) (0)	2025.03.07
[Winter Blog Challenge] SQL과 NoSQL 비교 (Chapter Member 신지예) (0)	2025.02.28
[Winter Blog Challenge] 최신 딥러닝 기술의 혁신을 이끈 Transformer 모델 (Chapter Member 김승연) (0)	2025.02.27
[Winter Blog Challenge] AI가 코드를 이해하는 법: 코드 생성 모델의 원리 (Chapter Member 신연주) (0)	2025.02.27

현재글[Winter Blog Challenge] 텍스트만 입력하면 영화가 뚝딱? 구글 비오(Veo)를 만나다 (Team Member 김찬진)

gdgoc-sswu 님의 블로그

gdgoc-sswu 님의 블로그 입니다.

Today :
Yesterday :

일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28

gdgoc-sswu 님의 블로그