2025년 5월 16일
Gemini API를 사용한 캐릭터 애니메이션의 차륜 튀기기

Gemini API를 사용한 캐릭터 애니메이션의 차륜 튀기기
Cartwheel은 차세대 애니메이션의 최전선에 있으며 자연어 입력 (예: 'jump', 'salsa dance spin') 캐릭터 액션을 지시합니다. 이 혁신은 크리에이터가 동영상, 게임, 광고, 소셜 미디어용 애니메이션을 제작하는 방식을 개선합니다. Cartwheel은 직관적인 텍스트 대 문자 디자인을 위해 Imagen 3를 통합하고 Gemini 2.5 Pro Preview를 활용하여 정교한 애니메이션 관련 알고리즘을 개발하고 복잡한 코드베이스를 탐색하며 플랫폼 최적화를 가속화하여 사용자가 창의적인 스토리텔링을 확장할 수 있도록 지원합니다.
생성형 3D 모션의 R&D 장벽 극복
최첨단 애니메이션 플랫폼을 개발하려면 사용자 친화적인 디자인 도구뿐만 아니라 백엔드 알고리즘과 효율적인 코드베이스 관리의 지속적인 혁신도 필요합니다. Cartwheel은 복잡한 애니메이션 기능을 빠르게 프로토타입으로 제작하고 구현하고, 성능을 위해 광범위한 코드베이스를 최적화하고, 개발자가 대규모 시스템을 빠르게 이해하고 기여할 수 있도록 하는 과제를 안고 있었습니다. 개발 작업을 한층 강화할 수 있는 강력한 AI 파트너가 필요했습니다.
Cartwheel에서 Imagen 3 및 Gemini 2.5 Pro 미리보기를 사용하는 방법
Cartwheel은 Gemini API를 사용하여 사용자 대상 제작 파이프라인을 개선하고 내부 개발 프로세스를 지원합니다.
- Imagen 3을 통한 AI 기반 캐릭터 구상: Cartwheel은 Imagen 3 텍스트 이미지 변환 기능을 통합하여 크리에이터가 텍스트 프롬프트를 사용하여 플랫폼 내에서 직접 캐릭터 개념을 구상하고 고유한 캐릭터 이미지를 생성할 수 있도록 지원합니다. 이러한 맞춤 설계 캐릭터는 자연어를 사용하여 애니메이션 처리한 후 완전히 리그를 적용하여 Maya 또는 Blender와 같은 업계 표준 3D 편집 소프트웨어에서 사용할 수 있도록 내보낼 수 있으므로 전문 프로덕션 환경에 통합할 수 있습니다.
-
Gemini 2.5 Pro 미리보기로 R&D 및 최적화 지원: Cartwheel팀은 엔지니어링 및 연구 워크플로를 지원하기 위해 Gemini 2.5 Pro 미리보기를 내부적으로 사용합니다.
- 알고리즘 개발: Gemini 2.5 Pro 미리보기는 데이터 합성용 모션 블러 알고리즘, 블렌딩용 라플라스 피라미드, 편집기 내 포즈 설정을 위한 자동 IK (역운동학)를 비롯한 애니메이션 관련 기능을 개발하는 데 사용됩니다.
- 코드 탐색 및 디버깅: 팀에서는 Gemini 2.5 Pro 미리보기를 사용하여 복잡한 코드베이스를 탐색하고, 새로운 실험에 대한 아이디어를 생성하며, 복잡한 카메라 회전 오류와 같은 특이 사례를 효율적으로 디버그하는 데 도움을 줍니다.
- 코드베이스 작업에 긴 컨텍스트 활용: Gemini 2.5 Pro 미리보기의 긴 컨텍스트 기능은 Cartwheel의 전체 코드베이스에서 작업하는 데 사용됩니다. 이를 통해 개발자는 예를 들어 프런트엔드와 같은 새 코드베이스를 컨텍스트로 가져와 기능을 추가하거나 시스템의 아키텍처 및 기능에 관한 대략적인 질문을 할 수 있습니다.
애니메이션 워크플로 강화
Cartwheel은 Gemini 2.5 Pro 미리보기를 사용하여 알고리즘 개발, 코드 탐색, 디버깅을 지원함으로써 개발 프로세스를 개선하고 플랫폼 최적화를 가속화하는 것을 목표로 합니다. Imagen 3을 통합하면 사용자가 텍스트에서 캐릭터 시각 자료를 간소화된 방식으로 생성할 수 있으며, Gemini 2.5 Pro Preview는 개발자가 기본 기술을 빌드하는 데 도움이 되는 도구 역할을 합니다. 이러한 통합은 애니메이션 워크플로를 더 빠르고 쉽게 이용할 수 있도록 하는 Cartwheel의 목표를 지원하여 다음과 같은 사용을 가능하게 합니다.
- 게임 및 동영상의 애셋 제작 속도를 높여 팀이 핵심 디자인에 집중할 수 있습니다.
- 효율적인 마케팅 및 소셜 미디어 콘텐츠 생성 지원
“애니메이션은 머릿속의 이야기를 전 세계에 알리는 가장 순수한 방법 중 하나입니다. Google은 모든 사용자가 더 쉽고 편리하게 이용할 수 있는 도구를 만들고 있습니다."
애니메이션의 미래 구축
Cartwheel에서 Imagen 3과 Gemini 2.5 Pro 프리뷰를 통합한 사례는 Google AI를 적용하여 새로운 사용자 대상 기능을 사용 설정하고 차세대 도구를 빌드하는 데 필요한 복잡한 개발 작업을 지원하는 방법을 보여줍니다.
Gemini API 문서를 살펴보고, Imagen 3에 관해 알아보고, Google AI 스튜디오에서 시작해 보세요.
Cartwheel은 AI의 미래를 만들어가는 야심 찬 스타트업에 투자하고 협력하는 Google의 AI Futures Fund에 참여하고 있습니다.