상세 컨텐츠

본문 제목

OpenAi의 동영상 생성 모델 'Sora' 출시일 및 가격은?

기타정보/IT정보

by 있슈이슈 2024. 4. 4. 16:17

본문

 

 

ChatGPT로 잘 알려진 OpenAI(오픈에이아이)가 이번에는 Sora(소라)라는 새로운 AI 모델을 출시할 예정이다. 일본어로 하늘이라는 의미의 Sora는 OpenAI에서 개발한 텍스트 기반 영상 생성 AI로 지난 2024년 2월 15일 공개되었으며 텍스트 및 이미지 입력으로 높은 품질의 영상을 제작할 수 있어 다양한 분야에서 활용될 전망이다.

 

OpenAI Sora(소라)로 제작한 영상

 

기존의 동영상을 만들어주는 AI가 길어야 20초를 넘지 않았고 영상 품질도 높지 않아 한계가 있었다면 이번에 OpenAI가 공개할 예정인 Sora는 이런 한계를 넘어설 예정이다. 챗지피티를 사용하듯 텍스트를 입력하면, 최대 1분 길이의 고화질 영상을 신속하게 만들어낸다.

 

OpenAI Sora 제작 영상

 

OpenAI가 소라의 강점으로 꼽은 부분은 이렇다. 여러 캐릭터와 특정 유형의 동작, 복잡한 장면 등 최대 1분 길이의 동영상을 빠르게 만들어낼 수 있다는 것이다. 또한 언어를 깊이 이해하고 있어 요구사항을 정확하게 해석하고 생생한 감정을 표현하는 매력적인 캐릭터를 생성할 수 있다고 전했다.

 

OpenAI Sora 제작 영상

 

개발팀은 “우리는 인공지능이 움직이는 물리적 세상을 이해하도록 가르쳐왔다”고 말하면서, Sora라는 뜻에 대해서는 일본어로 ‘하늘’을 의미하는 ‘소라’는 “무한한 창의성을 떠올리게 하기 위해서” 라는 의미임을 전하기도 했다.

 

OpenAI Sora 제작 영상

 

동영상 AI 'Sora'의 강점 

 

사용자 언어에 대한 탁월한 이해력을 바탕으로 하기 때문에 프롬프트 내용을 그대로 구현할 수 있다. 최대 1분의 영상이 구현 가능하며, 프레임 변환 시 캐릭터, 오브젝트 등의 일관성을 유지, 시각 데이터의 노이즈 제거하여 깨끗하고 자연스러운 장면 제공한다.

 

# 탁월한 프롬프트 이해력

 

OpenAI의 이미지 생성 AI 서비스인 달리3의 기술을 적용하여 언어 이해력이 뛰어나므로 먼저 사용자의 명령을 잘 이해할 수 있으며 프롬프트가 길면 길수록 그것을 캡션으로 변환하고 동영상 모델에 적용하는데 탁월해진다.

 

# 최대 1분의 영상 구현

 

현재 서비스 되고 있는 다른 동영상 생성 AI들의 경우 불과 몇 초정도의 동영상을 만들어낼 수 있는 반면, Sora는 최대 1분의 동영상을 생성할 수 있다. Sora보다 약 한 달 앞서 출시되었던 구글의 ‘루미에르’ 의 경우 10초 이내의 영상만을 만들어낼 수 있다.

 

OpenAI Sora 제작 영상


# 일관성 유지

 

AI로 영상을 만드려는 사람들이라면 누구나 중요하게 생각하는 부분은 바로 영상의 일관성일 것이다. AI 업계 역시 마찬가지인데 영상 속 캐릭터, 오브젝트, 배경이 프레임 간에 일관성을 유지하면서 변형되거나 뒤틀리는 현상이 발생해서는 안된다.

 

기존 AI 영상생성 모델들은 일반적으로는 영상의 시작과 끝 프레임을 생성한 후, 중간 부분을 짜 맞추는 식으로 동영상을 생성하기 때문에 전체적인 일관성을 구현하기 어려웠다. 하지만 Sora의 경우 이러한 문제들을 깨끗이 해결해 일관성을 유지할 수 있는 것으로 알려져있다.

 

# 영상 노이즈 제거


OpenAI가 홈페이지에 공개한 Sora의 훈련 과정을 살펴보면 시각 데이터를 '패치'라는 작은 단위로 쪼개는 작업을 수행하는 것을 볼 수 있다. 이렇게 시각 데이터를 작은 단위로 나누게 되면 다양한 데이터들을 보다 효율적으로 학습할 수 있게 된다.

이 과정에서 Sora는 영상의 노이즈를 제거할 수 있는데 노이즈가 있는 패치를 입력받았을 때 노이즈를 자체적으로 제거해가는 훈련 과정을 거치게 된다. 그리고 이 과정을 여러 번 거쳐 패치를 깨끗하게 만든다. 이 때문에 Sora의 동영상이 깨끗하고 자연스럽게 된다.

 

OpenAI Sora 제작 영상

 

정식 출시일은?

 

현재 OpenAI가 밝힌 Sora의 출시 계획은 2024년 말에 일반 대중에게 정식 출시하는 것이다. 지난 3월 오픈AI 개발팀은 인터뷰를 통해 정식 출시에 대해 "올해, 또는 몇 달 후 일반 사용자들이 소라를 이용할 수 있을 것" 이라고 전하면서 올 해 안에 일반 사용자들도 소라를 이용할 수 있을 전망이다. 소라는 현재 오픈AI가 허용한 일부 창작자만 사용 가능하다.

Sora의 일반 공개가 지연되는 이유 중 하나는 비용으로 볼 수 있다. 개발팀은 "소라는 다른 AI 도구보다 구동에 훨씬 더 큰 비용이 든다" 고 말하면서 "이미지 생성 AI인 달리(DALL-E)와 비슷한 비용으로 사용할 수 있도록 만기 위해 노력 중" 이라고 전한 바 있다. 


따라서 현재 OpenAI가 Sora를 대중에게 사용하는 데 얼마의 비용을 청구할 것인지에 대해서는 알려진 바가 없지만 달리(DALL-E)와 비슷한 가격으로 책정될 것으로 추측되며, 덧붙인 내용에 따르면 Sora가 OpenAI의 성능과 지원 측면에서 훨씬 더 비싸다고 전한 것으로 보아 조금 더 높은 가격으로 책정될 전망이다.

 

이 밖에도 안전성에 대한 전문적인 점검도 필요한데, 올해 미국과 한국을 비롯해 세계 각지에서 대선·총선이 이어지며 AI가 선거에 악영향을 끼칠 수 있다는 우려가 대두되고 있는 만큼 오픈에이아이를 비롯한 생성형 AI 개발사들은 AI의 정치적 활용을 막기 위한 노력을 지속하고 있다.

 

OpanAI 개발진은 "소라가 일반 출시되면 기존 달리 정책과 마찬가지로 공인의 이미지는 생성할 수 없을 것" 이라고 전하며 "동영상에는 실제와 구별하기 위한 워터마크를 남길 계획"이라고 전했다.

또한 향후 Sora 개발 계획에 대해서도 동영상을 더욱 사실적으로 만들기 위해 영상과 음향을 통합하는 한편, 명령어로 생성된 결과물을 받아볼 수만 있는 현 방식에서 한 발 더 나아가 소라가 만들어낸 콘텐츠를 각 사용자가 편집할 수 있도록 하는 방안도 고려 중인 것으로 알려졌다.

'기타정보 > IT정보' 카테고리의 다른 글

유튜브 프리미엄 1080p 화질 재생 옵션 지원  (0) 2023.04.14

관련글 더보기

댓글 영역