Googleが動画生成AI「Veo(ベオ)」発表!機能・早期アクセスまるっと紹介!

ベンチ (mohero Presents new song)

Google社が新たに60秒以上の動画を生成するAI「Veo(ベオ)」を発表しました!

そのクオリティの高さからSNS上でも非常に注目を集めています!

<Veoの公開されているSample動画>

<Google DeepMind Veo公式ページ>

Google DeepMind
Veo Veo is our most capable video generation model to date. It generates high-quality, 1080p resolution videos that can go beyond a minute, in a wide range of cinem...

<Veo特徴まとめ>

■Text to Video で60秒以上の動画を生成!画像を参照させる機能有り!

■フルHD(1080p)の映像を生成可能! ※一般的なテレビと同等。

■映像を編集できる!特定の部分だけ編集するマスク機能も実装予定!

■将来的にYoutubeショートでも導入予定。

■Veoで生成された動画にはAI生成物である事が判別できる電子透かし「SynthID」が導入される。

2024年5月現在 一般公開はされていません!早期アクセスのウェイトリストは「米国に拠点を置く 18 歳以上のユーザー」限定に公募されています。

目次

Veoの特徴

Text to Videoで60秒以上の動画生成に対応!

1分の動画って何が凄いの?って動画生成AIをまだ使った事がない方には思われてしまいそうですね。

昨今、何かと世間を賑わすAIにおいても動画生成の分野はまだまだ発展途上で、既存のツールだと生成できる動画は約16秒位が最大値になります。

更に動画が破綻(人が崩れる、映像がグチャグチャになる)なく生成できるのは長くても4~5秒が限界でしょう。

つまり動画生成AIは今「長い尺の動画を如何に破綻なく生成できるか?」の開発にかなり注力されている状況であると私は認識しております。

2024年2月に発表されたOpenAIの動画生成AI「Sora」でも最長1分までの動画生成が可能として話題になりましたが、Google社のVeoもこちらに対抗してきたような形になっております。

<Veoで生成された60秒の動画サンプル>

動画プロンプト:

明るいネオンサイン、空の宇宙船、夜、立体的な照明を備えた未来的なディストピアの広がりを通る高速追跡ショット。最高速度、光の速度、映画のような、信じられないほどのディテール、立体的な照明で走行する車のネオン ホログラム。車はトンネルを出て、現実世界の都市香港に戻ります。

最後のトンネルを抜けた後のシートは凄く自然な街並みですね!

ここだけ見ると実際の映像と勘違いしてしまいそうです。

ちなみに画質はフルHD(1,080p)対応となるので、一般的なテレビと同等です!

動画の編集機能も実装

元となるビデオに対してTextで指示して編集できる機能が実装されるようです!

以下は左の元となる動画に対し、カヤックを追加した動画の例となります。

更に「マスク編集」もサポートされており、平たく言うと「この範囲だけこんな風に変更したい!」と言う細かい編集も実装される見込みです!

参照元として画像を利用できる (Image-3と組み合わせる)

VeoではText to Video(テキストから動画)だけではなく、参照元として画像も利用できます!

この機能自体は他の動画生成AIでも実装されているメジャーなものではございますが、Google社はVeoと合わせて画像生成AIの「Image-3」を発表しました!

Google DeepMind
Imagen 3 Imagen 3 is our highest quality text-to-image model, capable of generating images with even better detail, richer lighting and fewer distracting artifacts than ...

画像生成AIで最もクオリティが高いのは2024年5月段階では「Midjourney-v6」であると言われていますが、こちらと同レベルのツールになると期待されています。

どちらも公開されればVeoとImage-3を両方使って様々なクリエイティブな作品作りが出来そうですね!

個人的には「サバンナを歩く象のあみぐるみ」が好きです。

AI生成物である事が判別できる電子透かし「SynthID」が導入される

人間には知覚できない電子透かし「SynthID」を導入し、AIが生成した画像/動画/音楽であると識別できるようにするそうです。

「ディープフェイク」と呼ばれるAIで生成した偽のコンテンツで「詐欺」や「偽情報の拡散」等の社会的に悪影響を与える犯罪が増加してきているので、これに対する対策の一種ですね!

<SynthIDについてもっと詳しく見たい方はこちら>

Google DeepMind
SynthID SynthID watermarks and identifies AI-generated content by embedding digital watermarks directly into AI-generated images, audio, text or video.

Veo AIの一般公開はいつから?

2024年5月現在 一般公開はされていません!

今後、一般公開前には「選ばれた一部のクリエイター」が早期アクセスできるようになり、ツールのフィードバックを受ける予定です!

早期アクセスのウェイトリストは「Labs.Google」から「VIDEOFX」のページよりアクセスできます。

ただし、私が見た時は対象者は「米国に拠点を置く 18 歳以上のユーザー」に限定されていました。

あわせて読みたい
LABS.GOOGLE Labs.Google is Google’s home for the latest AI tools, technology and discourse.

Google Labsの公式Xアカウントはこちらから!

まとめ

最後までご覧になって頂きありがとうございます!

本日のポイント

<Veo特徴まとめ>

■Text to Video で60秒以上の動画を生成!画像を参照させる機能有り!

■フルHD(1080p)の映像を生成可能! ※一般的なテレビと同等。

■映像を編集できる!特定の部分だけ編集するマスク機能も実装予定!

■将来的にYoutubeショートでも導入予定。

■Veoで生成された動画にはAI生成物である事が判別できる電子透かし「SynthID」が導入される。

2024年5月現在 一般公開はされていません!早期アクセスのウェイトリストは「米国に拠点を置く 18 歳以上のユーザー」限定に公募されています。

後から見直したい方は是非、ブックマークに登録を頂けると幸いです。

オススメ記事

本ブログでは様々なAIツールに関する記事を公開させて頂いております。

良かったら他の記事もご覧になって頂けると幸いです。

あわせて読みたい
2024年最新版:生成AI種類まとめ!用途毎のおすすめツール紹介! 日々、様々な生成AIが世に進出してきていますが、種類が多すぎて情報を追いきれない!と感じていませんか? 2023年にテキスト生成AI ChatGPTのリリースから始まったとさ...
あわせて読みたい
実写と見分けがつかない!?OpenAIのSoraが動画生成AIの常識を覆す こんにちわ!もへろーです! 皆さん!Open AI が発表した動画生成AI..Soraの映像はもうご覧になられましたか?? まだ見てないよー!って方いらっしゃいましたら、まず...

What is モヘロー

主にAIやNFTに関する活用を紹介するブログを書いています。

Xで発信もしているので、良かったらフォロー頂けると嬉しいです。アカウントはこちらから!

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

コメント

コメントする

目次