イーロン・マスク(Elon Musk)氏は、グーグル社(Alphabet Inc.)(NASDAQ:GOOG0)(NASDAQ:GOOGL)が新しいAIビデオツール「Veo 2」を発表したことを受けて、この技術に対して賞賛の意を表明しました。 この新製品は、OpenAIのSoraとの競争的な展開に入りました。
出来事の内実:月曜日、グーグルは最新のAIビデオツール「Veo 2」と、強化された画像モデル「Imagen 3」を発表しました。
Veo 2は、最大4K解像度、長い動画、浅い被写界深度、特定のレンズタイプなどが可能な機能を誇っています。
同社CEOのサンダー・ピチャイ(Sundar Pichai)氏は、Veo 2によって生成された動画を、元々のTwitter(現X)上で披露し、その可能性を実証しました。
関連記事
ピチャイ氏に対して返信したマスク氏は、このモデルによって生成された動画について、「これは印象的ですね」と述べています。
マスク氏は、投資家のジェイソン・カラカニス(Jason Calacanis)氏の投稿も共有しました。カラカニス氏は、グーグルのジェミニ(Google’s Gemini)とxAIのグロック(xAI’s Grok)モデルの両方が、OpenAIの「ChatGPT」よりも「同等で、場合によってははるかに優れている」と述べています。
カラカニス氏は、この1か月で、ジェミニ、グロック、そしてChatGPTの3つのモデルの使用法が大きく変わったことに言及し、グーグルのツールが以前の90%から50%以上のクエリを処理するようになったと述べ、以前のChatGPTが90%を占めていたときと比べてかなり減ったことを明らかにしました。
カラカニス氏は、「もはやデータとUIのゲームになった。そして私は、OpenAIがデータを持っていないことをReddit、X/Twitter、そしてGoogleのデータセットで圧倒すると思います」と述べました。
彼の発言は、グーグルのデータ上の利点と先端的なAIツールが、まもなくいくつかの重要な分野でOpenAIを追い越すという考えの拡大を象徴しています。
最新の状況
重要なポイント:以前、マーク・アンドリーセン氏は、ロボティクスの重要な課題に取り組むOpenAIのビデオモデル「Sora」に対して賞賛を送っていました。
このモデルの特長について、アンドリーセン氏はテキスト入力から3Dリアルなビデオを生成する能力を強調し、これによって実世界のナビゲーションに不可欠な照明や反射などの複雑な要素が実質的にシミュレートされていると述べています。
ただし、OpenAIのSoraに限らず、グーグルの最新モデルは他社の製品とも競合しています。
今年の早い時期、アマゾン・ドット・コム(Amazon.com Inc.)(NASDAQ:AMZN)は広告主向けのAI駆動型ビデオツールを発表し、Adobe(NASDAQ:ADBE)の「Firefly」ビデオモデルとともに市場に参入しました。
2024年10月、Meta Platforms Inc.(META)は、テキストプロンプトから動画、画像、音声を作成することを目的とした新しいツールである「Movie Gen」を発表しました。
次に読むべきは:
- 免責事項
免責事項: この記事のコンテンツは、Benzinga Neuroの協力を得て一部が制作され、その後ベンジンガの編集者によって検討され、公開されたものです。
画像提供:Shutterstock