グーグル(NASDAQ:GOOGL )は、単一の画像プロンプトから完全に相互作用可能な3Dゲームワールドを生成することができる、AIツール「Genie 2」を導入しました。
この技術は、「ワールドモデル」と称され、ビデオゲームのプロトタイプから幅広いAI研究に至るまで、幅広い応用が期待されています。
Genie 2は、2Dの世界を作成することに限られていた前身のGenie 1をさらに進化させるもので、この新しいイテレーションにより、ユーザーはダイナミックな視点、物理シミュレーション、相互作用を伴う3D環境を生成することができます。特筆すべき点は、ジャンプや水泳のようなユーザーの行動を取り込んでいる点です。
なお、実世界の画像を含む画像プロンプトを使用することも可能です。
Genie 2の仕組み
このプロセスは、多くの場合、Googleのテキストから画像へ変換するAIツールであるImagen 3を介して作成された画像プロンプトから始まりますが、実世界の画像もサポートされています。
プロンプトが入力されると、Genie 2がユーザーが移動して探索し、相互作用できる環境が生成されます。
主な特長は以下のとおりです。
- ダイナミックな物理シミュレーション:水、重力、その他の環境要素のリアルなシミュレーション。
- 照明と反射:リアルな照明を再現するための高度なレンダリング技術。
- NPCとの相互作用:応答性のある自動生成型のNPC。
- リアルタイムのコンテンツ更新:ユーザーが探索するにつれて適応し続ける、継続的なワールド生成。
生成されたワールドは、AIがコントロール入力やカメラの動きに適応し、その場で新しい信憑性のあるコンテンツを作成することが可能で、1分間のゲームプレイを許容します。
迅速なプロトタイプ作成のためのツール
同社のブログ投稿によると、このツールは「環境設計のためのクリエイティブプロセスをブーストでき、さらに研究を加速化できる」としています。
ゲーム開発者にとっては、仮想環境を設計してテストするために必要な時間を減らすことができるということです。
同社はブログ投稿の中で「Genie 2は、多様な3D環境を作成し、エージェント研究の加速化を実現する基本的なワールドモデルのポテンシャルを示しています… 」と述べています。同社はブログ投稿の中でこのように語っています。「SIMAと同様、当社の研究は、より汎用的なAIシステムと、幅広いタスクを理解して安全に実行できるエージェントに向けて構築されています」と同社は述べています。
クリエイティブ産業におけるAIの倫理的な考察は未だ多くの点で議論の的となっており、ゲームなどでの利用に関しても、脚本執筆、声優業、環境デザインなどの仕事への潜在的な影響についての懸念が生じる要因であるとされています。
次に読むべきはこちら:
画像提供:シャッターストック