Nvidia Corp (NASDAQ:NVDA)は、Fugattoという画期的な生成AIモデルを披露した。このモデルは、テキストと音声プロンプトを使用して音を作成したり変更したりするための多目的ツールとして設計されている。Fugattoは音楽、声、音風景のミックスを生成し、変換することができ、これによりミュージシャン、開発者、コンテンツクリエーターにとって前代未聞の機能が提供されることとなる。
ちなみに読んでみて: DirecTV、EchoStarの買収契約を解消
Fugattoは、Foundational Generative Audio Transformer Opus 1の略で、新しい音楽を生成したり、声のアクセントや感情を変えたり、まったく新しい音風景を作成したりするなどの複数のタスクをサポートしている。これらの機能は、オーディオAIの技術革新における重要な進歩と言えるだろう。
Fugattoは、ユーザーがさまざまな指示とプロンプトを組み合わせてオーディオを作成できるようにする。例えば、鳴き声をする犬を模したトランペットの音を再現したり、特定のアクセントとトーンを持つ声を生成することができる。
音楽の世界を超えて、Fugattoは広告、教育、ゲームの分野で新たな可能性を開いている。広告主は地域の視聴者向けにキャンペーンのナレーションを調整することができ、教育者は学習者にとってよく知られた声でコンテンツを個人化することができる。ゲーム開発者は、ゲームプレイに基づいて、オーディオアセットを変更したり、動的に生成したりすることができる。
2.5兆のパラメータを持つ生成トランスフォーマーによって動作するFugattoは、Nvidia DGXシステム上で構築され、32 H100 Tensor Core GPUを搭載している。このモデルの開発には、多国籍のチームが関与し、その多言語および多アクセントの機能が強化された。モデルのトレーニングには何百万もの音声サンプルが使用され、複雑で多様なタスクが可能になるよう、慎重に展開されたのだ。
Fugattoの登場は、生成AIの大きな節目を示し、プロフェッショナルが音との関わり方を根本的に変えるものとなるだろう。
このモデルによって、アクセント、トーン、感情などの要素を一つのつながりのある音に組み合わせることができる。例えば、これを使用することで、雷鳴から穏やかな夜明けへと変わるダイナミックな音風景を作成することができるだろう。
Nvidiaの株は、今年の始めから186%急上昇している。
Nvidiaは先週、33.12百億ドルで売上高を記録と比較して94%伸びた、35.1百億ドルの第3四半期の売上高を発表した。
同社は1株当たり81セントのEPSを報告し、これは75セントというストリートのコンセンサス予想を上回った。Nvidiaは第4四半期の売上高が37.5百億ドルから2%増減の範囲内になることを見込んでいる。
アナリストたちは、2025年までの成長を促進する同社のBlackwellおよびHopper製品ラインによる堅調な需要によりAIおよびデータセンターテクノロジーでのNvidiaのリーダーシップを強調している。
投資家は、ProShares Ultra Semiconductors(NYSE:USD)とEA Series Trust Strive U.S. Semiconductor ETF(NYSE:SHOC)を通じてNvidiaに露出を得ることができる。
株価騰落情報 最終取引時点で、Nvda株は2.7%安の1株138.12ドルで取引中。
以下も読んでみて:
写真提供:Shutterstock