OpenAIの共同設立者であるIlya Sutskever氏が、人工知能(AI)産業の未来を変える可能性のある深刻なデータ危機を警告している。
出来事:金曜日、バンクーバーで開催されたニューラル情報処理システム(NeurIPS)の会議でSutskever氏は、AI開発を支える重要なリソースが枯渇しつつあると警告し、Observerが報じたところ。
「データはAIの化石燃料だと思うんだ。私たちがデータの頂点に達した今後、新たなデータは得られなくなるだろう」とSutskever氏は会議で述べた。
この警告は、データへのアクセス制限が強まっている証拠が増えつつあるなかで発せられたと言える。データの由来に関する調査によると、2023年から2024年にかけてウェブサイトのオーナーがAI企業からの高品質データソースの25%および主要なAIデータセット全体の5%のアクセスをブロックしたという。
このデータの不足は、業界トップに変わる取り組みを迫られている。OpenAIのCEOであるSam Altman氏は、AIモデル自体によって生成された情報である「合成データ」を代替ソリューションとして提案した。同社はまた、新しいo1モデルを通じて強化された推論能力を模索中だ。
関連記事
なぜ重要か:データの不足は、最近のベンチャーキャピタルファームであるMETA(NASDAQ:META)、NVIDIA Corp(NASDAQ:NVDA)、Microsoft Corp(NASDAQ:MSFT)などの複数の企業が同じような技術的思考の天井に到達しているとの報告を受けて発せられたものである。
今年初めにOpenAIを退社し、Andreessen HorowitzやSequoia Capitalなどの投資家から10億ドルの資金援助を受けてSafe Superintelligenceを立ち上げたSutskever氏は、AIのデータ依存性を超えてAIが進化すると考えている。
「未来のAIシステムでは、制限されたデータからも事を理解し、混乱することはないだろう」とSutskever氏は述べた。なお、彼はこの発言について、どのようにしてAIがデータ依存性を超えるのか、それがいつ頃起きるのかを具体的には語っていない。
AIトレーニング用の多種多様な高品質データセットへのアクセスの難しさが増していることにより、OpenAI、Meta Platforms Inc(NASDAQ:META)、NVIDIA Corp(NASDAQ:NVDA)、Microsoft Corp(NASDAQ:MSFT)などの企業がデータスクレイピングの実践を採用するようになったが、それは物議を醸している。
たとえば、MicrosoftのLinkedInは最近、新たな利用規約を更新する前にAIモデルをトレーニングするためにユーザーデータを使用したとして非難を浴びた。
同様に、Metaはプライバシーに関する懸念が高まったため、欧州の公開されているソーシャルメディアの投稿を自社のLlama大規模言語モデルのトレーニングに使用しているが、このことにより法的な挑戦がなされている。
Nvidiaもまた、自社のAIシステムをトレーニングするためにYouTubeやNetflixから動画をスクレイピングしているが、その中には人気のあるテックYouTuberであるMarques Brownlee氏のものも含まれている。これらの企業は、自社の実践が著作権法に準拠していると主張しているが、明確な同意を得ることなくデータをスクレイピングすることの倫理的な意義については、業界全体で物議を醸している。
次の一手
画像提供:シャッターストック
免責事項:AIツールの使用により一部が製造されたコンテンツが含まれている可能性があります。これらのコンテンツは、Benzinga編集者によってレビューおよび公開されています。