Altera 社、GPT‑4o で人間の繋がりの新分野を実現

Robert Yang 博士は、脳をもとにした AI の構築に半生をかけてきました。
OpenAI の言語モデルが広く利用されるようになった2023年、Yang 博士は MIT 助教授の職を辞して Altera.AL(新しいウィンドウで開く) を立ち上げました。人間の基本的な性質を有するエージェントと人が対話する新しい方法、名付けて「デジタルヒューマン」の構築を目指す研究所です。
現在 Altera 社の CEO を務める Yang 博士は、AI エージェントが単にアシスタントになるだけでなく、近く人と対話、連携し、さらには感情を持つようになる未来を描いています。共同設立者である Andrew Ahn 博士、Nico Christie 氏、Shuying Luo 氏の3人と共に、Yang 博士は GPT‑4o を使って Altera 社初の製品を開発しました。まるで友達のように一緒に『マインクラフト』をプレイできる(新しいウィンドウで開く)初の自律型エージェントです。

自動化(オートメーション)が反復作業をサポートすることで人間の能力を向上させるのと同じく、デジタルヒューマンは人と生産的に繋がり、さらには絆を形成できると Altera 社のチームは考えています。描いているビジョンはこのようなものです。
- 何日、何週間と協働して積極的に問題を解決するデジタルの「同僚」
- 経済政策や広告などに対する反応を測定できる、長期のマルチエージェントの世界
そのような中、Altera 社が構築に着手したところで独自の課題にぶつかりました。最も急を要したのは、データの劣化という現象でした。長期間にわたって自律的な判断を行う全ての AI モデルが直面する問題です。
Yang 博士は説明します。「AI エージェントは世界と対話し、リアルタイムで意思決定を行いますが、自身が出力したものを後に入力することになるため、徐々にデータの質が低下していきます。これはほとんどの AI エージェントシステムに発生する問題ですが、数時間以上にわたって自律する当社のデジタルヒューマンにとっては、解決すべき最も差し迫った問題の一つとなります。」

データ劣化を解決し、AI エージェントの長期的な自律性を高めるべく、Altera 社が OpenAI の言語モデルを採用したところ、これが意思決定プロセスの整合性を維持する上で核心的な役割を果たしました。
OpenAI の高度なモデルにより、Altera 社はまるで友達のように人と一緒にゲームをする初の AI エージェントを構築できたのです。これらのエージェントは、エージェントの潜在能力に制約を生んでいた性能の急激な低下がなく、より長く複雑な対話を実現します。
Altera 社は、OpenAI の GPT モデルと、前頭前皮質など人間の脳の構造を再現した同社の並列マルチモジュールシステムを組み合わせることで、認知機能をシミュレートできるエージェントを作成しました。Yang 博士は述べます。「当社の複合システムは、それぞれ OpenAI のモデルによって駆動される様々なモジュールを並列に組み合わせています。これらのモジュールは、注意のボトルネック、ワーキングメモリ、社会的認知といった脳の機能をもとにしています。」
「これでエージェントはより迅速に思考し、感情を処理し、最終的には長期的な自我の感覚を構築できます。」
Altera 社は、OpenAI を搭載したデジタルヒューマンがより高い安定性を示し、複雑なタスクをより効果的に処理できることを観測しました。安価なモデルを使用した場合でも、OpenAI は市場の他社製品と比べて優れた性能を発揮しました。
2024年半ばの時点で、Altera 社のデジタルヒューマンは一度に最長4時間まで自律的に動作できます。市場の他者製 AI モデルと比較して大幅な増加です。
Long-term Benchmark: Distinct Item Collection in Minecraft
Altera 社のビジョンの初期段階における成功は、『マインクラフト』のような仮想環境で遊び、対話できるデジタルヒューマンという初の製品について、特に広い関心を集めました。また、これは将来のより複雑なマルチエージェントシミュレーションの基礎も築くものです。
Altera 社は、ゲームや生産性向上など多くの応用例に対応し、繊細で長期的な対話が可能なデジタルヒューマンの社会を創造するべく、その取り組みを拡大する計画です。OpenAI と連携した Altera 社は、考えさせられる形でデジタルと人の生活が交差する世界の創造をリードする立場にあります。

