NVIDIAは、AIオープンモデルの新世代となる「Nemotron 3」ファミリーを発表した。複雑なタスクを処理するAIエージェントの開発に最適化されており、通信や推論のコストなど従来のAI活用における課題を解決する。
NVIDIAは2025年12月15日(現地時間)、AI(人工知能)オープンモデルの新世代となる「Nemotron 3」ファミリーを発表した。複数のAIが協調して複雑なタスクを処理するAIエージェントの開発に最適化されており、通信や推論のコストなど従来のAI活用における課題を解決する。
Nemotron 3は、画期的なMoE(Mixture-of-Experts)アーキテクチャを採用することで、優れた効率性と拡張性を誇る。トークンスループットが前世代品の「Nemotron 2 Nano」と比較して最大4倍となったことで、推論トークン生成を最大60%削減できるため、推論コストを大幅に抑えられる。
また、モデルの内部構造が透明性の高いオープンな仕様となっており、開発者は特定の業務や用途に合わせて柔軟にカスタマイズできる。これにより、企業独自のデータを活用した信頼性の高いAIエージェントの構築を支援する。
Nemotron 3のMoEモデルは、3サイズを展開する。「Nemotron 3 Nano」は、300億パラメーターを持つ小型モデルで、最大で30億パラメーターをアクティブ化し、効率よくタスクを実行する。
「Nemotron 3 Super」はマルチエージェントアプリケーションに適したモデルで、パラメーターは約1000億。トークン当たり最大100億パラメーターがアクティブになる高精度な推論モデルだ。
「Nemotron 3 Ultra」は、パラメーターが約5000億で、トークン当たり最大500億パラメーターがアクティブになる大規模推論エンジン。高精度なAIアプリケーションに向いている。なお、Nemotron 3 SuperとUltraは2026年上半期から提供開始となる。
また、同社は高度なドメイン特化型AIエージェントの構築を支援するためのツールとして、データセットと開発用ライブラリを公開した。3兆トークンに及ぶNemotronデータセットにより、推論やコーディング、複雑なワークフローの学習が可能になる。また、「Agentic Safety Dataset」により、実環境での安全性を強化できる。
開発、検証ツールとして、オープンソースのライブラリ「NeMo Gym」「NeMo RL」でトレーニング環境を提供。「NeMo Evaluator」ではモデルの性能と安全性を検証できる。全てのツールとデータセットは、GitHubとHugging Faceで公開されている。
また、Nemotron 3ファミリーはLM Studio、vLLMなどの主要な推論エンジンや、Prime Intellectといったトレーニング環境と統合することで、強化学習を容易に利用できる。Hugging FaceやOpenRouterなどの推論プロバイダーを通じて即座に利用できるほか、UiPathなどのエンタープライズ向けプラットフォームやAWSといった主要クラウドでも利用可能だ。Google CloudやCoreWeaveなどにも近日中に対応する。
NVIDIAがフィジカルAIのオープン展開を加速、自動運転向けで「Alpamayo」を公開
NVIDIAが生み出す半導体産業の“正の循環”、AIフィジックスが新たな原動力に
800VDCに対応する次世代AIファクトリーの構築を推進、NVIDIA「Vera Rubin」向け
NVIDIAがロボットシミュレーション用物理モデル「Newton」のβ版を公開
ヒューマノイドロボット開発向け基盤モデルとデータ生成ツールを発表
NVIDIAがフィジカルAI向けの生成AIモデルとブループリントを発表Copyright © ITmedia, Inc. All Rights Reserved.
組み込み開発の記事ランキング
コーナーリンク