企業のAI活用がチャットボットの試験導入から、業務プロセスに踏み込むエージェント型アプリケーションへと移りつつあります。こうした流れの中で Nutanix は、エージェント型AIアプリを構築・実行するためのフルスタックソリューション「Nutanix Agentic AI」を NVIDIA GTC 2026 で発表しました。本記事では、インフラエンジニアや運用担当者の視点から、その全体像と中核となる AI Gateway、NKP Metal、NetApp 連携を整理し、自社の基盤にどう関わるかを判断するための材料を提供します。
Nutanix Agentic AI とは何か
Nutanix Agentic AI は、企業やサービスプロバイダがエージェント型AIアプリを構築し実行するための、フルスタックのソリューションです。基盤となるのは同社の Nutanix Cloud Platform(NCP)で、オンプレミスやプライベートクラウドに加え、AWS、Microsoft Azure、Google Cloud といったパブリッククラウド上でも利用できる設計になっています。特定のロケーションに縛られず、データの所在やコンプライアンス要件に応じて配置を選べる点は、エンタープライズにとって重要な前提と言えます。
このソリューションは、コンピュート、ストレージ、ネットワーク、Kubernetes を統合したうえで、ベクトルデータベース、開発ツール、運用ツール、複数のAIモデルの展開・実行、そしてテナント分離によるマルチテナント運用までを束ねています。AIアプリの基盤に必要な構成要素を、個別に組み合わせるのではなく一体として提供する点が特徴です。さらに NVIDIA AI Enterprise と Agent Builder のレイヤーで統合されており、モデルの実行環境とエージェント構築の両面を支えます。
提供形態としては、GPU-aaS、Kubernetes-aaS、VM-aaS、Notebooks-aaS、VectorDB-aaS、Models-aaS といったサービス群が用意されます。サービスプロバイダ向けには、マルチテナントを束ねる基盤として Nutanix Service Provider Central(SP Central)が位置づけられています。自社利用に留まらず、複数の顧客やチームに対してAI基盤をサービスとして切り出す運用も想定されている構成です。

AI Gateway が担うモデルルーティングとガバナンス
Nutanix Agentic AI の一機能として位置づけられるのが AI Gateway です。これは複数のAIモデルに対応したルーティングを実行し、用途や目的、そしてコストに基づいて、利用するAIモデルを自動的に切り替える役割を担います。単一のモデルにすべての処理を任せるのではなく、リクエストの性質に応じて適切なモデルへ振り分けるという発想です。
将来的に提供が予定される機能として、プロンプトの内容を分析し、簡単な質問やタスクは小さく低コストなモデルへ、複雑な要求は高度なモデルへとルーティングする仕組みが挙げられています。これにより、回答の正確性を維持しつつ、トークン当たりのコストを削減することがねらいとされています。ここでは具体的な削減率は示されておらず、定量的な効果は現時点で確定していない点に留意が必要です。あくまで設計思想として、適材適所のモデル選択でコスト効率を高める方向性が示されている段階です。
運用視点で見ると、AI Gateway の本質はコストとガバナンスの統制にあります。エージェントの数が増えていくと、どのエージェントがどのモデルにアクセスし、どれだけのコストが発生しているのかが見えにくくなります。AI Gateway はその間に立ち、モデルとツールへのアクセスを一元的に統制する位置づけです。AIエージェントが社内に広がっていく局面で、無秩序な利用やコストの膨張を抑える管理点として機能することが期待されます。インフラ運用者にとっては、利用状況の可視化と統制をどこで実現するかという課題への一つの答えになり得ます。
NKP Metal が変えるベアメタル Kubernetes の設計
NKP Metal は、正式名称を Nutanix Kubernetes Platform Metal という、ベアメタル向けの Kubernetes 基盤です。従来の構成では、ベアメタルサーバー上にまずハイパーバイザを載せ、その上で Kubernetes を展開するのが一般的でした。NKP Metal はこのハイパーバイザの層を排除し、ベアメタル上に直接 Kubernetes を展開します。仮想化レイヤーを挟まないことで、ハイパーバイザのオーバーヘッドを削減できるという考え方です。
この構成が効果を発揮するのは、高密度かつ高性能が求められる用途です。具体的には、エッジに置かれる小規模なコンピュート環境や、高密度GPUに依存するAIトレーニングといったワークロードが挙げられています。仮想化によるリソースの目減りを避け、ハードウェアの性能をそのままワークロードに振り向けたい場面に向いた選択肢と言えます。AIトレーニングのようにGPUを限界まで使いたい用途では、わずかなオーバーヘッドの差が積み重なるため、こうした直接展開の価値は理解しやすいでしょう。
ストレージの選択肢としては、CSI を用いる方法と、ベアメタル向けの Cloud Native AOS を用いる方法が用意されています。既存の Kubernetes 運用に馴染みのある CSI を選ぶか、Nutanix のストレージ機能をベアメタル上で活かすかを、用途に応じて選択できる形です。なお NKP Metal は現在アーリーアクセスの段階で、NKP Pro および Ultimate の利用者に向けて提供されています。一般提供(GA)は2026年後半が予定されており、本番投入の計画はこの提供時期を踏まえて検討する必要があります。

NetApp 連携と既存ストレージ資産の活用
もう一つの注目点が、Nutanix と NetApp の戦略的アライアンスです。これは NetApp の Intelligent Data Infrastructure、すなわち ONTAP を基盤とするデータ基盤を、NCP および AHV と統合するものです。具体的には、AHV と NCP が NetApp ONTAP をサポートする計画で、対象には NetApp AFF オールフラッシュと FAS ハイブリッドフラッシュが含まれます。これは Nutanix の外部ストレージ対応を拡張する動きであり、提供時期は2026年後半とされています。
既存のインフラ資産という観点では、この連携は実務上の意味が大きいと考えられます。すでに NetApp のオールフラッシュやハイブリッドフラッシュを運用している企業にとって、それらのストレージ資産を活かしながら Nutanix の基盤へ寄せていく道筋が用意されるためです。加えて、Cisco のコンピュートとネットワーク、NetApp のストレージ、そして Nutanix のソフトウェアを組み合わせた FlexPod コンバージドインフラも、2026年後半に提供される予定です。検証済みの組み合わせとして導入を進めたい現場には、選択肢が増えることになります。
移行については、NetApp Shift Toolkit と Nutanix Move を活用する想定が示されています。既存のハイパーバイザから AHV へ、データを保持したまま短時間で変換するという流れです。仮想化基盤の移行はダウンタイムやデータの整合性が常に懸念点になりますが、これらのツールを組み合わせることでその負担を抑えるねらいがあります。さらに NetApp ONTAP は、前述の Nutanix Agentic AI ソリューションへ統合する計画も示されており、AIワークロードのデータ基盤として ONTAP を据える構想がうかがえます。
提供段階と運用上の検討ポイント
ここまで見てきた機能群を評価するうえで欠かせないのが、提供段階の正確な理解です。Nutanix Agentic AI は NVIDIA GTC 2026 で発表され、2026年4月に米シカゴで開催された .NEXT 2026 で訴求されました。同社の CEO である Rajiv Ramaswami が基調講演に登壇し、4月には来日も行っています。ただし、ソリューション全体は現在アーリーアクセスの段階にあり、フルでの提供は2026年後半が予定されています。つまり、今すぐ本番環境で全機能を使える状態ではない点を前提に置く必要があります。
確定している事実と、今後提供される予定の機能は分けて捉えることが重要です。フルスタックの構成や AI Gateway によるモデルルーティング、NKP Metal のベアメタル直接展開、NetApp ONTAP のサポートといった方向性は明確に示されています。一方で、AI Gateway のプロンプト分析によるモデル切り替えや、それによるコスト削減の具体的な数値、NKP Metal の一般提供、NetApp 連携の各機能などは、いずれも今後提供される予定として位置づけられています。コスト削減率のような定量的な効果は現時点で確定していないため、導入判断の根拠とする際は慎重さが求められます。
運用担当者が今の段階で進められることとしては、自社の AI 基盤がどこに置かれ、どのモデルをどのエージェントが使い、コストがどう発生しているのかを整理しておくことが挙げられます。AI Gateway が担うガバナンスの観点は、製品の正式提供を待たずとも、現状の課題把握として有効だからです。また、GPU を多用する AI トレーニングのワークロードがあるなら NKP Metal の直接展開が、NetApp ストレージの資産があるなら ONTAP 連携が、それぞれ自社にとっての関わりどころになります。2026年後半という提供時期を見据えつつ、アーリーアクセスでの検証を通じて自社要件との適合を見極めていく姿勢が現実的と言えるでしょう。

















