NFVI(Network Functions Virtualization Infrastructure)徹底解説:設計・運用・性能最適化ガイド

はじめに — NFVIとは何か

NFVI(Network Functions Virtualization Infrastructure)は、ETSIが定義するネットワーク機能仮想化(NFV)アーキテクチャにおける基盤インフラストラクチャです。物理サーバ、ストレージ、ネットワークと、それらを仮想化・管理するソフトウェア群(ハイパーバイザーやコンテナランタイム、仮想化インフラ管理システム)を含み、VNF(Virtualized Network Functions)やCNF(Cloud-native Network Functions)を動作させるための土台を提供します。

NFVIの主な構成要素

  • コンピュート:CPU、メモリ、アクセラレータ(GPU、FPGA、SmartNICなど)。仮想化ではハイパーバイザー(KVMなど)やコンテナランタイム(containerd、CRIOなど)が使われます。
  • ストレージ:ブロック、ファイル、オブジェクトストレージ。高IO性能が求められるNFsにはローカルNVMeが好まれることが多く、共有ストレージや分散ストレージ(Ceph等)も利用されます。
  • ネットワーク:物理ネットワークスイッチ、NIC、仮想スイッチ(Open vSwitch等)、SDNコントローラ。データプレーン性能のためにSR-IOV、DPDK、OVS-DPDK、VPPなどが導入されます。
  • 管理ソフトウェア:VIM(Virtualized Infrastructure Manager: 例 OpenStack)、コンテナオーケストレータ(Kubernetes)、および監視・ログ基盤。
  • タイミングと同期:通信サービスでは時間同期(PTP: Precision Time Protocol)が重要で、NFVIはこれをサポートする必要があります。

ETSIの位置付けとNFV MANO

ETSI NFV ISGはNFVの定義を行い、NFVIはそのコア概念です。NFV MANO(Management and Orchestration)は、NFVI上で動作するVNFをライフサイクル管理するためのコンポーネント群(NFVO、VNFM、VIM)を規定します。NFVIはVIMによって抽象化され、MANOはVIMとの差分を利用してオーケストレーションを行います。

パフォーマンス最適化の技術

ネットワーク機能ではレイテンシとスループットが重要です。主要な最適化技術を挙げます。

  • CPUピニングとNUMA配置:仮想CPUを特定の物理CPUに固定することでキャッシュミスやコンテキストスイッチを低減します。NUMAノードに対するメモリ割当てを最適化することも重要です。
  • Hugepages:ページテーブルのオーバーヘッドを減らすために2MB/1GBのHugepagesを使用することで、パフォーマンスが向上します。
  • DPDK・OVS-DPDK・VPP:ユーザ空間で高速パケット処理を行うライブラリ/フレームワーク。カーネルI/Oのボトルネックを回避し、高スループットを実現します。
  • SR-IOVとPCIパススルー:NICの仮想機能(VF)を直接VM/コンテナに割り当てることで遅延とCPU負荷を低減します。ただしライブ移動や柔軟性で制約が生じます。
  • SmartNIC/HWアクセラレーション:FPGAやeASIC、SmartNIC(例:Mellanox、Intelの分散HW)でパケット処理の一部をオフロードし、ホストCPU負荷を下げます。

CNF(コンテナ化)とVNFsの違い

従来のVNFは仮想マシン上で動作することが多く、CNFはKubernetes上で動作するマイクロサービス設計のネットワーク機能です。CNF移行のメリットは起動時間の短縮、スケーリングの迅速化、クラウドネイティブのエコシステム利用(Helm、ServiceMesh、CI/CD)ですが、ネットワークやストレージの性能確保、状態管理、ライフサイクル管理は課題として残ります。

可用性・信頼性設計

通信事業者レベルの可用性を実現するには以下が必須です。

  • 冗長化:計算ノード、ネットワークパス、ストレージを冗長化。Active/StandbyやActive/Active構成の設計。
  • フェイルオーバーの自動化:監視とオーケストレーションを連携し、障害発生時に自動でリソース再配置を行う。
  • アップグレード戦略:ローリングアップデートやスケジュールされたメンテでサービス影響を最小化する。
  • 状態管理:ステートフルなネットワーク機能ではセッション情報のレプリケーションや外部セッションストアが重要。

運用と監視(Observability)

NFVIではリアルタイムの可視化が不可欠です。主要な指標はCPU/メモリ/ネットワークI/O、パケット損失、遅延、割り当て状況、タイミング同期の状態など。Prometheus/Grafana、ELKスタック、sFlow/IPFIX、eBPFベースのトレーシングなどを組み合わせ、アラートの閾値や自動復旧ワークフローを整備します。

セキュリティ設計

仮想化基盤のセキュリティは多層防御が求められます。主なポイント:

  • 分離:テナント間のネットワークとストレージの分離(VLAN、VRF、マルチテナントセグメンテーション)。
  • ハードニング:BIOS/ファームウェアの保護、Secure Boot、TPMの活用。
  • アクセス制御と監査:RBAC、ログの整備、コンプライアンス監査。
  • 通信保護:データプレーン・コントロールプレーンの暗号化と認証。

エッジや5Gへの適用

5Gやエッジコンピューティングでは、低遅延と分散配置が求められます。NFVIはCoreからEdgeまで階層的に展開され、エッジでは小型サーバやカスタムハードウェアが使われることが多いです。リソース制約がある環境では軽量なVIMやKubernetesディストリビューション(k3s等)と組み合わせて運用されます。

マイグレーションと導入のステップ

既存の物理ネットワークや仮想化環境からNFVIに移行する際の典型的なステップ:

  • 要件定義(性能、可用性、同期精度、スケール、セキュリティ)。
  • PoCで性能要件(DPDK/OVS-DPDK、SR-IOV、hugepage等)を検証。
  • VIM/Kubernetesの選定とネットワークプラグイン(CNI)設計。
  • 監視・ログ・オーケストレーション基盤の構築。
  • 段階的なサービス移行と運用チームの訓練。

ベストプラクティスチェックリスト

  • ハードウェアはNFVワークロードに合致した仕様で選定(CPUコア数、メモリ帯域、NVMe、NIC性能)。
  • 性能要件は実ワークロードでベンチマーク。DPDKやSR-IOVの採用可否を判断。
  • NUMA配置、CPUピニング、Hugepagesを設計段階から考慮。
  • タイミング(PTP)やクロック同期の要件を明確化。
  • オーケストレーション(MANO)の自動化とテストされたフェイルオーバー手順を用意。
  • セキュリティポリシーと監査ログを整備し、定期的にレビュー。

将来動向

NFVIはクラウドネイティブ化、ハイブリッドクラウド化、ハードウェアアクセラレーションのさらなる普及に向かっています。eBPFを使った高速かつ柔軟なパケット処理や、SmartNICによるオフロード、5GコアのCNF化が進むことで、より分散された、より自動化されたNFVI運用が一般化する見込みです。

まとめ

NFVIは単なる仮想化レイヤではなく、ネットワークサービスの性能・可用性・運用性を左右する中核要素です。設計段階でハードウェア選定、仮想化技術、パフォーマンスチューニング、同期、監視、セキュリティを含む包括的な検討を行うことが成功の鍵になります。エッジや5Gのニーズを背景に、NFVIは今後も進化を続け、ネットワークのクラウドネイティブ化を支える重要な基盤であり続けます。

参考文献