変分法とは何か?Euler–Lagrange方程式から弱形式・数値解法、機械学習・画像処理への応用まで徹底解説
変分法とは — 概要
変分法(へんぶんほう、calculus of variations)は、関数そのもの(関数空間上の元)を変数として扱い、ある汎関数(関数を入力して数値を返す写像)の値を最小化または最大化する関係式や解を求める数学の分野です。古典力学のハミルトンの原理や、光の経路が最短(フェルマーの原理)になること、膜の最小表面問題など物理・工学に由来する問題から、現代では数値解析・画像処理・機械学習(変分推論、変分オートエンコーダ)まで幅広く応用されています。
基本的な考え方と Euler–Lagrange 方程式
最も基本的な問題は次の形です。関数 y(x) に対して汎関数
J[y] = ∫ab L(x, y(x), y'(x)) dx
を考え、境界条件 y(a)=α, y(b)=β の下で J[y] を極値にする関数 y(x) を求めます。古典的な解析により、必要条件として Euler–Lagrange 方程式が得られます:
∂L/∂y − d/dx (∂L/∂y') = 0.
この方程式を満たす関数は汎関数の停留点(極小・極大・鞍点)になります。境界条件が自由な場合や、等式制約がある場合はラグランジュ未定乗数法を汎関数に拡張して扱います。
関数微分(汎関数の変分)と弱形式
変分法では「関数に対する微分」、すなわち汎関数の一階変分を用います。形式的には任意の摂動 η(x) に対して
δJ[y; η] = limε→0 (J[y+εη] − J[y]) / ε
がゼロになる条件が導出されます。これは強形式(古典的な微分方程式)に対応しますが、現代の数値解析では弱形式(テスト関数と積分形)を用いることが多く、有限要素法(FEM)は弱形式に基づく典型例です。
代表的な例
ブラキストクローン問題(brachistochrone): 重力場で最短時間で移動する曲線は放物線であるという古典問題。
最小面積問題(膜の最小表面、ミニマルサーフェス): 表面積の汎関数を最小化する曲面を求める。
ハミルトンの原理(解析力学): ラグランジアンの作用 S = ∫ L dt を停留にする経路が運動方程式(オイラー–ラグランジュ)を満たす。
固有値問題に対する変分原理: 線形演算子の最小固有値は対応するレイリー商の最小化問題として表され、数値的にはRitz法で近似できる。
画像処理の総変動(Total Variation, TV)法: ノイズ除去において画像の勾配のL1ノルム(TV)を正則化項として加え、損失を最小化することでエッジを保持した平滑化が可能(ROFモデル)。
数値的・計算的アプローチ
実際の問題では解析解が得られないことが多く、数値的手法を用います。代表的手法は次の通りです。
Ritz法・Galerkin法: 解を有限次元空間(基底関数の線形結合)で近似し、汎関数の最小化を有限次元最適化問題に帰着させる。有限要素法はこの枠組みの実装と言えます。
勾配降下や準ニュートン法: 汎関数の変分(あるいは数値的な勾配)を用いて反復的に最適化。
凸最適化の技法: 汎関数が凸であれば収束保証や効率的アルゴリズム(プロキシマル法、ADMMなど)が使える。
オートディファレンシエーション: 自動微分ライブラリ(PyTorch, TensorFlow, JAXなど)を使えば、離散化した汎関数の勾配を容易に取得して最適化に供することができる。
IT・機械学習での応用例
変分推論(Variational Inference, VI): ベイズ推論で事後分布を近似するために、探索する分布族の中でKLダイバージェンスを最小化する枠組み。変分オートエンコーダ(VAE)は変分原理を用いた生成モデルの代表例です。
変分法による正則化と損失設計: 画像再構成やセグメンテーションで TV 正則化や各種エネルギー関数を設定し、最小化問題として解く。
数値 PDE のディープラーニング解法: PINNs(Physics-Informed Neural Networks)や変分的 PINNs は PDE の弱形式(エネルギー最小化)を損失関数に組み込む例。
高性能数値ライブラリ: FEniCS、deal.II などは変分形式で PDE を定式化し、FEM による自動離散化を提供します。機械学習フレームワークと組み合わせた研究も進んでいます。
実装上の注意点と落とし穴
離散化誤差と収束性: 適切な基底・メッシュ・正則化を選ばないと近似解が実際の解から乖離する。収束解析(安定性・一貫性)を確認することが重要です。
非凸性: 多くの実用問題は非凸で局所解に陥りやすい。初期値やアルゴリズム選択、正則化の調整が必要です。
制約条件の扱い: 境界条件や不等式制約はペナルティ法やラグランジュ法で実装されるが、数値的な安定性に注意が必要です。
計算コスト: 高次元問題や精度要求の高い PDE 解法は計算コストが大きい。マルチグリッド法や並列化、近似モデルを検討します。
まとめ
変分法は「汎関数を最小化/最大化する」という一般的な枠組みであり、解析学・物理学の基礎理論から数値解析、機械学習まで幅広い分野に応用されます。理論的には Euler–Lagrange 方程式や弱形式が基盤にあり、数値的には Ritz/Galerkin や有限要素法、凸最適化アルゴリズムや自動微分が強力なツールです。IT領域では、変分推論やVAE、画像処理の正則化、PDEベースのモデリングにおいて特に重要な役割を果たします。設計・実装の際は離散化や非凸性、制約の扱いに注意してください。
参考文献
- 変分法 - Wikipedia(日本語)
- Calculus of variations - Wikipedia (English)
- Euler–Lagrange equation - Wikipedia
- Finite element method — Variational formulation (Wikipedia)
- Kingma, D. P., & Welling, M. (2014). Auto-Encoding Variational Bayes. arXiv:1312.6114
- Total variation denoising (ROF model) - Wikipedia
- FEniCS Project — software for automated solution of differential equations by FEM
- Noether's theorem - Wikipedia
- I. M. Gelfand, S. V. Fomin, "Calculus of Variations" (古典的教科書・参考書)


