ラプラス分布とは何か?定義・性質・推定法と実務での応用を徹底解説

概要 — ラプラス分布とは

ラプラス分布(Laplace distribution)は、確率論および統計学で用いられる連続確率分布の一つで、「二重指数分布(double exponential distribution)」とも呼ばれます。位置パラメータ μ(平均・中央値・最頻値)と尺度パラメータ b(b > 0)で特徴づけられ、確率密度が中心で鋭く尖り、裾(テール)が正規分布よりも厚い(heavy-tailed)という性質を持ちます。機械学習やロバスト統計、差分プライバシーなどの分野で重要な役割を果たします。

定義と確率密度関数(PDF)

位置パラメータ μ、尺度パラメータ b(b > 0)を持つラプラス分布の確率密度関数は次のように定義されます。

f(x; μ, b) = (1 / (2b)) · exp( − |x − μ| / b ), for x ∈ ℝ

この形から分かるように、x = μ で最大値を取り、左右対称の鋭いピークを持ちます。b が小さいほど尖りが強く、b が大きいほど広がりが大きくなります。

累積分布関数(CDF)と逆関数(逆累積分布)

累積分布関数 F(x) は次のような片側指数の組み合わせで与えられます。

F(x; μ, b) =

  • 1/2 · exp((x − μ) / b),  x < μ
  • 1 − 1/2 · exp(−(x − μ) / b),  x ≥ μ

逆累積分布(逆関数法によるサンプリングで利用)は、u ∼ Uniform(0,1) に対して次のようになります。

F⁻¹(u; μ, b) =

  • μ + b · ln(2u),  0 < u < 1/2
  • μ − b · ln(2(1 − u)),  1/2 ≤ u < 1

基本統計量(期待値・分散・中央値・モード)

ラプラス分布の代表的なモーメントは次の通りです(中心化モーメント含む)。

  • 期待値(平均): E[X] = μ
  • 中央値: μ
  • 最頻値(モード): μ
  • 分散: Var[X] = 2 b²
  • 標準偏差: √2 · b
  • 歪度(skewness): 0(左右対称)
  • 尖度(kurtosis): 3( excess kurtosis = 3 )

分散が 2 b² であることに注意すると、同じ尺度パラメータ b のとき正規分布より大きな分散を持ち、裾が厚いことを示します。

特性関数 (Characteristic function) とモーメント母関数 (MGF)

ラプラス分布の特性関数 φ(t) とモーメント母関数 M(t)(存在域に注意)は次の通りです。

  • 特性関数: φ(t) = E[e^{i t X}] = exp(i μ t) / (1 + b² t²)
  • モーメント母関数: M(t) = E[e^{t X}] = exp(μ t) / (1 − b² t²), 有効範囲 |t| < 1/b

これらは解析的に期待値・分散・高次モーメントを導出するのに使えます。

生成(サンプリング)方法

ラプラス分布からのサンプル生成は幾つか簡単な方法があります。

  • 逆関数法: 上述の逆累積分布を用いる。u ∼ Uniform(0,1) を生成し、F⁻¹(u) を計算する。
  • 指数分布の差: E₁, E₂ を同一の指数分布 Exp(1/b)(平均 b)から独立に生成すると、X = μ + (E₁ − E₂) は Laplace(μ, b) に従う。この表現が「二重指数(正負に鏡像)」の由来。
  • 符号付き指数: 確率 1/2 で正、1/2 で負の符号を取り、絶対値を Exp(1/b) に従わせる方法も等価。

最尤推定(MLE)とロバスト推定との関係

ラプラス分布の観点から見た推定はロバスト性を示します。サンプル X₁,…,X_n が Laplace(μ,b) に従うと仮定したときの最尤推定量は次のようになります:

  • μ の MLE: 標本の中央値(偶数個の場合は中央値の任意の値で尤度最大となることがあり得る)
  • b の MLE: b̂ = (1/n) ∑_{i=1}^n |X_i − μ̂| (μ̂ は上の中央値)

この μ の推定が中央値であることは、L1(絶対誤差和)最小化と一致します。従って外れ値に比較的強い(ロバスト)推定を実現します。これは最小二乗(L2)法が平均(μ)を最適化するのと対照的です。

応用例 — 機械学習・統計・差分プライバシー

ラプラス分布は理論的にも実務的にも多くの応用があります。

  • ロバスト回帰 / 最小絶対偏差(LAD): 目的関数に L1 損失を用いると、残差がラプラス分布に従うというモデル解釈が可能です。外れ値に強い推定が得られます。
  • Lasso(L1 正則化)とベイズ的解釈: 回帰係数にラプラス事前分布(独立)を与えた MAP 推定は L1 ペナルティ(Lasso)と同等になります。これにより変数選択(スパース化)との関係が明確になります。
  • 差分プライバシー(Laplace Mechanism): 集計関数 f に対し感度 Δf を求め、ノイズとして Laplace(0, Δf/ε) を加えると ε-差分プライバシーが得られます。ラプラス分布の裾の形状と指数的減衰が解析上好ましいため広く使われます。
  • 信号処理・スパース表現: スパース化を誘導する事前分布としてラプラス分布を使うケースがある(ただし計算上の扱いで他の近似が使われることも多い)。
  • モデル化: ある種の測定誤差やノイズが正規分布よりも重い裾を持つ場合のモデル化に適します。

正規分布との比較

ラプラス分布は正規分布と比較して以下の特徴があります。

  • ピーク: ラプラスは中心でより鋭いピークを持つ(同じ分散ならばなお顕著)。
  • 裾の厚さ: ラプラスは指数的な裾を持ち、正規分布(ガウス)の平方減衰(e^{−x²})よりも裾が厚い(異常値に対して影響を減らす/しかし確率はより大きい)。
  • ロバスト性: L1 損失(ラプラス誤差モデル)は L2 損失(正規誤差モデル)より外れ値に対してロバスト。

数学的注意点・拡張

  • 多変量拡張: 一般化された多変量ラプラス分布(多変量二重指数分布)も定義されますが、定義が一意でない場合や計算面の取り扱いがやや複雑です。実務ではしばしば独立成分のラプラスを仮定するか、他のスパース分布を用います。
  • 情報量(エントロピー): ラプラス分布の微分エントロピーは h = 1 + ln(2b) です(自然対数を使用)。
  • 確率過程への応用: ラプラス分布に基づくノイズを導入した過程は重尾性を保持するため、金融データなどのモデリングに使われることがあります。

歴史的背景

ラプラス分布は数学者ピエール=シモン・ラプラス(Pierre-Simon Laplace)にちなんで名付けられました。ラプラスは確率論や解析に多大な貢献をした人物で、二重指数形の分布もその名を冠しています。英語では "Laplace distribution"、あるいは形状から "double exponential distribution" と呼ばれます(「二重指数」は左右で指数関数的に減衰することに由来)。

実務上の注意点

  • パラメータ推定でサンプルサイズが小さい場合、中央値と平均絶対偏差での推定は分布のばらつきを過小評価することがあり、信頼区間やブートストラップ等で評価するのが良い。
  • 数値的取り扱い: b が非常に小さいと指数関数の計算でオーバーフロー・アンダーフローに注意。
  • モデル選択: データに対して正規分布かラプラス分布かを検討するには Q-Q プロットや情報量基準(AIC/BIC)などで比較するのが実務的。

まとめ

ラプラス分布は、尖った中心と厚い裾を持つ分布で、ロバスト推定(L1 損失)や L1 正則化(Lasso)の理論的根拠、差分プライバシーのノイズ設計など、現代のデータ分析や機械学習において重要な役割を果たします。指数分布の差としての生成法や、中央値・平均絶対偏差に基づく最尤推定等、扱い方も直感的で実装しやすいのが利点です。データの特性に応じて正規分布と比較検討し、適切なノイズモデルや損失関数として活用すると良いでしょう。

参考文献