Promax法とは何か:因子分析におけるプロマックス回転の原理・利点・実装ガイド

はじめに

Promax法(プロマックス回転)は、探索的因子分析(EFA)における回転手法の一つで、特に要因間の相関(因子の斜交性)を許容する「斜交回転(oblique rotation)」の高速近似法として広く用いられています。Varimaxのような直交回転では因子を互いに直交(非相関)に保ちますが、心理・社会科学や実務データでは因子が相関することが自然な場合が多く、Promaxはそのような場面で有用です。本稿ではPromax法の原理、アルゴリズム、パラメータ、利点と注意点、実装と実務上の使いどころまで詳しく解説します。

Promax法の概要

Promax法は、まず初めに速い直交回転(通常はVarimax)で一度単純構造に近づけ、その後ロードイング(因子負荷量)にべき乗をかけることでターゲットマトリクスを作り、元の解をそのターゲットに最も近づけるように斜交変換(非直交の線形変換)を行う、という2段階のアプローチを取ります。これにより、計算コストを抑えつつ斜交の単純構造に移行できる点が特徴です。

アルゴリズムの流れ(概念的説明)

  • 1) 初期直交回転:主成分法や最尤法で得た因子負荷行列に対して、まずVarimaxなどの直交回転を適用して得られる負荷行列をLとします。
  • 2) ターゲットの作成(べき乗):Lの各要素に符号を保ったまま絶対値のべき乗を適用します。具体的には t_ij = sign(l_ij) * |l_ij|^k のようにしてターゲット行列Tを作ります。ここでkはPromaxの重要なパラメータです(通常k≥1、SPSSのデフォルトはk=4など)。
  • 3) 近似的斜交変換の算出:ターゲットTに対して、元の直交負荷Lを線形変換してTPに近づけるような変換行列Pを最小二乗で求めます。つまりPはLを新しい(斜交の)因子空間へ写像するための非直交変換です。
  • 4) 最終負荷行列と因子相関:変換行列Pを用いて最終的な負荷行列A = L P を得ます。因子間の相関(Phi)はPに基づいて計算されます(初期が直交であったため、この近似で斜交性を導入します)。

この手続きは直接的な斜交最適化(例えばdirect obliminやquartiminのような逐次最適化)と比べて計算が軽く、初期解に依存する点があります。

数学的なポイント(やや詳細)

Promaxでは、まず直交回転された負荷行列L(m×r)に対し、ターゲットT(同じ次元)を作る。Tの成分は T_ij = sign(L_ij) * |L_ij|^k(kはプロマックス指数)。その後、LとTの関係を線形変換で近似するP(r×r)を最小二乗で求める。正規方程式は通常 (L' L) P = L' T で与えられ、初期回転が直交(L' L が対角または単位行列に近い)であることから解が安定しやすい。得られたPを適用してA = L P を最終的な因子負荷行列とし、因子間相関行列は Phi = P' P のように表されることが多い(実装によって詳細の扱いが異なる場合がある)。

重要な点は、Promaxは厳密に目的関数を逐次最適化する方法ではなく、ターゲットを作ってそれに近づける近似法であることです。このため高速ですが、得られる解は初期直交回転やパラメータkに依存します。

k(べき乗パラメータ)の意味と影響

Promaxの中心的なハイパーパラメータがkです。k=1ではターゲットは元のLと同じになり、変換はほとんど起こりません。kを大きくすると小さな負荷量はさらに小さくなり、大きな負荷量が強調されるため、結果的により“単純構造”に近いターゲットが得られます。しかし過度に大きなkは、因子間の過度な分離や解釈の歪み、また不安定な因子相関を招く可能性があります。実務ではk=3〜5の範囲がよく使われ、SPSSではk=4がデフォルトになっていることが多いです。

Promaxの長所

  • 計算が速く、大規模なデータや多くの因子に対しても実用的。
  • 初期に直交回転を行うため、直交法の解釈性を引き継ぎつつ斜交性を導入できる。
  • 単純構造(各観測変数が一つまたは少数の因子に強くロードされる構造)への収束を促しやすい。
  • 多くの統計ソフトで実装されており利用が容易(R、SPSS、SAS、Pythonの一部ライブラリなど)。

Promaxの短所・注意点

  • 初期直交回転とkに依存するため、結果が安定しない場合がある。異なる初期法やkで感度分析が必要。
  • 近似法であるため、direct obliminやquartiminといった逐次最適化斜交回転と結果が異なる可能性がある。
  • 因子負荷行列(パターンマトリクス)と構造マトリクスの混同に注意。斜交の場合、因子の直接的な負荷(pattern)と因子と変数の相関(structure)は異なります。
  • 過度に大きなkは解釈を誤らせることがある(スパース化し過ぎ)。

実務上の使い方とベストプラクティス

  • 前処理:データは必要に応じて標準化(平均0分散1)や欠損処理を行う。EFA全般の前提(サンプルサイズ、基準分散、適合度指標など)を確認する。
  • 因子数の決定:固有値(Kaiser基準)、スクリープロット、並列分析(parallel analysis)、実務上の解釈可能性を組み合わせて決める。
  • 複数の回転を比較:Varimax(直交)→Promax(斜交)→direct oblimin等の斜交を試し、因子負荷の安定性や因子相関を比較すること。
  • パラメータ感度の確認:kを変えて結果のロバスト性を確認する。一般にk=3~5で比較するとよい。
  • パターン行列と構造行列の区別:解釈時はpattern(回帰係数的な負荷)とstructure(相関)を分けて報告する。特に斜交の場合、両者が大きく異なることがある。
  • 因子得点の算出:因子相関を考慮して因子得点を算出する手法を選ぶ(回帰法、 Bartlett法など)— 斜交の場合は相関を反映した方法を用いる。

実装例と利用可能なツール

Promaxは多くの統計ソフトでサポートされています。代表的な例:

  • R:statsパッケージやpsychパッケージにPromaxの実装がある(promax関数やpsych::principal/promax等)。
  • SPSS:回転オプションでPromaxを選択可能。デフォルトのkなどはバージョンに依存するが、一般にk=4がよく用いられる。
  • SAS:PROC FACTORなどでPromaxを指定できる。
  • Python:factor_analyzerなどの外部ライブラリでPromax実装が提供されている場合がある(ライブラリによる)。

それぞれの実装は細部(正規化、スケーリング、数値的安定化など)で差が出るため、複数ツールで結果を比較すると安心です。

簡単なケーススタディ(概念例)

例えばユーザー行動のアンケート(ページ滞在時間、クリック数、満足度指標など)から因子を抽出する場合、直交回転で因子が完全に独立であると仮定すると、実際の心理的構造(満足度とネット利用傾向など)が反映されないことがあります。Promaxを用いると因子間の相関を許容しつつ、各変数がより明確に主要因子へ割り当てられることが期待できるため、ビジネス上のセグメント化やスコアリングが行いやすくなります。

まとめ

Promax法は、因子間相関を容認した上で単純構造を速やかに得たい場合に有効な回転法です。計算コストが低く実務的な利用価値が高い一方で、初期直交回転やkパラメータに依存する点、そして斜交特有のpattern/structureの違いを正しく扱う必要があります。探索的因子分析を行う際は、Promaxを含む複数の回転法で結果を比較し、解釈の妥当性を検証することが重要です。

参考文献