線形回帰とは?仕組み・目的・活用例を基礎からわかりやすく解説

線形回帰(せんけいかいき)は、データ分析や機械学習のなかでも最も基本的で広く使われる手法のひとつです。
売上予測、マーケティング分析、価格推定、需要予測、AIモデルの構築など、多くの場面で利用されており、「データから傾向や未来を予測する」際の出発点といえる技術です。

本記事では、線形回帰の意味、仕組み、用途、メリットまでをわかりやすく解説します。


線形回帰とは?

線形回帰(Linear Regression)とは、

ある変数(説明変数)が目的変数にどのように影響するかを、直線関係で表す回帰分析手法

のことです。

最も単純な形では、散らばったデータに対して「最もよく合う直線」を求め、その直線を使って未来の値や関係性を予測します。

数式的には次のように表されます。

y = a x + b

  • x:説明変数
  • y:目的変数
  • a:傾きを示す係数
  • b:切片(x=0 のときの yの値)

この直線を「回帰直線」と呼びます。


線形回帰で“最もよく合う直線”を求める方法

線形回帰では、

データと直線の誤差を最も小さくする

という基準で回帰直線を決めます。
一般的に使われるのが「最小二乗法」です。

最小二乗法では、

  1. 実際のデータと直線のズレ(誤差)を計算する
  2. その誤差を二乗する
  3. 二乗した誤差の合計が最小となるように直線を調整する

という手順で最適な a と b を求めます。


単回帰と重回帰の違い

線形回帰には大きく2種類あります。

■ 単回帰(Simple Linear Regression)

説明変数が1つだけのもっともシンプルな線形回帰。
例:広告費 → 売上

■ 重回帰(Multiple Linear Regression)

説明変数が2つ以上の線形回帰。
例:広告費 + 気温 + 曜日 → 売上

説明変数が増えるほど複雑になりますが、より多くの要因を反映した予測が可能になります。


線形回帰が使われる場面

線形回帰は、ビジネスから研究分野まで幅広く活用されています。

売上予測

広告費・イベント・季節などの変数から将来の売上を予測。

マーケティング分析

どの施策がどれだけ効果をもたらしたかを数値で把握。

価格推定

不動産価格、車の査定、レコードの中古価格調査など、価格予測全般に活用。

製造・品質管理

温度や圧力などの条件が製品の品質に与える影響の分析。

機械学習モデルの基盤

AIにおける多くのモデルの基礎となる重要概念。


線形回帰のメリット

■ シンプルで理解しやすい

直線という直感的なモデルで理解しやすく、説明もしやすい。

■ 計算コストが低い

大量のデータでも高速に計算でき、実装も簡単。

■ 予測・分析の両方に使える

未来の予測にも、変数間の関係の可視化にも役立つ。


線形回帰の注意点・弱点

■ 直線関係しか表現できない

非線形の複雑な関係はモデル化しにくい。

■ 外れ値に弱い

誤差を二乗するため、1つの極端な値に大きく影響される。

■ 多重共線性に弱い

説明変数同士に強い相関があると係数の推定が不安定になる。

これらを補うために、リッジ回帰やラッソ回帰などの正則化手法が使われます。


線形回帰を理解すると、データ分析の基盤が固まる

線形回帰はデータ分析の入口ともいえる基礎的な手法ですが、ビジネスの現場でも機械学習でも非常に強力です。
直線で表せる関係性がある場合、線形回帰はもっとも簡単かつ効果的な予測モデルとなります。

データ分析を学ぶうえで必ず押さえるべき技術であり、多くの応用手法の基礎にもなっています。


参考文献