TekRog

thumbnail

リッジ回帰の数式の導出方法を徹底解説

更新日:2024年03月16日(作成日: 2024年03月15日)

カテゴリー:

シェア!

リッジ回帰の数式を導出・解説します。流れが詳しくわかるよう、丁寧に式変形するよう心がけております。まずは通常の回帰の数式の導出から始め、リッジ回帰の数式の理解につなげます。

目次

1 線形回帰
- 1.1 線形回帰の概要
- 1.2 線形回帰の数式
2 リッジ回帰
- 2.1 リッジ回帰の概要
- 2.2 リッジ回帰の数式
3 発展

線形回帰

リッジ回帰の数式の解説の前に、線形回帰の概要と数式を解説します。

線形回帰の概要

線形回帰では、データの分布を最も良く近似する線形関数を求める。

次のようなデータ $\left\{(\mathbf{x}_i, y_i)\right\}_{i=1}^N$ があるとき、これらのデータを最もよく近似する超平面 $\mathbf{a}^\top\mathbf{x}=\mathbf{0}$ を求める。

線形回帰の数式

オレンジの超平面と各データ点の誤差を最小化するような超平面を求めるために、誤差を2乗した損失関数を考え、それを最小化する。2乗誤差を損失関数として利用する理由は、凸なため微分により最小値が求まるためである。

各データ点と超平面の2乗誤差は次のとおりである。

\begin{align*} L(\mathbf{a}) &= \sum_{i=1}^N(y_i-\mathbf{a}^\top\mathbf{x}_i)^2 \\ &= \sum_{i=1}^N(\mathbf{a}^\top\mathbf{x}_i-y_i)^2 \\ &=\begin{bmatrix} \mathbf{x}_1^\top\mathbf{a}-y_1 \cdots \mathbf{x}_N^\top\mathbf{a}-y_N \end{bmatrix}\begin{bmatrix} \mathbf{x}_1^\top\mathbf{a}-y_1 \\ \vdots \\\mathbf{x}_N^\top\mathbf{a}-y_N \end{bmatrix} \\ &=\begin{bmatrix} \mathbf{x}_1^\top\mathbf{a}-y_1 \\ \vdots \\\mathbf{x}_N^\top\mathbf{a}-y_N \end{bmatrix}^\top\begin{bmatrix} \mathbf{x}_1^\top\mathbf{a}-y_1 \\ \vdots \\\mathbf{x}_N^\top\mathbf{a}-y_N \end{bmatrix} \\ &= \left\| \begin{bmatrix} \mathbf{x}_1^\top\mathbf{a}-y_1 \\ \vdots \\\mathbf{x}_N^\top\mathbf{a}-y_N \end{bmatrix} \right\|^2 \\ &= \left\| \begin{bmatrix} \mathbf{x}_1^\top \\ \vdots \\\mathbf{x}_N^\top \end{bmatrix}\mathbf{a}- \begin{bmatrix}y_1\\\vdots\\y_N\end{bmatrix}\right\|^2 \\ &= \|\mathbf{X}\mathbf{a} – \mathbf{y} \|^2 \end{align*}

$\nabla_{\mathbf{a}}L=\mathbf{0}$ と微分して0とおき、 $\mathbf{a}$ を求めると、

\begin{align*}0&=2\mathbf{X}^\top(\mathbf{X}\mathbf{a}-\mathbf{y}) \\ \mathbf{X}^\top\mathbf{X}\mathbf{a} &= \mathbf{X}^\top\mathbf{y} \\ \therefore \mathbf{a} &= (\mathbf{X}^\top\mathbf{X})^{-1}\mathbf{X}^\top\mathbf{y} \end{align*}

この $a$ を $\mathbf{a}^\top\mathbf{x}=\mathbf{0}$ に代入することにより、超平面が求まる。

なお、行列の微分による式変形がわからない方は、以下の記事を参考にされたし。

https://tekrog.com/cheatsheet-differentiation-of-vectors-and-matrices

ベクトル・行列の微分チートシート

ベクトル・行列の微分の公式をまとめたチートシートです。前提fはスカラ値関数、小文字の太文字アルファベットはベクトル、大文字の太文字アルファベットは行列とします...

リッジ回帰

リッジ回帰の概要

線形回帰の2乗誤差を最小化する過程において、複雑さを抑えるために、超平面の重みベクトルaのl2ノルムも同時に最小化する。

すなわち、次の式を最小化する。

\sum_{i=1}^N(y_i-\mathbf{a}^\top\mathbf{x}_i)^2+\lambda\|\mathbf{a}\|_2^2

リッジ回帰の数式

$\nabla_\mathbf{a}L=\mathbf{0}$ と微分して0とおき、 $\mathbf{a}$ を求める。線形回帰の式と同様に変形すると、

\mathbf{a}= (\mathbf{X}^\top\mathbf{X}+\lambda\mathbf{I})^{-1}\mathbf{X}^\top\mathbf{y}

この $a$ を $\mathbf{a}^\top\mathbf{x}=\mathbf{0}$ に代入することにより、超平面が求まる。

発展

カーネルリッジ回帰については、次の記事をご覧ください。

https://tekrog.com/kernel-ridge-regression-formula-explained

カーネルリッジ回帰の数式の導出方法を徹底解説

カーネルリッジ回帰の数式を導出・解説します。流れが詳しくわかるよう、丁寧に式変形するよう心がけております。概要ただの線形回帰ではデータが線形分布しているとき...

カテゴリー:

シェア!

関連記事

カーネルリッジ回帰の数式の導出方法を徹底解説

カーネル主成分分析(カーネルPCA)の数式の導出方法を徹底解説

最新の記事

ブログをNext.js14(App Router)でリファクタリングしました

ブログをNext.js14(App Router)でリファクタリングしました

StyleXの使い方を完全解説

StyleXの使い方を完全解説

【CodeSandbox】ブログに埋め込んだコードに勝手にスクロールしたときの対処法

【CodeSandbox】ブログに埋め込んだコードに勝手にスクロールしたときの対処法

【React】超簡単に学べるuseTransitionフック

【React】超簡単に学べるuseTransitionフック

【超簡単】Next.js+WordPressで数式を記述する方法

【超簡単】Next.js+WordPressで数式を記述する方法

カテゴリー一覧

お知らせ(2)

機械学習(5)

アーカイブ

目次

線形回帰線形回帰の概要線形回帰の数式リッジ回帰リッジ回帰の概要リッジ回帰の数式発展