ํ๋ ฌ์ ๊ทผ์ฌ
Chapter 6 : Matrix Approximation
Edited by / ์์ํ (wonhyeongseo)
-
๋ชฉ์ฐจ
SVD๋ฅผ ์ด์ฉํด ํ๋ ฌ $A$ ๋ฅผ $A = U \Sigma V^\top \in \mathbb{R} ^ {m \times n}$ ์ฒ๋ผ 3๊ฐ์ ํ๋ ฌ๊ณฑ์ผ๋ก ๋ฐ๊พธ๋ ๋ฐฉ๋ฒ์ ์์๋ณด์์ต๋๋ค. ์ด๋ $U \in \mathbb{R} ^ {m \times m}$ ์ $V \in \mathbb{R} ^ {n \times n}$ ๋ ์ง๊ตํ๋ ฌ์ด๊ณ $\Sigma$ ๋ ์ฃผ๋๊ฐ์ฑ๋ถ์ ํน์ด๊ฐ์ ์ง๋ ํ๋ ฌ์ ๋๋ค. ์ง๊ธ๋ถํฐ ํน์ด๊ฐ ๋ถํด๋ฅผ ์ ๋ถ ํ๋ ๋์ , ์๋ฆฌ๋ฅผ ์ด์ฉํจ์ผ๋ก์จ ํ๋ ฌ $A$ ๋ฅผ ๋ ๋จ์ํ (์ ์ฐจ์์) ํ๋ ฌ๋ค $A_i$ ๋ก ์ด๋ป๊ฒ ํํํ ์ ์๋์ง๋ฅผ ๋ณด์ด๊ฒ ์ต๋๋ค. ์ ๋ถ ๊ณ์ฐํ์ง ์์ผ๋ ๋ ํจ์จ์ ์ด๊ฒ ์ฃ ?
์ฐ์ ๊ณ์๊ฐ 1์ธ ํ๋ ฌ $A_i \in \mathbb{R} ^ {m \times n}$ ์ ์ง๊ตํ๋ ํ๋ ฌ $U$ ์ $V$ ์ $i$ ๋ฒ์งธ ๋ฒกํฐ์ ์ธ์ ์ผ๋ก ๊ตฌํฉ๋๋ค.
\[A_i \coloneqq u_i v_i^{\top}\]๊ณ์๊ฐ $r$ ์ธ ํ๋ ฌ $A \in \mathbb{R}^{m \times n}$ ์ ๊ณ์๊ฐ 1์ธ ํ๋ ฌ์ ํฉ์ผ๋ก ์๋์ ๊ฐ์ด ํํํ ์ ์์ต๋๋ค.
\[A = \sum_{i=1}^{r} \sigma_i u_i v_i^{\top} = \sum_{i=1}^{r} \sigma_i A_i\]์ด๋ฌ๋ฉด ์ธ์ ํ๋ ฌ $A_i$ ๋ $i$ ๋ฒ์งธ ํน์ด๊ฐ $\sigma_i$ ๋ก ๊ฐ์ค๋ฉ๋๋ค. ์ ์์ ์์ด ์ฑ๋ฆฝํ ๊น์? ํน์ด๊ฐ ํ๋ ฌ $\Sigma$ ๊ฐ ๋์์ ๋๊ฐํ๋ ฌ์ด๊ธฐ ๋๋ฌธ์ $i$ ๋ฒ์งธ ์ข์ฐ ์ง๊ต ๋ฒกํฐ๋ค์ธ $u_i v_i^{\top}$ ๋ง์ ๊ฐ์ ธ์ค๊ณ ๋ง์ฐฌ๊ฐ์ง๋ก $i$ ๋ฒ์งธ ํน์ด๊ฐ $\sigma_i$ ๋ก scale ํ๊ธฐ ๋๋ฌธ์ ๋๋ค. ๋ค์ ๋งํ๋ฉด, ๋ชจ๋ $\Sigma_{ij} u_i v_j^{\top}$ ๋ $i \neq j$ ๋ฉด $\Sigma$ ๊ฐ ๋๊ฐํ๋ ฌ์ด๊ธฐ ๋๋ฌธ์ ์ฌ๋ผ์ง๋๋ค. $i > r$ ์ธ ๊ฐ๋ค๋ ํด๋นํ๋ ํน์ด๊ฐ์ด $0$ ์ด๊ธฐ ๋๋ฌธ์ ์ฌ๋ผ์ง๋๋ค.
์ด์ ๊ณ์๊ฐ 1์ธ $A_i$ ์ $r$ ๊ฐ์ $A_i$ ๋ฅผ ํฉ์ณ ๊ณ์๊ฐ $r$์ธ ํ๋ ฌ $A$ ๋ฅผ ๊ตฌํ์ต๋๋ค. $i = 1, \dots , r$ , ์ฆ ๋ชจ๋ ๊ณ์ ํจ์ $A_i$ ๋ฅผ ํฉ์น์ง ์๊ณ , ์ค๊ฐ์ ๋ฉ์ถฐ $k < r$ ์ด๋ฉด, ๊ณ์๊ฐ $k$ ์ธ $A$ ์ ๊ทผ์ฌ ํ๋ ฌ์ ์ป๊ฒ ๋ฉ๋๋ค.
\[\hat{A} (k) = \sum_{i=1}^{k} \sigma_i u_i v_i^{\top} = \sum_{i=1}^{k} \sigma_i A_i\]์๋ ํ๋ ฌ $A$ ์ ๊ณ์๊ฐ $k$ ์ธ ๊ทผ์ฌ ํ๋ ฌ $\hat{A}(k)$ ์ ์ฐจ์ด (์๋ฌ)๋ฅผ ๊ตฌํ๋ ค๋ฉด norm์ ๊ฐ๋ ์ด ํ์ํฉ๋๋ค. ์น์ 3.1์์ ๋ฒกํฐ์ ๊ธธ์ด๋ฅผ ๊ตฌํ๋ ๋ฐ ์ด๋ฏธ ํ์ฉํ์์ฃ . ๊ทธ๋ผ ํ๋ ฌ์์์ norm์ ์ ์ํด๋ด ์๋ค.
์ ์ 4.23: ํ๋ ฌ์ Spectral Norm
$x \in \mathbb{R}^{n} \backslash { 0 }$ ์ผ ๋, ํ๋ ฌ $A \in \mathbb{R} ^ {m \times n}$ ์ spectral norm ์
\[{\left\| A \right\|}_2 \coloneqq \max_{x} \frac{ {\left\| Ax \right\|_2}{ {\left\| x \right\|}_2}\]๋ก ์ ์๋ฉ๋๋ค. ๊ทธ๋ฆฌ๊ณ ๋ฒกํฐ์ ์ ํด๋ฆฌ๋ ๋ ธ๋ฆ์ ํ๊ธฐํ ๋์ฒ๋ผ (์์์ ์ค๋ฅธ์ชฝ), ์ฌ๊ธฐ์ ํ๋ ฌ์ ์๋ ์ฒจ์ ํ๊ธฐ๋ฒ (์์์ ์ผ์ชฝ)์ ์๊ฐํฉ๋๋ค.
์ ๋ฆฌ 4.24: $A$ ์ spectral norm์ ์์ ์ ๊ฐ์ฅ ํฐ $\sigma_1$
์ด ์ ๋ฆฌ์ ์ฆ๋ช ์ ๊ณผ์ ๋ก ๋ด๊ฒ ์ต๋๋ค.
todo <> (https://en.wikipedia.org/wiki/Low-rank_approximation ์ดํดํ๊ธฐ)