Link Search Menu Expand Document

ํ–‰๋ ฌ์˜ ๊ทผ์‚ฌ

Chapter 6 : Matrix Approximation

Edited by / ์„œ์›ํ˜• (wonhyeongseo) wonhyeongseo



SVD๋ฅผ ์ด์šฉํ•ด ํ–‰๋ ฌ $A$ ๋ฅผ $A = U \Sigma V^\top \in \mathbb{R} ^ {m \times n}$ ์ฒ˜๋Ÿผ 3๊ฐœ์˜ ํ–‰๋ ฌ๊ณฑ์œผ๋กœ ๋ฐ”๊พธ๋Š” ๋ฐฉ๋ฒ•์„ ์•Œ์•„๋ณด์•˜์Šต๋‹ˆ๋‹ค. ์ด๋•Œ $U \in \mathbb{R} ^ {m \times m}$ ์™€ $V \in \mathbb{R} ^ {n \times n}$ ๋Š” ์ง๊ตํ–‰๋ ฌ์ด๊ณ  $\Sigma$ ๋Š” ์ฃผ๋Œ€๊ฐ์„ฑ๋ถ„์— ํŠน์ด๊ฐ’์„ ์ง€๋‹Œ ํ–‰๋ ฌ์ž…๋‹ˆ๋‹ค. ์ง€๊ธˆ๋ถ€ํ„ฐ ํŠน์ด๊ฐ’ ๋ถ„ํ•ด๋ฅผ ์ „๋ถ€ ํ•˜๋Š” ๋Œ€์‹ , ์›๋ฆฌ๋ฅผ ์ด์šฉํ•จ์œผ๋กœ์จ ํ–‰๋ ฌ $A$ ๋ฅผ ๋” ๋‹จ์ˆœํ•œ (์ €์ฐจ์›์˜) ํ–‰๋ ฌ๋“ค $A_i$ ๋กœ ์–ด๋–ป๊ฒŒ ํ‘œํ˜„ํ•  ์ˆ˜ ์žˆ๋Š”์ง€๋ฅผ ๋ณด์ด๊ฒ ์Šต๋‹ˆ๋‹ค. ์ „๋ถ€ ๊ณ„์‚ฐํ•˜์ง€ ์•Š์œผ๋‹ˆ ๋” ํšจ์œจ์ ์ด๊ฒ ์ฃ ?

์šฐ์„  ๊ณ„์ˆ˜๊ฐ€ 1์ธ ํ–‰๋ ฌ $A_i \in \mathbb{R} ^ {m \times n}$ ์„ ์ง๊ตํ•˜๋Š” ํ–‰๋ ฌ $U$ ์™€ $V$ ์˜ $i$ ๋ฒˆ์งธ ๋ฒกํ„ฐ์˜ ์™ธ์ ์œผ๋กœ ๊ตฌํ•ฉ๋‹ˆ๋‹ค.

\[A_i \coloneqq u_i v_i^{\top}\]

๊ณ„์ˆ˜๊ฐ€ $r$ ์ธ ํ–‰๋ ฌ $A \in \mathbb{R}^{m \times n}$ ์€ ๊ณ„์ˆ˜๊ฐ€ 1์ธ ํ–‰๋ ฌ์˜ ํ•ฉ์œผ๋กœ ์•„๋ž˜์™€ ๊ฐ™์ด ํ‘œํ˜„ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

\[A = \sum_{i=1}^{r} \sigma_i u_i v_i^{\top} = \sum_{i=1}^{r} \sigma_i A_i\]

์ด๋Ÿฌ๋ฉด ์™ธ์  ํ–‰๋ ฌ $A_i$ ๋Š” $i$ ๋ฒˆ์งธ ํŠน์ด๊ฐ’ $\sigma_i$ ๋กœ ๊ฐ€์ค‘๋ฉ๋‹ˆ๋‹ค. ์™œ ์œ„์˜ ์‹์ด ์„ฑ๋ฆฝํ• ๊นŒ์š”? ํŠน์ด๊ฐ’ ํ–‰๋ ฌ $\Sigma$ ๊ฐ€ ๋™์‹œ์— ๋Œ€๊ฐํ–‰๋ ฌ์ด๊ธฐ ๋•Œ๋ฌธ์— $i$ ๋ฒˆ์งธ ์ขŒ์šฐ ์ง๊ต ๋ฒกํ„ฐ๋“ค์ธ $u_i v_i^{\top}$ ๋งŒ์„ ๊ฐ€์ ธ์˜ค๊ณ  ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ $i$ ๋ฒˆ์งธ ํŠน์ด๊ฐ’ $\sigma_i$ ๋กœ scale ํ•˜๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค. ๋‹ค์‹œ ๋งํ•˜๋ฉด, ๋ชจ๋“  $\Sigma_{ij} u_i v_j^{\top}$ ๋Š” $i \neq j$ ๋ฉด $\Sigma$ ๊ฐ€ ๋Œ€๊ฐํ–‰๋ ฌ์ด๊ธฐ ๋•Œ๋ฌธ์— ์‚ฌ๋ผ์ง‘๋‹ˆ๋‹ค. $i > r$ ์ธ ๊ฐ’๋“ค๋„ ํ•ด๋‹นํ•˜๋Š” ํŠน์ด๊ฐ’์ด $0$ ์ด๊ธฐ ๋•Œ๋ฌธ์— ์‚ฌ๋ผ์ง‘๋‹ˆ๋‹ค.

์ด์ œ ๊ณ„์ˆ˜๊ฐ€ 1์ธ $A_i$ ์™€ $r$ ๊ฐœ์˜ $A_i$ ๋ฅผ ํ•ฉ์ณ ๊ณ„์ˆ˜๊ฐ€ $r$์ธ ํ–‰๋ ฌ $A$ ๋ฅผ ๊ตฌํ–ˆ์Šต๋‹ˆ๋‹ค. $i = 1, \dots , r$ , ์ฆ‰ ๋ชจ๋“  ๊ณ„์ˆ˜ ํ•จ์ˆ˜ $A_i$ ๋ฅผ ํ•ฉ์น˜์ง€ ์•Š๊ณ , ์ค‘๊ฐ„์— ๋ฉˆ์ถฐ $k < r$ ์ด๋ฉด, ๊ณ„์ˆ˜๊ฐ€ $k$ ์ธ $A$ ์˜ ๊ทผ์‚ฌ ํ–‰๋ ฌ์„ ์–ป๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.

\[\hat{A} (k) = \sum_{i=1}^{k} \sigma_i u_i v_i^{\top} = \sum_{i=1}^{k} \sigma_i A_i\]

์›๋ž˜ ํ–‰๋ ฌ $A$ ์™€ ๊ณ„์ˆ˜๊ฐ€ $k$ ์ธ ๊ทผ์‚ฌ ํ–‰๋ ฌ $\hat{A}(k)$ ์˜ ์ฐจ์ด (์—๋Ÿฌ)๋ฅผ ๊ตฌํ•˜๋ ค๋ฉด norm์˜ ๊ฐœ๋…์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ์„น์…˜ 3.1์—์„œ ๋ฒกํ„ฐ์˜ ๊ธธ์ด๋ฅผ ๊ตฌํ•˜๋Š” ๋ฐ ์ด๋ฏธ ํ™œ์šฉํ–ˆ์—ˆ์ฃ . ๊ทธ๋Ÿผ ํ–‰๋ ฌ์—์„œ์˜ norm์„ ์ •์˜ํ•ด๋ด…์‹œ๋‹ค.

์ •์˜ 4.23: ํ–‰๋ ฌ์˜ Spectral Norm

$x \in \mathbb{R}^{n} \backslash { 0 }$ ์ผ ๋•Œ, ํ–‰๋ ฌ $A \in \mathbb{R} ^ {m \times n}$ ์˜ spectral norm ์€

\[{\left\| A \right\|}_2 \coloneqq \max_{x} \frac{ {\left\| Ax \right\|_2}{ {\left\| x \right\|}_2}\]

๋กœ ์ •์˜๋ฉ๋‹ˆ๋‹ค. ๊ทธ๋ฆฌ๊ณ  ๋ฒกํ„ฐ์˜ ์œ ํด๋ฆฌ๋“œ ๋…ธ๋ฆ„์„ ํ‘œ๊ธฐํ•  ๋•Œ์ฒ˜๋Ÿผ (์ˆ˜์‹์˜ ์˜ค๋ฅธ์ชฝ), ์—ฌ๊ธฐ์„œ ํ–‰๋ ฌ์˜ ์•„๋ž˜ ์ฒจ์ž ํ‘œ๊ธฐ๋ฒ• (์ˆ˜์‹์˜ ์™ผ์ชฝ)์„ ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค.

์ •๋ฆฌ 4.24: $A$ ์˜ spectral norm์€ ์ž์‹ ์˜ ๊ฐ€์žฅ ํฐ $\sigma_1$

์ด ์ •๋ฆฌ์˜ ์ฆ๋ช…์„ ๊ณผ์ œ๋กœ ๋‚ด๊ฒ ์Šต๋‹ˆ๋‹ค.

todo <> (https://en.wikipedia.org/wiki/Low-rank_approximation ์ดํ•ดํ•˜๊ธฐ)

์ •๋ฆฌ 4.25: Eckart-Young ์ •๋ฆฌ (Eckart and Young, 1936)