2.6 기저와 계수
Chapter 6 : Basis and Rank
Chapter 2-1 과 Chapter 2-3 에서 선형방정식 $Ax = b$의 해의 종류는 없거나, 유일하거나, 무한한 해가 존재한다는 것과 해를 직접적으로 구하는 방법까지 소개하였다.
그렇다면 우리가 선형 방정식 $Ax=b$의 해를 구할 수 있을 때와 없을 때의 차이는 무엇일까?
이것을 설명하기 위해서 이번 챕터에서는 행렬 $A$가 갖는 특징에 대해 소개한다.
생성집합과 기저
$A$ = {$x_1, x_2, \cdots , x_k$}의 원소들의 선형결합으로 표현할 수 있는 벡터 공간 $V$를 span[$A$] 또는 span$[x_1, x_2, \cdots , x_k]$라고 하며1, 이때 $A$를 벡터 공간 $V$의 생성집합(Generating Set)이라고 한다.
또한, 벡터 공간 $V$의 생성집합으로 가능한 집합 중에서 가장 작은 집합(가장 적은 원소의 개수를 가진 집합)을 $V$의 기저(basis)라고 하며, 기저 $B$는 다음은 특징이 있다.
- $B$는 $V$에 속한 선형 독립인 벡터를 최대로 갖는다. 즉, 임의의 벡터를 추가하면 $B$는 선형 종속(linear dependent)이 된다.
- $V$를 span하는 기저 $B$는 유일하지 않지만, $B$의 원소(basis vector)의 개수는 일정하다.
- $V$에 속하는 모든 벡터는 $B$의 원소(basis vector)들의 선형 결합으로 표현 가능하며, 그 표현은 유일하다. 즉, $\exists \psi_{i}, \lambda_{i}$ for $x = \displaystyle\sum_{i=1}^{k}{\lambda_{i} \bf{b_{i}}} = \displaystyle\sum_{i=1}^{k}{\psi_{i} \bf{b_{i}}} \Leftrightarrow \lambda_{i} = \psi_{i} (i=1,2, \cdots, k)$.
기저 $B$와 $B$가 span하는 벡터 공간 $V$에 대해 $V$의 차원(dimension)을 $\bf{dim(V)}$라 하고, $n(B)$ (basis vector의 개수)로 정의한다. 즉, $dim(V) = n(B)$. 2
생성집합, span, 기저에 대해서 다음 예시를 통해서 살펴보자.
예시
다음과 같은 $\mathbb{R}^{2}$에 속하는 벡터를 원소로 갖는 집합
\[A = \left\{ \begin{bmatrix} 1\\0 \end{bmatrix} , \begin{bmatrix} 0\\1 \end{bmatrix} , \begin{bmatrix} 8\\2 \end{bmatrix} , \begin{bmatrix} -4\\12 \end{bmatrix} \right\}\]에 대하여 $\begin{bmatrix} \lambda \\ \psi \end{bmatrix} ~for~ \forall \lambda, \psi \in \mathbb{R} $는 다음과 같이 벡터들의 선형결합으로 표현가능하다.
\[\lambda \begin{bmatrix} 1\\0 \end{bmatrix} + \psi \begin{bmatrix} 0\\1 \end{bmatrix} + 0 \begin{bmatrix} 8\\2 \end{bmatrix} + 0 \begin{bmatrix} -4\\12 \end{bmatrix}\]즉, $span[A] = \mathbb{R}^{2}$ 이며, 집합 $A$는 $\mathbb{R}^{2}$의 생성집합이다.
그러나 \(\begin{bmatrix} 1\\0 \end{bmatrix} , \begin{bmatrix} 0\\1 \end{bmatrix}\)만 있어도 모든 $\mathbb{R}^2$의 원소를 표현할 수 있기 때문에 집합 $A$는 가장 작은 생성 집합이 아니므로 기저가 아니다.
표준 기저
실수 공간 $\mathbb{R}^n$ 또는 허수 공간 $\mathbb{C}^n$과 같은 좌표 공간(coordinate vector space)의 표준 기저(canonical basis)는 한 개의 1과 나머지는 0으로 채워진 벡터들로 이루어진 집합이다.
예를 들어 3차원 공간을 span하는 표준 기저는 \(B = \left\{ \begin{bmatrix} 1\\0\\0 \end{bmatrix}, \begin{bmatrix} 0\\1\\0 \end{bmatrix}, \begin{bmatrix} 0\\0\\1 \end{bmatrix} \right\}\) 이다.
$n$ 차원 벡터공간의 표준 기저는 일반적으로 $\vec{e_1}, \vec{e_2}, \cdots, \vec{e_n}$으로 표현한다.
Chapter 3-6에서 정규직교화 기저(Orthogonal basis)를 다루겠지만, 표준 기저를 일반적으로 사용하는 이유는 정렬되어 있고(ordered), 정규직교화 벡터이기 때문이다.
기저를 구하는 법
생성집합 {$x_1, x_2, x_3, \cdots , x_m$}가 span하는 벡터 공간 $V$의 기저 $B$는 다음과 같은 과정을 통해 구할 수 있다.
-
생성집합의 각 원소 벡터들이 행렬 $A$의 열(column)이 되도록 A를 만든다.
-
$A$의 행 사다리꼴(row-echelon form)을 구한다.
-
기저 $B$는 $A$의 pivot column들의 집합이다.
위의 과정을 아래 예시 2.8과 함께 알아보자.
예시 2.8
벡터 부분공간 $U \subseteq \mathbb{R}^5$를 span하는 벡터 $x_1, x_2, x_3, x_4$가 다음과 같을 때,
\[x_1 = \begin{bmatrix} 1\\2\\-1\\-1\\-1 \end{bmatrix} , x_2 = \begin{bmatrix} 2\\-1\\1\\2\\-2 \end{bmatrix} , x_3 = \begin{bmatrix} 3\\-4\\3\\5\\-3 \end{bmatrix} , x_4 = \begin{bmatrix} -1\\8\\-5\\-6\\1 \end{bmatrix} \in \mathbb{R}^5\]$x_1, x_2, x_3, x_4$가 $U$의 basis vector인지 판단하려면 서로가 선형 독립인지 확인해야 한다. 그러기 위하여 homogeneous system, 즉
\[\displaystyle\sum_{i=1}^{4}{\lambda_{i} \bf{x_{i}}} = \bf{0}\]의 해를 구했을 때, $\lambda_{i} = 0$를 반드시 만족해야 하는 $\lambda_{i}$ (basic variable)을 구별하여 선형 독립성을 확인할 수 있다.
- $x_1, x_2, x_3, x_4$를 하나의 행렬 $A$로 만들면
\[A = [x_1, x_2, x_3, x_4] = \begin{bmatrix} 1 & 2 & 3 & -1 \\ 2 & -1 & -4 & 8 \\ -1 & 1 & 3 & 5 \\ -1 & 2 & 5 & -6 \\ -1 & -2 & -3 & 1 \end{bmatrix}\]- 행렬 $A$를 행 사다리꼴(row-echelon form)으로 변형하면
\[\begin{bmatrix} 1 & 2 & 3 & -1 \\ 2 & -1 & -4 & 8 \\ -1 & 1 & 3 & 5 \\ -1 & 2 & 5 & -6 \\ -1 & -2 & -3 & 1 \end{bmatrix} \quad \rightarrow \cdots \rightarrow \quad \begin{bmatrix} 1 & 2 & 3 & -1 \\ 0 & 1 & 2 & -2 \\ 0 & 0 & 0 & 1 \\ 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 \end{bmatrix}\]- 따라서 basis vector는
\[\small{ \begin{bmatrix} 1\\0\\0\\0\\0 \end{bmatrix}, \begin{bmatrix} 2\\1\\0\\0\\0 \end{bmatrix}, \begin{bmatrix} -1\\-2\\1\\0\\0 \end{bmatrix} }\]이며, {$x_1, x_2, x_4$}도 $U$의 기저이다.
행렬의 계수
행렬 $A \in \mathbb{R}^{m \times n}$에 대하여 행렬 $A$의 계수(Rank)는 $rank(A)$ 또는 $rk(A)$로 표현하며, 선형 독립인 열의 개수 또는 선형 독립인 행의 개수와 같다.
행렬의 계수는 다음과 같은 중요한 성질들을 가지고 있다.
$rk(A) = rk(A^T)$. 즉, 열계수(column rank)와 행계수(row rank)가 같다.
행렬 $A \in \mathbb{R}^{m \times n}$의 열들이 span하는 부분공간 $U \subseteq \mathbb{R}^m$에 대해 $dim(U) = rk(A)$이다. 위의 예시 2.8에서처럼 가우스 소거법으로 $U$의 기저를 구할 수 있다.
행렬 $A \in \mathbb{R}^{m \times n}$의 행들이 span하는 부분공간 $W \subseteq \mathbb{R}^n$에 대해 $dim(W) = rk(A)$이다. 마찬가지로 가우스 소거법으로 $W$의 기저를 구할 수 있다.
모든 $n \times n$ 정사각행렬 $A \in \mathbb{R}^{n \times n}$에 대해 A가 가역행렬(invertible)이기 위한 필요충분조건은 $rk(A) = n$이다.
행렬 $A \in \mathbb{R}^{m \times n}$과 벡터 $b \in \mathbb{R}^m$에 대해 $Ax = b$의 해가 존재하기 위한 필요충분조건은 $rk(A) = rk(A | b)$이다. 즉, $A$의 column basis vector들로 b를 표현할 수 있다.
행렬 $A \in \mathbb{R}^{m \times n}$에 대해 $Ax = 0$의 해가 표현하는 부분공간 $S$의 차원 $dim(S) = n - rank(A)$이다.
행렬 $A \in \mathbb{R}^{m \times n}$에 대해 free column 또는 free row가 없을 경우, 즉 $rk(A) = min(m,n)$을 만족하면 full rank라고 하며, $rk(A) < min(m,n)$인 경우 rank deficient라고 한다.
Chapter 2-7에서 다루겠지만, 성질 2 에서 정의된 부분공간 $U$을 상공간(Image 또는 range) 또는 A의 열공간(column space)라고 하며, 성질 6 의 부분공간 $S$를 핵공간(kernel) 또는 $A$의 영공간(null space)라고 한다.
-
span은 ‘포괄하다’라는 뜻을 가지고 있다. 즉, span[$A$]는 $A$의 vector들의 선형결합으로 표현할 수 있는(포괄하는) 영역을 의미하며, ‘벡터 공간 $V$를 span한다’는 것은 벡터들의 선형결합으로 $V$ 안의 모든 벡터를 표현가능하다는 뜻이다. ↩
-
$V$의 차원은 basis vector의 차원으로 결정되지 않는다. 즉, \(\left\{ \begin{bmatrix} 1\\0 \end{bmatrix} \right\}\) 가 span하는 공간 $V \in \mathbb{R}^{2}$의 차원 $dim(V)$은 1이다. ↩