두 정사각 행렬 A, B에 대하여 방정식
$B=P^{-1}AP$
를 만족하는 대각행렬 B와 가역행렬 P가 존재하면,
행렬 A는 대각화 가능 행렬이라고 한다.
또한 이 경우 행렬 P는 A를 대각화한다고 한다.
임의의 정사각 행렬 A를 대각행렬로 만드는 방법은 다양하다. 예를들어,
\(\begin{bmatrix}1 & 2 \\0 & 1 \end{bmatrix}\)라는 행렬을 대각행렬로 만드는 방법은 잠깐 생각해봐도,
1) \(\begin{bmatrix}1 & 2 \\0 & 1 \end{bmatrix} - \begin{bmatrix}0 & 2 \\0 & 0 \end{bmatrix} = \begin{bmatrix}1 & 0 \\0 & 1 \end{bmatrix}\)
2) \(\begin{bmatrix}1 & 2 \\0 & 1 \end{bmatrix} \times \begin{bmatrix}1 & -2 \\0 & 1 \end{bmatrix} = \begin{bmatrix}1 & 0 \\0 & 1 \end{bmatrix}\)
등등 굉장히 많다.
그럼에도 불구하고, 대각화는 왜 굳이 어색하게도,
$B=P^{-1}AP$
이렇게 정의가 되었을까?
jryoungw[링크]와 대화를 통해 얻은 깨달음은 다음과 같다.
우리는 임의의 정사각 행렬 A를 대각행렬로 만들고 싶다.
그러나 행렬 A의 본질을 잃어버리면 안된다.
즉, 선형대수학에서 대각화의 의미는
“수학적으로 행렬의 본질을 잃지 않으면서,
공학적으로 다루기 편한 대각행렬로 만드는 것이다.”
먼저 시작하기 전에, $n\times n$ 가역행렬의 의미부터 다시 생각해 보자.
$n\times n$ 가역행렬이란 문자그대로는 역행렬을 가지는 행렬이다.
그러나 또 다른 의미가 있다.
$A$라는 $n\times n$ 가역행렬에서
표준단위벡터 $e_{1}=(1,0,…,0)$,…,$e_{n}=(0,0,…,1)$을 곱하여 나온
$b_{1}=Ae_{1}$,…,$b_{n}=Ae_{n}$을 생각할 수 있다.
가역행렬의 행은 선형독립이므로 —-[참고2]
$b_{1},…,b_{n}$ 또한 선형독립이다.
n차원 벡터공간에서 n개의 벡터들이 선형독립이므로
$b_{1},…,b_{n}$는 n차원 벡터공간의 기저가 된다.
즉, $n\times n$ 가역행렬은 기저바꾸기 함수이다
$V_{origin}$와 $V_{origin}’$은 n차원 벡터공간이며,
각 기저집합을 $\mathfrak{E_{1}}$, $\mathfrak{E_{2}}$라고 하자.
$V_{new}$와 $V_{new}’$는 m차원 벡터공간이며,
각 기저집합을 $\mathfrak{F_{1}}$, $\mathfrak{F_{2}}$라고 하자.
$P_{n}$은 임의의 $n\times n$ 가역행렬이며
n차원 벡터공간에서 기저를 $\mathfrak{E_{1}}$에서 $\mathfrak{E_{2}}$로 바꿔주는 행렬이다.
$Q_{m}$은 임의의 $m\times m$ 가역행렬이며
m차원 벡터공간에서 기저를 $\mathfrak{F_{1}}$에서 $\mathfrak{F_{2}}$로 바꿔주는 행렬이다.
즉, $P_{n}$과 $Q_{m}$는 각각 n차원, m차원 벡터의 표현만 바꿔주는 행렬이라는 것이다.
$A$는 임의의 $n\times m$ 행렬이며
$V_{origin}$에서 $V_{new}$로의 선형사상이다.
n차원 벡터 v를
기저 $\mathfrak{E_{1}}$로 표현한 것을 A로 선형사상 시키든
기저 $\mathfrak{F_{1}}$로 표현한 것을 B로 선형사상 시키든
결과는 각각 기저 $\mathfrak{E_{2}}$, $\mathfrak{F_{2}}$로 표현한
같은 m차원 벡터v’가 된다.
따라서, 행렬$B$는 행렬$A$와 표현만 바뀌었을 뿐, 본질적으로는 같은 행렬(=선형사상)이다.
선형사상의 합성은 행렬 곱으로 나타낼 수 있으며,
$A=Q_{m}^{-1}BP_{n}$이다.
대각화의 정의를 다시 살펴보면 다음과 같다.
두 정사각 행렬 A, B에 대하여 방정식
$B=P^{-1}AP$
를 만족하는 대각행렬 B와 가역행렬 P가 존재하면,
행렬 A는 대각화 가능 행렬이라고 한다.
또한 이 경우 행렬 P는 A를 대각화한다고 한다.
이제 우리는 행렬의 대각화를 왜 이렇게 정의 했는 지 알 수 있다.
위에서 봤듯이, 행렬$A$와 행렬$B$는 본질적으로 같은 행렬(=선형사상)이다.
위에서 살펴본 대각화의 의미,
“수학적으로 행렬의 본질을 잃지 않으면서,
공학적으로 다루기 편한 대각행렬로 만드는 것이다.”
를 정확히 살린 정의임을 알 수 있다.
두 정사각 행렬 A, B에 대하여 방정식
$B=P^{-1}AP$
를 만족하는 가역행렬 P가 존재하면,
A, B는 서로 닮은 행렬이라고 한다.
이때 서로닮은 행렬은 다음과 같은 성질을 공유한다.
1) 행렬식
2) 가역성
3) rank
4) nullity
5) 고유다항식
6) 고윳값
7) 고유공간의 차원
8) 대각성분들의 합
9) 대수적 중복도
10) 기하적 중복도
…
선형대수학의 기본정리에 따라 행렬은 선형사상이다.
행렬을 선형사상으로 보고 기하적 직관을 이용하면
‘납작해지는’ 선형사상은 그 과정에서 정보가 소실되기 때문에 역사상이 존재할 수 없다.
따라서 가역행렬은 ‘납작해지지 않는’ 선형사상이어야 하며
모든 행은 선형독립이어야 한다.
혹시 이해가 되지 않는 부분이 있다면 코멘트를 남겨주세요!