대각화: AX=X\Lambda

Section 6.2 대각화: \(AX=X\Lambda\)

Subsection 6.2.1 고유벡터

\(V\)는 벡터공간이고 \(T \colon V \to V\)는 선형변환이라 하자. \(\boldsymbol v \in V\)에 \(T\)를 적용한 결과는 때에 따라 괄호를 생략하고 \(T\boldsymbol v\)로 나타낸다. \(V=\mathbf R^n\)이고 \(T\)가 \(n \times n\)행렬에 의해 주어진 경우, \(A\)를 이용해 대응 \(\boldsymbol v \mapsto A\boldsymbol v\)으로 주어진 선형변환을 표기한다.

정의 6.2.1.

영이 아닌 벡터 \(\boldsymbol v\in V\)가 적당한 스칼라 \(\lambda\)에 대하여

\begin{equation*} T\boldsymbol v = \lambda \boldsymbol v \end{equation*}

를 만족하면, \(\boldsymbol v\)를 (\(T\)의) 고유벡터라 부른다.

보조설명 6.2.2.

고유벡터의 정의에서 등장하는 스칼라 \(\lambda\)는 고윳값이라고 부른다. 정의 6.2.8를 참조하라.

\(\boldsymbol v\)가 고유벡터인 것을 다르게 표현해보면

\begin{equation*} T\boldsymbol v \in \operatorname{span}(\boldsymbol v) \end{equation*}

이다. 또 다른 표현 방법으로는 “\(\boldsymbol v \)와 \(T\boldsymbol v\)가 평행하다.”가 있다.

예시 6.2.3. 미분의 고유벡터.

\(e^x\)는 \(T=\frac{d}{dx}\)의 고유벡터이다.

예시 6.2.4. 평행이동의 고유벡터.

\(\cos(x)\)는 평행이동 \(f(x)\mapsto f(x+2\pi)\)의 고유벡터이다. 절반의 평행이동 \(f(x)\mapsto f(x+\pi)\)의 고유벡터이기도 하다.

예시 6.2.5. 정사영의 고유벡터.

\(P \colon \mathbf R^n \to \mathbf R^n\)을 부분공간 \(S \subset \mathbf R^n\)으로의 정사영이라 하자. \(\boldsymbol v \in S\)이면 \(\boldsymbol v\)은 \(P\)의 고유벡터이다. 한편, \(\boldsymbol v \in S^\perp\)이어도 \(P\)의 고유벡터이다.

Subsection 6.2.2 고유벡터와 대각화의 필요충분조건

명제 6.2.6.

고유벡터로 구성된 기저가 있으면 \(T\)는 대각화 가능하다.

예시 6.2.7.

Subsection 6.2.3 고유벡터 부족

고유벡터가 부족해 대각화가 불가할 수 있다.

\begin{equation*} \begin{bmatrix} 0\amp0\\1\amp0 \end{bmatrix} \end{equation*}

의 고유벡터를 모두 모아보면 모두 \(y\)축 위에 있다. 이런 벡터로는 \(\mathbf R^2\)의 기저를 찾을 수 없다.

Subsection 6.2.4 고윳값

정의 6.2.8.

스칼라 \(\lambda\)가 적당한 영이 아닌 벡터 \(\boldsymbol v \in V\)에 대하여 \(T\boldsymbol v = \lambda \boldsymbol v\)를 만족하면 \(\lambda\)를 (\(T\)의) 고윳값이라고 한다.

명제 6.2.9.

다음은 스칼라 \(\lambda\)가 행렬 \(A\)의 고윳값일 필요충분조건이다.

\(\det\left(A-\lambda I\right)=0\text{.}\)
\(\lambda\)는 \(x\)에 관한 다항식 \(\det \left(A-x I\right)\)의 근이다.

증명.

스칼라 \(\lambda\)가 행렬 \(A\)의 고윳값인 것과 \(\det\left(A-\lambda I\right)=0\)이 동치인 것은 정리 5.2.1를 \(A-\lambda I\)에 적용하여 얻는다.

한편, \(\det\left(A-\lambda I\right)\)은 다항식 \(\det \left(A-x I\right)\)에 \(x=\lambda\)를 대입한 것이므로, 나열된 두 조건도 동치이다.

정의 6.2.10.

\(\det\left(A-x I\right)\)를 \(A\)의 특성다항식이라 한다.

보조설명 6.2.11. 특성다항식과 특성방정식.

정의 6.2.10에 따르면 특성다항식은 \(A\)의 크기에 따라 최고차항의 부호가 바뀐다. 최고차항의 계수를 1으로 표준화하는 관습에 따라 \(\det\left(x I-A\right)\)을 특성다항식이라고 정의하기도 한다. 두 관습은 부호만큼 차이가 나며, \(A\)가 \(n \times n\)행렬일 때

\begin{equation*} \det\left(A-x I\right) = (-1)^n\det\left(x I-A\right) \end{equation*}

이 성립한다. 한편, 특성방정식이란

\begin{equation} \det\left(A-x I\right)=0\tag{6.2.1} \end{equation}

을 말한다. 특성방정식의 경우

\begin{equation*} \det\left(A-x I\right)=0 \Leftrightarrow \det\left(x I-A\right)=0 \end{equation*}

이므로 어떤 관습을 따르더라도 그 의미는 같다.

정의 6.2.12.

\(\det(A)=0\)이면 \(A\)를 특이행렬이라 한다.

명제 6.2.13.

\(n \times n\)행렬의 특성방정식의 차수는 \(n\)이다.

증명.

연습문제 6.2.6.

예시 6.2.14. 대각행렬의 특성다항식.

행렬

\begin{equation*} \begin{bmatrix} 1 \amp 0 \\ 0 \amp 2 \end{bmatrix} \end{equation*}

의 특성다항식은 정의에 따르면

\begin{equation*} \det\begin{bmatrix} 1 -x \amp 0 \\ 0 \amp 2-x \end{bmatrix} \end{equation*}

이다. 대각행렬의 행렬식은 대각성분을 곱해 얻어지므로

\begin{equation*} \det\begin{bmatrix} 1 -x \amp 0 \\ 0 \amp 2-x \end{bmatrix}= (1-x)(2-x) \end{equation*}

이다.

예시 6.2.15. 회전변환과 특성다항식의 복소해.

특성다항식은 복소해를 가질 수 있다. 회전 변환을 생각해보라.

명제 6.2.16.

\(\det A=0\)일 필요충분조건은 \(\lambda=0\)이 교윳값인 것이다.

증명.

먼저 \(\det A=0\)이면 \(\lambda=0\)이 고윳값임을 보이자. 정리 5.2.1에 따르면 \(\det A=0\)이면 \(A\)의 열벡터는 선형의존이다. 즉, \(\boldsymbol x \not = 0\)이고 \(A\boldsymbol x=0\)인 벡터 \(\boldsymbol x\)가 존재한다. 식 \(A\boldsymbol x=0\)을 \(A\boldsymbol x=0\boldsymbol x\)로 다시 쓰면 \(\boldsymbol x\)가 고윳값 \(\lambda=0\)에 해당하는 고유벡터가 됨을 안다.

반대로 \(\lambda=0\)이 고윳값이라면 대응되는 고유벡터 \(\boldsymbol x\)는 \(\boldsymbol x\not=0\)이고 \(A\boldsymbol x=0\)이므로 \(A\)의 열벡터는 선형독립이다. 역시 정리 5.2.1를 이용하면 \(\det A \not =0\)임을 안다.

Subsection 6.2.5 고윳값과 대각화

서로 다른 교윳값에 대응되는 고유벡터는 선형독립이다. 간단한 경우를 먼저 살피자. 1과 2를 고윳값으로 갖는 행렬 \(A\)를 생각해보자. 대응되는 고유벡터를 \(\boldsymbol x, \boldsymbol y\)라 하면

\begin{equation} A\boldsymbol x = \boldsymbol x,\hspace{10pt} A\boldsymbol y = 2 \boldsymbol y\tag{6.2.2} \end{equation}

이 성립한다. 이 때, \(\boldsymbol x\)와 \(\boldsymbol y\)는 선형독립일까? 만약

\begin{equation} a \boldsymbol x + b \boldsymbol y =0\tag{6.2.3} \end{equation}

이 성립한다면 \(A-I\)를 양변에 곱해

\begin{equation*} (A-I)(a\boldsymbol x + b \boldsymbol y)= 0 \end{equation*}

를 얻는데, 좌변을 전개하여 (6.2.2)를 이용하면

\begin{equation*} (A-I)(a\boldsymbol x + b \boldsymbol y)= a(\boldsymbol x - \boldsymbol x) + b(2\boldsymbol y-\boldsymbol y)= b\boldsymbol y \end{equation*}

를 얻는다. 종합하면 \(b\boldsymbol y=0\)인데, \(\boldsymbol y \not = 0\)이므로 \(b=0\)을 얻는다. 한편, (6.2.3)에 \(A-2I\)을 곱하면 비슷한 과정을 통해 \(a=0\)을 얻는다. (6.2.3)로부터 \(a=b=0\)을 얻었으므로 \(\boldsymbol x,\boldsymbol y\)는 선형독립이다.

정리 6.2.17.

\(n\times n\)행렬 \(A\)가 \(n\)개의 서로 다른 고윳값을 가지면, 기저로 이루어진 고유벡터를 갖는다.

증명.

서로 다른 고윳값을 \(\lambda_1,\cdots,\lambda_n\)이라 하고 대응되는 고유벡터를 택하여 \(\boldsymbol x_1,\cdots,\boldsymbol x_n\)라 하자. \(\boldsymbol x_1,\cdots,\boldsymbol x_n\)이 선형독립임을 보이면 충분하다.

스칼라 \(a_1,\cdots,a_n\)에 대하여

\begin{equation} a_1\boldsymbol x_1+ \cdots + a_n \boldsymbol x_n=0\tag{6.2.4} \end{equation}

이라 가정하자. 원하는 것은 \(a_n=0\)이다. 이를 보이기 위해 양변에

\begin{equation} (A-\lambda_1I)(A-\lambda_2I)\cdots(A-\lambda_{n-1}I)\tag{6.2.5} \end{equation}

를 곱하자. 예비작업으로, 각 \(i=1,2,\cdots,n\)에 대하여

\begin{align*} \amp (A-\lambda_1I)(A-\lambda_2I)\cdots(A-\lambda_{n-i}I) \boldsymbol x_i \\ = \amp (\lambda_i-\lambda_1)(\lambda_i-\lambda_2)\cdots(\lambda_i-\lambda_{n-i}) \boldsymbol x_i \end{align*}

인 것을 관찰하자. 이로부터 \(i<n\)일 때

\begin{equation*} (A-\lambda_1I)(A-\lambda_2I)\cdots(A-\lambda_{n-1}I)\boldsymbol x_i=0 \end{equation*}

을 얻는다. 이를 적용하면 (6.2.4)에 (6.2.5)를 곱한 결과는

\begin{equation*} a_n(\lambda_n-\lambda_1I)(\lambda_n-\lambda_2I)\cdots(\lambda_n-\lambda_{n-i}I) \boldsymbol x_n =0 \end{equation*}

인데, 고윳값이 서로 다르므로

\begin{equation*} (\lambda_n-\lambda_1)(\lambda_n-\lambda_2)\cdots(\lambda_n-\lambda_{n-i}) \not = 0 \end{equation*}

이고 \(\boldsymbol x_n\not = 0\)이므로 \(a_n=0\)을 얻는다.

\(i<n\)에 대해서도 비슷한 방법으로 \(a_i=0\)을 얻는다. 종합하여 \(\boldsymbol x_1,\cdots,\boldsymbol x_n\)이 선형독립임을 안다.

연습문제 6.2.6 명제 6.2.13의 증명

명제 6.2.13을 증명해보자. 여기서 다항식이란 변수 \(x\)에 대한 다항식을 뜻한다. (\(x\)에 관한) 다항식의 차수는 \(\deg\)라고 나타내고, 영다항식의 차수는 \(-\infty\)라고 하자.

1.

\(f,g\)가 다항식이고

\begin{equation*} \deg(f)>\deg(g) \end{equation*}

이면

\begin{equation*} \deg(f+g)=\deg(f) \end{equation*}

임을 보여라.

2.

\(f,g\)가 다항식이면

\begin{equation*} \deg(f+g) \le \max\left\{\deg(f),\deg(g)\right\} \end{equation*}

임을 보여라. (단, \(\max\left\{a,b\right\}\))는 \(a,b\)중 크지 않은 것을 나타낸다.)

3.

\(A\)가 \(n\times n\)행렬일 때, \(A-xI\)의 행렬식을 치환을 이용한 정의 (5.1.10)를 이용하여 나타내자. 등장하는 \(n!\)의 항 중에서 단 하나만 \(n\)차식이고, 나머지 \((n!-1)\)개 항은 그 차수가 \(n\)미만임을 보여라.

4.

종합하여, \(A\)가 \(n\times n\)행렬일 때, \(A\)의 특성다항식은 \(n\)차식임을 보여라.

Prev Top Next