線型代数第4講
線型空間
【第4講のポイント】
これまでは、数の組(ベクトル)に対する“比例”係数としての行列の働きを調べてきた。本講では、より一般的な枠組みの下で、これらの概念を捉え直す。
【第4講の目標】
学習後、以下のことが身についたかチェックしよう。
- 線型空間の定義を理解し、ベクトルの線型結合・線型独立の概念を理解する
- 線形空間の線型写像・線型変換が、基底を選ぶことによって行列で表現されることを学ぶ
- 固有値と固有ベクトルの概念を理解し、それらの計算や応用ができるようになる
- 数式計算サイトを利用して計算
ができるようになる
【第4講の構成】
- 1節 線型空間の定義
- 2節 線型結合、線型独立
- 3節 線型写像
- 4節 固有値と固有ベクトル
- 5節 計算例・応用例
- 6節 数式計算サイトの利用
本書の見方
- ページをめくる
- 左(右)ページの左(右)端クリックまたはドラッグする
左(右)矢印キーを押す
- 1ページ分の移動
- 左右上端にある[Next]、[Previous]タブをクリックする
- 節の頭に移動
- 右上の【節の移動】タブをクリックし、現れた節を選ぶ
- ページのジャンプ
- 右上のページ番号表示タブをクリックし、現れたページを選ぶ
- 画像の拡大およびリンク先への移動
- 画像やリンク先をクリックすれば、別ウィンドウ(タブ)で表示される
第1節 線型空間の定義
本講では、これまでの議論の本質を抜き出し、より一般的な枠組みで議論することによって定理(理論)の適用範囲を広げることを考える。
ある数学的な対象に対していくつかの定理が得られたとしよう。その証明をチェックして、もとの数学的対象のどのような性質からそれらの定理群が成立つのかを調べる。そしてそれらの性質を持つ「もの」として新たに(名前を付けて)定義し直せば、もとの定理群はそれらの性質を持つすべての数学的対象に対して適用できることになる。
数学の定義(の意味)が分かりにくいのはこのためもある。数学の定義はそこから得られる定理群を成り立たせる「もの」を定義していると理解するとよい。(したがって、定理群を学習しないと定義の意図が見えてこない!)
前講までは数を縦にならべた列ベクトルとその“比例係数”としての(数を縦横に並べた)行列を扱ってきた。そこでは、列ベクトルの和と定数倍がまた列ベクトルになること、そして行列の線型性$A(a\vect{x}+b\vect{y})=aA\vect{x}+bA\vect{y}$が本質的である。
これまで数を実数としてきたが、実は第3講までの議論では四則演算(加減乗除)しかでないので、それで閉じている有理数$\mathbb{Q}$、実数$\mathbb{R}$、複素数$\mathbb{C}$、のどれでもよい。今後は都合上、数は実数または複素数のどちらかであるとして、$\mathbb{K}$と表す。(第3項までの議論は、逆行列など割算が使われる部分を除けば、加減乗が可能な例えば多項式を数として考えても議論できる。)
定義.以下をみたす集合$V$を$\mathbb{K}$上の線型空間、$V$の要素をベクトルという。
(1) $\vect{u},\vect{v}\in V$に対し和 $\vect{u}+\vect{v}\in V$が定義されていて
・$(\vect{u}+\vect{v})+\vect{w}=\vect{u}+(\vect{w}+\vect{v})$(結合的かつ可換)
・$\vect{v}+\vect{o}=\vect{v}$をみたす零ベクトル$\vect{o}$がただ一つ存在する
・$\vect{v}+(-\vect{v})=\vect{o}$をみたす逆元$-\vect{v}$がただ一つ存在する
(2) $\vect{v} \in V$と$a \in \mathbb{K}$に対し、定数倍 $a\vect{v}=\vect{v}a\in V$が定義されていて
・$(a+b)\vect{v}=a\vect{v}+b\vect{v},\ a(b\vect{v})=(ab)\vect{v}$
・$a(\vect{u}+\vect{v})=a\vect{u}+a\vect{v}$
・$1\vect{v}=\vect{v}$
$\mathbb{K}{=}\mathbb{R}$のとき$V$を実線型空間、$\mathbb{K}{=}\mathbb{C}$のとき$V$を複素線型空間という。以後、特に断らない限り$U,V$で線型空間を表す。
例.(1) は前講まで議論してきた対象である。
(1) $\mathbb{K}$を要素とする$n$項列ベクトルの全体${}_n[\mathbb{K}]$
(2) $\mathbb{K}$上の数列の全体
(3) $\mathbb{K}$係数の多項式(一次式)の全体
(4) 平面(空間)の幾何ベクトル(長さと向きを持つ矢印)の全体($\mathbb{K}=\mathbb{R}$)
第2節 線型結合・線型独立
今後の議論の方向を紹介するために、漸化式$x_{n+2}=2x_{n+1}+3x_n$を満たす実数列の全体$V$を考えてみよう。最初の$2$項の値で数列全体が定まるから $\vect{x}_{1,0}{=}\langle1,0,3,6,\dots\rangle,\ \vect{x}_{0,1}{=}\langle0,1,2,7,\dots\rangle$ を使って、$\vect{x}_{a,b}=a\vect{x}_{1,0}+b\vect{x}_{0,1}=$
$\langle a,b,3a{+}2b,6a{+}7b,\cdots\rangle$ と表せ、$V$は実線型空間である。しかしこれでは、数列 $\vect{x}_{1,0},\ \vect{x}_{0,1},\ \vect{x}_{a,b}$ の一般項が分からず$V$の中身が見えてこない。
また、$\vect{x}_{1,0}$と$\vect{x}_{2,0}$の和や定数倍の組合せでは、$2$番目の項が$0$の数列しか表せず、$V$のすべての要素を表すこともできない。
一方、次の数列を選ぶと不思議にも(?)一般項(初項は第0項)が求まる。
$\vect{x}_{1,-1}=\langle1,-1,1,-1,1,\dots\rangle=\left\langle(-1)^n\right\rangle,\ \vect{x}_{1,3}=\langle1,3,9,27,81,\dots\rangle=\left\langle 3^n \right\rangle$
$\displaystyle \therefore\ \vect{x}_{a,b}=\frac{3a-b}{4}\vect{x}_{1,-1}+\frac{a+b}{4}\vect{x}_{1,3}
=\left\langle\frac{3a-b}{4}(-1)^n+\frac{a+b}{4}3^n\right\rangle$
本講ではこのような、線型空間のすべてのベクトルを線型結合(和と定数倍の組合わせ)で表現する“適切な”ベクトル集合を求める問題を扱う。
線型空間$V$のベクトルの列 $\langle\vect{v}_1,\vect{v}_2,\dots,\vect{v}_n\rangle$ を $\langle \vect{v}_j\rangle^n$ または $\langle \vect{v}_j\rangle$ と表す。$V^n:=\{ \langle \vect{v}_j\rangle^n \mid \vect{v}_j\in V\},\ V^*:=\{\langle \vect{v}_j\rangle \mid \vect{v}_j\in V\}=\displaystyle\bigcup_{n=0}^\infty V^n$ と定義し、$\mathbb{K}$上の列ベクトルの集合を ${}_*[\mathbb{K}]:=\{{}_n[c_j] \mid n\ge 0,\ c_j\in \mathbb{K}\}= \displaystyle\bigcup_{n=0}^\infty {}_n[\mathbb{K}]$ と表す。
$\langle \vect{v}_j\rangle^n$ の線型結合を $\color{blue}{\langle \vect{v}_j\rangle^n{}_n[c_j]}=\color{blue}{\langle\vect{v}_j\rangle\vect{c}}:=\sum_
{j=1}^n c_j\vect{v}_j,\ {}_n[c_j]=\vect{c}\in{}_n[\mathbb{K}]$
で定義し、特に、$\langle \ \rangle^0{}_0[\ ]=\vect{o}$ とする。
注.線形空間のベクトルを並べた $\langle \vect{v}_j\rangle^n$ と行列(数の列ベクトルを並べた) $[\vect{a}_j]^n$ の記述の違いに注意しよう。
$W\subseteq V$の(ベクトルの)線型結合の全体$\overline{W}^+$を次で定義する。
$\overline{W}^+:=\left\{\langle\vect{w}_j\rangle\vect{c} \mid \langle \vect{w}_j\rangle \in W^*,\ \vect{c} \in {}_*[\mathbb{K}] \right\}$
$W,X\subseteq V$ とする。以下の定義や事実が成立つ。
・$W\subseteq X \implies \overline{W}^+\subseteq \overline{X}^+$
・$W$が$V$の線型部分空間 $:= \overline{W}^+=W$
・$\overline{W}^+=\overline{\overline{W}^+}^+$は$W$が張る(生成する)$V$の線型部分空間
・$\overline{\emptyset}^+=\{\vect{o}\}$($\emptyset$は空集合)
特に断らない限り以後、線型空間は有限生成、即ちそれに含まれるある有限部分集合で生成されるものとする。
線型空間$V$が$W\subseteq V$で張られる($\overline{W}^+=V$)なら、$V$の任意のベクトルは$W$中のベクトルの線型結合で表される。しかし、$W$中のベクトルがすべて必要か、その表し方は$1$通りか、は別問題で、その判定に有用なのが次の線型独立という概念である。
$W\subseteq V$は $\vect{w}\in W\Rightarrow \overline{W-\{\vect{w}\}}^+\subsetneq \overline{W}^+$ が成立つとき線型独立であるという。これは$\overline{W}^+$を張るのに$W$のどのベクトルも必要不可欠なことを意味する。とくに空集合$\emptyset$は線型独立である。
次の定理より、$\overline{W}^+$の生成に$W$中のベクトルがすべて必要なら、その表し方は$1$通りである。
定理.$W\subseteq V$に対する次の$3$条件は同値である。
(1) $W$は線型独立($\vect{w}\in W\Rightarrow \overline{W-\{\vect{w}\}}^+\subsetneq \overline{W}^+$)
(2) $W$の線型結合は一意的($\langle\vect{w}_j\rangle\vect{c}=\langle\vect{w}_j\rangle\vect{d}\Rightarrow \vect{c}=\vect{d}$)
(3) $X$の線型関係はすべて自明($\langle\vect{w}_j\rangle\vect{c}=\vect{o}\Rightarrow \vect{c}=\vect{o}$)
証明.線型独立でない$\implies$一意的でない線型結合がある$\implies$自明でない線型関係がある$\implies$線型独立でない
線型空間$V$を張る線型独立な部分集合を$V$の基底という。$V$の基底は$V$のベクトルをすべて線型結合で表すのに必要十分な部分集合であり、$V$のベクトルは基底の線型結合で$1$通りに表すことができる。
例.(1) この節の数列の例では $\{\vect{x}_{1,0},\vect{x}_{0,1}\},\ \{\vect{x}_{1,-1},\vect{x}_{1,3}\}$がともに基底。
(2) $n$項列ベクトルの自然な基底は単位列ベクトルの集合$\{\vect{e}_1,\vect{e}_2,\dots.\vect{e}_n\}$。
定理.線型空間は基底を持つ。
証明.線型空間を$V$、$V$を生成する有限集合を$F$とし、$2$通りに証明する。
(1) $F$が線型独立でないとする。$\overline{F-\{\vect{v}\}}^+=\overline{F}^+=V$を満たす$\vect{v}\in F$を選び$F-\{\vect{v}\}$を$F$として議論を繰返せば、$F$は有限だからいつか線型独立になる。
(2) $F$の線型独立な部分集合、例えば$\emptyset$を$G$とおく。$\vect{v}\in F-\overline{G}^+$ならば線型独立な$G\cup\{\vect{v}\}$(下の問)を改めて$G$として議論を繰返せば、$F$は有限だからいつか$\emptyset=F-\overline{G}^+$、即ち$\overline{G}^+=\overline{F}^+=V$となる。
問.$V$を線型空間とする。$W\subseteq V$が線型独立で$\vect{v}\in V-\overline{W}^+$のとき、$W\cup \{\vect{v}\}$も線型独立であることを示せ。
第3節 線型写像
$\mathbb{K}$上の$m\times n$行列の集合を${}_m[\mathbb{K}]^n$と表す。$A\in{}_m[\mathbb{K}]^n$の$\vect{y}=A\vect{x}$における働きは、${}_n[\mathbb{K}]$から${}_m[\mathbb{K}]$への“比例”写像であった。その概念を一般化しよう。
定義.線型空間の間の次の条件を満たす写像$T:U\to V$を線型写像という。
$T(c\vect{u}+\vect{v})=cT(\vect{u})+T(\vect{v})$
特に自分自身への線型写像$T:V\to V$を線型変換という。
$T$が線型写像なら、$T(\langle \vect{v}_j\rangle\vect{c})=\langle T(\vect{v}_j)\rangle\vect{c}$。
例(線型写像・変換)有限生成か、微分可能かなどの議論は無視する。
(1) $A\in{}_m[\mathbb{K}]^n$に対し $T_A:\vect{x}\mapsto A\vect{x}$
(2) 数列で項を$1$ずらす変換 $T:\langle a_0,a_1,\dots\rangle\mapsto\langle a_1,a_2,\dots\rangle$
(3) $1$変数関数の微分 $D:f(x)\mapsto f'(x)$
定義.全単射($1$対$1$かつ上への写像)の線型写像$T:U\to V$を同型写像という。このとき$U$と$V$は同型といい、$U\simeq V$と表す。
$U\simeq V$は、$U$と$V$が線型空間として同じと見做せることを意味する。言い換えれば$U$のベクトルを$V$のベクトルで表現(あるいはその逆も)できる、ということである。
同型写像として最も重要なのは基底(の線型結合)が定める同型写像だろう。平面上の点が座標を導入して$\mathbb{R}^2$で表せるように、線型空間のベクトルは基底を導入すれば列ベクトルで表現できる。
定理.$\mathbb{K}$上の線型空間$V$が基底$J=\langle\vect{j}_j\rangle^n$を持てば、$V\simeq{}_n[\mathbb{K}]$である。
証明.$T_J:\vect{x}\in{}_n[\mathbb{K}]\mapsto \langle\vect{j}_j\rangle^n\vect{x}\in V$ は同型写像である。
注.証明中の$T_J$は基底を構成するベクトルの順番で異なるから、以後、集合としてではなく、$\langle,\ \rangle$で囲む列表記を用いて基底を表す。
定理.$\mathbb{K}$上の線型空間$V$の基底を構成するベクトルの数はすべて等しい。
証明.$V$が$m$ベクトルの基底と$n$ベクトルの基底をもてば${}_m[\mathbb{K}]\simeq V\simeq{}_n[\mathbb{K}]$より、${}_m[\mathbb{K}]\simeq{}_n[\mathbb{K}]$。よって、$m=n$。
線型空間$V$の基底を構成するベクトル数を$V$の次元といい、$\dim V$で表す。
定理.$A\in{}_m[\mathbb{K}]^n$は線型写像$T_A:{}_n[\mathbb{K}]\to{}_m[\mathbb{K}]$を定める。逆に線型写像$T:{}_n[\mathbb{K}]\to{}_m[\mathbb{K}]$は行列$A_T=[T(\vect{e}_j)]^n\in{}_m[\mathbb{K}]^n$で表現($T(\vect{x})=A_T\vect{x}$)できる。
証明.前半は既に述べたことで、$T_A(\vect{x})=A\vect{x}$。後半で、$\vect{e}_j\in{}_n[\mathbb{K}]$は単位ベクトルだから、
$T(\vect{x})=T([\vect{e}_j]^n\vect{x})=[T(\vect{e}_j)]^n\vect{x}$。
$\begin{xy}
\xymatrix@C+1pc{
V \ar@{<->}[d]_{\langle \vect{j}_j\rangle} \ar[r]^T & U \ar@{<->}[d]^{\langle\vect{i}_i\rangle} \\
\mathbb{K}^n \ar[r]_{A={}_m[a_{ij}]^n} & \mathbb{K}^m
}
\end{xy}$
|
この定理から線型写像$T:V\to U$は、各々に基底を導入して行列で表現できる。$V$の基底$\langle \vect{j}_j\rangle^n$と$U$の基底$\langle\vect{i}_i\rangle^m$の下で
$m{\times}n$行列$A$が線型写像$T:V\to U$を表現するというのは$T(\langle\vect{j}_j\rangle^n\vect{x})
=\langle\vect{i}_i\rangle^m(A\vect{x})$が成立つことをいう。$T(\vect{j}_j)=\langle\vect{i}_i\rangle^m{}_m[a_{ij}] (1\le j\le n)$とすれば
$T(\langle\vect{j}_j\rangle^n\vect{x})
=\langle T(\vect{j}_j)\rangle^n\vect{x}
=\langle\langle\vect{i}_i\rangle^m{}_m[a_{ij}]\rangle^n\vect{x}
=\langle\vect{i}_i\rangle^m({}_m[a_{ij}]^n\vect{x})$
であるから、行列 ${}_m[a_{ij}]^n$ が$T$を表す。
定義.$A={}_m[a_{ij}]^n$に対し$\langle\langle\vect{i}_i\rangle^m A\rangle^n:=\langle\langle\vect{i}_i\rangle^m{}_m[a_{ij}]\rangle^n$と定義する。
問.$\langle\langle\vect{i}_i\rangle^m A\rangle^n\vect{x}=\langle\vect{i}_i\rangle^m(A\vect{x})$ を示せ。
定理.線型写像$T:V\to U$に対し、$T(V):=\{T(\vect{v})\mid\vect{v}\in V\}$、$T^{-1}(\vect{o}):=\{\vect{v}\mid T(\vect{v})=\vect{o}\}$と定義する。
$\dim V=\dim T(V)+\dim T^{-1}(\vect{o})$
証明.$V$の基底$\langle\vect{v}_i\rangle^n$を、$\langle \vect{v}_{r+1},\vect{v}_{r+2},\dots,\vect{v}_n\rangle$が線型部分空間$T^{-1}(\vect{o})$の基底となるように選べば、$\langle T(\vect{v}_i)\rangle^{r}$が$T(V)$の基底になる。実際、以下が成立つ。
$T(\langle\vect{v}_i\rangle^n{}_n[c_i])=\langle T(\vect{v}_i)\rangle^n{}_n[c_i]=\langle T(\vect{v}_i)\rangle^r{}_r[c_i]$ より、$T(V)\subseteq \overline{\langle T(\vect{v}_i)\rangle^r}^+$
$\langle T(\vect{v}_i)\rangle^r{}_r[c_i]
%=T(\langle \vect{v}_i\rangle^r{}_r[c_i])
=\vect{o}_n \Rightarrow \langle \vect{v}_i\rangle^r{}_r[c_i]\in T^{-1}(\vect{o})=\overline{\langle \vect{v}_{r+1},\dots,\vect{v}_n\rangle}^+ \Rightarrow
{}_r[c_i]=\vect{o}_r$ より、$\langle T(\vect{v}_i)\rangle^r$ は線型独立。
線型写像$T:V\to U$は、$U,V$の基底を($T$に合わせて)うまく選べば、次の定理が示すようにとても簡単な行列で表現できる。
定理.線型写像$T:V\to U$を$\begin{bmatrix} E_r & O\\ O & O \end{bmatrix}$で表現できる$U,V$の基底がある。
証明. $T(V)$は$U$の線型部分空間だから、その基底$\langle\vect{i}_i\rangle^r$を選び、必要ならそれを拡張して$U$の基底$\langle\vect{i}_i\rangle^m$を作る。$\langle\vect{j}_i\rangle^r$を$T(\vect{j}_i)=\vect{i}_i$となるように選び、$T^{-1}(\vect{o})$の基底$\langle\vect{j}_{r+1},\dots,\vect{j}_n\rangle$を付け加えれば、上の定理より$\langle\vect{j}_i\rangle^n$は$V$の基底になり、この定理の表現を得る。
問.証明中の$\langle\vect{j}_i\rangle^r$は線型独立であることを示せ。
線型写像$T:V\to U$の
ランクを $\rank T:=\dim T(V)$ で定義し、$A\in{}_m[\mathbb{K}]^n$の
ランクを $\rank A:=\rank T_A=\dim T_A({}_n[\mathbb{K}])$ で定義する。
第4節 固有値と固有ベクトル
線型変換$T:V\to V$の行列表現の場合、定義域と値域で同じ基底を考えるので、線型写像より議論は複雑である。第2節の例を再考してみよう。$V$を漸化式$x_{n+2}=2x_{n+1}+3x_n$を満たす実数列全体、$T:V\to V$を数列の項を$1$ずらす線型変換とする。
$T$は、$T(\vect{x}_{1,0})=3\vect{x}_{0,1},\ T(\vect{x}_{0,1})=\vect{x}_{1,0}+2\vect{x}_{0,1}$より$\langle\vect{x}_{1,0},\vect{x}_{0,1}\rangle$を基底に取れば行列$\begin{bmatrix} 0 & 1\\ 3 & 2 \end{bmatrix}$で表され、$T(\vect{x}_{1,-1})=-\vect{x}_{1,-1},\ T(\vect{x}_{1,3})=3\vect{x}_{1,3}
$より$\langle\vect{x}_{1,-1},\vect{x}_{1,3}\rangle$を基底に取れば行列$\begin{bmatrix}-1 & 0\\ 0 & 3 \end{bmatrix}$で表される。
$$\mathbb{R}^2;\begin{bmatrix}-1 & 0\\ 0 & 3 \end{bmatrix}
\xleftarrow{\langle{\vect{x}_{1,-1}}\ ,\ {\vect{x}_{1,3}}\ \rangle}
V;T
\xrightarrow{\langle{\vect{x}_{1,0}}\ ,\ {\vect{x}_{0,1}}\ \rangle}
\mathbb{R}^2;\begin{bmatrix} 0 & 1\\ 3 & 2 \end{bmatrix}
$$
$T(\vect{x}_{a,b})=\alpha\vect{x}_{a,b}\Rightarrow \vect{x}_{a,b}=\vect{x}_{a,a\alpha}=\langle a\alpha^n\rangle$ であるから、適切な基底を選ぶことができれば、表現行列が対角化でき数列の一般項も求まることになる。
第2節で述べた線型空間の"適切な"基底とは、線型空間上の"適切な"線型変換$T$に対し$T(\vect{x})=\alpha\vect{x}$を満たすベクトルから成り、$T$を簡単な(対角成分以外0の)行列で表現する基底と考えられる。
線型変換$T$に対し$T(\vect{v})=\alpha\vect{v},\ \vect{v}\ne\vect{o}$となるとき、$\alpha$を$T$の固有値、$\vect{v}$を($T$の固有値)$\alpha$の固有ベクトルという。正方行列$A$に対し$A\vect{x}=\alpha\vect{x},\ \vect{x}\ne\vect{o}$となるときも同様に、$\alpha$を$A$の固有値、$\vect{x}$を($A$の固有値)$\alpha$の固有ベクトルという。
$V$の線型変換$T$の基底$J=\langle\vect{j}_i\rangle$での表現行列が$A$【$T(\langle\vect{j}_i\rangle\vect{x})=\langle\vect{j}_i\rangle A\vect{x}$】なら、同型写像 $T_J:\vect{x}\mapsto \langle\vect{j}_i\rangle\vect{x}$ の下で$A$と$T$の固有値・固有ベクトルは一致【$A\vect{x}=\alpha\vect{x}\Leftrightarrow T(\langle\vect{j}_i\rangle\vect{x})=\alpha(\langle\vect{j}_i\rangle\vect{x})$】し、線型変換の固有値・固有ベクトルを求める問題は正方行列の固有値・固有ベクトルを求める問題に帰着する。
$A\vect{x}=\alpha\vect{x}\Leftrightarrow (A-\alpha E)\vect{x}=\vect{o}\Rightarrow |A-\alpha E|=0$だから、固有値$\alpha$は$A$の固有多項式 $|A-xE|$ を$0$にする解、固有ベクトル$\vect{x}$は方程式 $(A-\alpha E)\vect{x}=\vect{o}$ の自明($\vect{o}$)でない解(の$1$つ)である、
例(上の図式)基底$\langle\vect{x}_{1,0},\vect{x}_{0,1}\rangle$の下で$T$を表す行列$\begin{bmatrix} 0 & 1\\ 3 & 2 \end{bmatrix}$の固有多項式は$\begin{vmatrix} 0-x & 1\\ 3 & 2-x \end{vmatrix}=x^2-2x-3$ で解は$-1,3$である。固有ベクトルとして
固有値$-1$では$\begin{bmatrix} 0+1 & 1\\ 3 & 2+1 \end{bmatrix}\begin{bmatrix} x_1\\ x_2 \end{bmatrix}=\begin{bmatrix} 0 \\ 0 \end{bmatrix}$の解の$1$つ$\begin{bmatrix} 1 \\ -1 \end{bmatrix}$、固有値$3$では$\begin{bmatrix} 0-3 & 1\\ 3 & 2-3 \end{bmatrix}\begin{bmatrix} x_1\\ x_2 \end{bmatrix}=\begin{bmatrix} 0 \\ 0 \end{bmatrix}$の解の$1$つ$\begin{bmatrix} 1 \\ 3 \end{bmatrix}$ を選べば、$T$は基底$\langle \vect{x}_{1,0}-\vect{x}_{0,1},\vect{x}_{1,0}+3\vect{x}_{0,1}\rangle=\langle \vect{x}_{1,-1},\vect{x}_{1,3}\rangle$の下で$\begin{bmatrix} -1 & 0\\ 0 & 3 \end{bmatrix}$で表現される。
対角成分以外はすべて$0$の正方行列 ${}_n[\alpha_i\delta_{ij}]^n=[\alpha_j\vect{e}_j]^n={}_n[\alpha_i\vec{\vect{e}}_i]$ を
対角行列という。線型変換が
対角化可能(対角行列で表せる)条件を調べよう。
定理.$n$次正方行列$A$が$n$個の線型独立な固有ベクトルを持つ$\iff$ある正則行列$P$が存在して $P^{-1}AP$ が対角行列になる。
証明.$P=[\vect{p}_j]^n$とおく。次の①、②より、定理は成り立つ。
① $P=[\vect{p}_j]^n$が正則$\iff \{\vect{p}_1,\cdots,\vect{p}_n\}$が線型独立、
② $P^{-1}AP=[\alpha_j\vect{e}_j]^n \iff [A\vect{p_j}]^n=AP=P[\alpha_j\vect{e}_j]^n=[\alpha_jP\vect{e}_j]^n= [\alpha_j\vect{p_j}]^n$
問.証明中の①を示せ。
ある正則行列$P$が存在して$B=P^{-1}AP$($AP=PB$)となるとき、$A\approx B$と書いて$A$と$B$は
相似であるといい、$P$を$A$から$B$への
変換行列という。対角行列に相似な行列は
対角化可能であるという。また、線型変換$T$は、基底$\langle\vect{j}_i\rangle$で$A$が表す【$T(\langle\vect{j}_i\rangle\vect{x})=\langle\vect{j}_i\rangle A\vect{x}$】なら、基底$\langle\langle\vect{j}_i\rangle P\rangle$で $P^{-1}AP$ が表す【$T(\langle\langle\vect{j}_i\rangle P\rangle\vect{x}) =\langle\langle\vect{j}_i\rangle P\rangle(P^{-1}AP\vect{x})$】から、$P$を
基底変換行列ともいう。即ち、同じ線型変換を別の基底で表す行列は相似である。
問.
$T(\langle\vect{j}_i\rangle\vect{x})=\langle\vect{j}_i\rangle(A \vect{x})$ ならば、$T(\langle\langle\vect{j}_i\rangle P\rangle\vect{x}) =\langle\langle\vect{j}_i\rangle P\rangle (P^{-1}AP\vect{x})$ であることを示せ。
定理.相似な正方行列の多項式は(固有値は重複度も含めて)等しい。
証明.$|P^{-1}AP-xE|=|P^{-1}(A-xE)P|=|P^{-1}||(A-xE)||P|=|A-xE|$
定理.正方行列$A$の異なる固有値に対する固有ベクトルは線型独立である。
証明.$\alpha_1,\dots,\alpha_r$はすべて互いに異なり、$A\vect{p}_i=\alpha_i\vect{p_i}$とする。$\langle \vect{p}_i\rangle^r$の線型関係$\vect{p}_r=[\vect{p}_i]^{r-1}{}_{r-1}[c_i]$から$\langle \vect{p}_i\rangle^{r-1}$の線型関係$\vect{o}{=}A\vect{p}_r{-}\alpha_r\vect{p}_r{=}[\vect{p}_i]^{r-1}{}_{r-1}[c_i(\alpha_i{-}\alpha_r)]$が導けるので、定理がいえる。【この定理は線型変換についても成立つ】
定理から、$n$次正方行列の対角化に関する状況は次のように整理できる。
- $n$個の異なる固有値がある:対角化可能
- 重複度も含めて$n$個の固有値があり、各固有値で固有空間の次元が重複度に一致する:対角化可能
- 重複度も含めて$n$個の固有値があるが、固有空間の次元が重複度に一致しない固有値がある:対角化不能
- 重複度も含めても$n$個の固有値がない:対角化不能
【代数学の基本定理】$\mathbb{C}$上の$1$変数$n$次方程式の解は重複度を含めて$n$個ある。
$\mathbb{K}=\mathbb{C}$の場合4.は生じず、問題は各固有値で固有空間の次元が重複度に一致するか否かになる。以下特に断らない限り$\mathbb{K}=\mathbb{C}$とする。
第5節 計算例・応用例
例1.$\begin{bmatrix} 1 & 2\\ 2 & 1 \end{bmatrix}$の固有多項式は$\begin{vmatrix} 1-x & 2\\ 2 & 1-x \end{vmatrix}=(x-3)(x+1)$より固有値は$x=3,-1$。$3$の固有ベクトルは$\begin{bmatrix} -2 & 2\\ 2 & -2 \end{bmatrix}\vect{p}_3=\vect{o}$より例えば$\vect{p}_3=\begin{bmatrix} 1 \\ 1\end{bmatrix}$、$-1$の固有ベクトルは$\begin{bmatrix} 2 & 2\\ 2 & 2 \end{bmatrix}\vect{p}_{-1}=\vect{o}$より例えば$\vect{p}_{-1}=\begin{bmatrix} 1 \\ -1\end{bmatrix}$。対角行列$\begin{bmatrix} 3 & 0\\ 0 & -1 \end{bmatrix}$への変換行列は例えば$\begin{bmatrix} 1 & -1\\ 1 & 1 \end{bmatrix}$。
例2.実関数の微分方程式$\begin{cases} p'(x)=p(x)+2q(x)\\ q'(x)=2p(x)+q(x)\end{cases}$の解全体は線型空間をなし、微分演算はその上の線型変換である。初期値$p(0)=a,\,q(0)=b$で一意に定まる解を各々$p_a(x),\,q_b(x)$と表すと
$\begin{bmatrix}p_a(x)\\ q_b(x)\end{bmatrix}'=\begin{bmatrix}p_a(x)+2q_b(x)\\ 2p_a(x)+q_b(x)\end{bmatrix}=\begin{bmatrix} 1 & 2\\ 2 & 1 \end{bmatrix}\begin{bmatrix}p_a(x)\\ q_b(x)\end{bmatrix}$
例1.の議論から $\begin{cases}(p_a(x)+q_b(x))'=3(p_a(x)+q_b(x))\\ (p_a(x)-q_b(x))'=-(p_a(x)-q_b(x))\end{cases}$
よって
$\begin{cases}p_a(x)+q_b(x)=(a+b)e^{3x}\\ p_a(x)-q_b(x)=(a-b)e^{-x}、\end{cases}\ \begin{cases}p_a(x)=\displaystyle \frac{a+b}{2}e^{3x}+\frac{a-b}{2}e^{-x}\\ q_b(x)=\displaystyle \frac{a+b}{2}e^{3x}-\frac{a-b}{2}e^{-x}。\end{cases}$
WolframAlphaで確認
例3.$A_\theta=\begin{bmatrix} \cos\theta& -\sin\theta\\ \sin\theta& \cos\theta \end{bmatrix}$の固有値は$\begin{vmatrix} \cos\theta-x& -\sin\theta\\ \sin\theta& \cos\theta-x \end{vmatrix}=0$を解いて$x=\cos\theta\pm i\sin\theta$。その固有ベクトル$\vect{p}_\pm$は各々$\begin{bmatrix} \mp i\sin\theta& -\sin\theta\\ \sin\theta& \mp i\sin\theta \end{bmatrix}\vect{p}_\pm=\vect{o}$を解いて$\vect{p}_\pm=\begin{bmatrix}1\\ \mp i\end{bmatrix}$(復号同順)。よって $\sin\theta\ne 0$ のとき、$A_\theta$は複素数の範囲では対角化可能だが実数の範囲では固有値を持たず対角化可能でない。実際、
$\begin{bmatrix} \cos\theta& -\sin\theta\\ \sin\theta& \cos\theta \end{bmatrix}
\begin{bmatrix} r\cos\alpha\\ r\sin\alpha \end{bmatrix}
=\begin{bmatrix} r\cos(\alpha+\theta)\\ r\sin(\alpha+\theta) \end{bmatrix}$ より$A_\theta$は実平面上で原点を中心に$\theta$回転させる行列であり、固有ベクトルはない。一方 $\sin\theta = 0$ のとき、
$A_\theta=\cos\theta E=\pm E$ の固有値は$\pm 1$で単位ベクトル $\vect{e}_1,\ \vect{e}_2$ が固有ベクトル。
例4.$\begin{bmatrix} 3& 2& -8\\ 5& 6& -20\\ 2& 2& -7 \end{bmatrix}$の固有多項式は
$\begin{vmatrix} 3-x& 2& -8\\ 5& 6-x& -20\\ 2& 2& -7-x \end{vmatrix}$
$
=\begin{vmatrix} 1-x& 2& -8\\ x-1& 6-x& -20\\ 0& 2& -7-x \end{vmatrix}
=(1-x)\begin{vmatrix} 8-x& -28\\ 2& -7-x \end{vmatrix}
=-x(1-x)^2$。$0$の固有ベクトルは$\begin{bmatrix} 3& 2& -8\\ 5& 6& -20\\ 2& 2& -7 \end{bmatrix}\vect{p}_0=\vect{o}$より例えば$\vect{p}_0=\begin{bmatrix} 2 \\ 5 \\ 2\end{bmatrix}$。$1$の固有ベクトルは$\begin{bmatrix} 2& 2& -8\\ 5& 5& -20\\ 2& 2& -8 \end{bmatrix}\vect{p}_1=\vect{o}$より線型独立な$\vect{p}_1=\begin{bmatrix} 0\\ 4\\ 1 \end{bmatrix},\begin{bmatrix} 1 \\ -1 \\ 0\end{bmatrix}$が選べる。対角行列$\begin{bmatrix} 0& 0& 0 \\ 0& 1& 0 \\ 0& 0& 1 \end{bmatrix}$への変換行列は例えば$\begin{bmatrix} 2 & 0& 1\\ 5& 4& -1 \\ 2& 1& 0 \end{bmatrix}$。
問.正方行列$A$が固有値$0$を持つ$\iff A$は正則でない、を示せ。
問.右のアプリで
-
例4の行列の固有多項式を計算せよ。
-
次ページ例5の行列$\begin{bmatrix} 1& 3& 3\\ 1& 5& 1\\ -1& -1& 3 \end{bmatrix}$の固有多項式を求めよ。
例5.$A=\begin{bmatrix} 1& 3& 3\\ 1& 5& 1\\ -1& -1& 3 \end{bmatrix}$の固有多項式は$\begin{vmatrix} 1-x& 3& 3\\ 1& 5-x& 1\\ -1& -1& 3-x \end{vmatrix}$
$=(4-x)^2(1-x)$。$1$の固有ベクトルは$\begin{bmatrix} 0& 3& 3\\ 1& 4& 1\\ -1& -1& 2 \end{bmatrix}\vect{p}_{1}=\vect{o}$より例えば$\vect{p}_{1}=\begin{bmatrix} 3 \\ -1 \\ 1\end{bmatrix}$。$4$の固有ベクトルは$\begin{bmatrix} -3& 3& 3\\ 1& 1& 1\\ -1& -1& -1 \end{bmatrix}\vect{p}_4=\vect{o}$より$\vect{p}_4=\begin{bmatrix} 0 \\ 2 \\ -2\end{bmatrix}$の定数倍のみで、対角化できない。しかし $\begin{bmatrix} -3& 3& 3\\ 1& 1& 1\\ -1& -1& -1 \end{bmatrix}\vect{p}_4'=\vect{p_4}$を満たす$\vect{p}_4'=\begin{bmatrix} 1 \\ 1 \\ 0\end{bmatrix}$に対し$A[\vect{p}_1\ \vect{p}_4\ \vect{p}_4']=[\vect{p}_1\ 4\vect{p}_4\ \vect{p}_4+4\vect{p}_4']=[\vect{p}_1\ \vect{p}_4\ \vect{p}_4']\begin{bmatrix} 1& 0& 0\\ 0& 4& 1\\ 0& 0& 4 \end{bmatrix}$。よって基底$\langle\vect{p}_1\ \vect{p}_4\ \vect{p}_4'\rangle$のもとで線型変換$A$は$\begin{bmatrix} 1& 0& 0\\ 0& 4& 1\\ 0& 0& 4 \end{bmatrix}$で表される。
このような事が常に可能なことは、次の講で議論する。
第6節 数式計算サイトの利用
下は
WolframAlphaのサイトである。入力欄に [[1,2],[2,1]] のような形式で行列を入力して [Enter]キー押すと、その行列式、逆行列、固有多項式、固有値、固有ベクトル等々を計算してくれる。本講で取り上げた次の行列や適当な行列を入力して、試してみよう。
[[0,1],[3,2]]
[[1,2],[2,1]]
[[cos(x),-sin(x)],[sin(x),cos(x)]]
[[3,2,-8],[5,6,-20],[2,2,-7]]
[[1,3,3],[1,5,1],[-1,-1,3]]
付録 固有多項式の展開公式
行列式の余因子展開の考え方を応用して、固有多項式の展開式を求める。
$1\le i_1\le i_2\le\cdots\le i_k\le n$に対し、$n$次正方行列$A$から第$i_1,i_2,\dots,i_k$行と第$i_1,i_2,\dots,i_k$列を除いて得られる行列$A_{\overline{i_1i_2\cdots i_k}}$を$A$の
$n-k$次主小行列といい、その全体を$\mathcal{A}_k$と表す。特に$0$次正方行列$[\ ]$の行列式は$|[\ ]|=1$とし、$\mathcal{A}_0=\{A\},\ \mathcal{A}_n=\{[\ ]\}$とする。
定理. $\displaystyle
|A-xE|=\sum_{k=0}^n\left(\sum_{B\in\mathcal{A}_k}|B|\right)(-x)^k$
証明.$A':=A+{}_n[x_i\delta_{ij}]^n=\begin{bmatrix}
a_{11}+x_1& a_{12}& \cdots& a_{1n}\\
a_{21}& a_{22}+x_2& \cdots& a_{2n}\\
\vdots& \vdots& \ddots&\vdots\\
a_{n1}& a_{n2}& \cdots& a_{nn}+x_n
\end{bmatrix}$とおけば $|A'|= \displaystyle \sum_{k=0}^n\left(\sum_{1\le i_1\le i_2\le\cdots\le i_k\le n}|A_{\overline{i_1i_2\cdots i_k}}|x_{i_1}x_{i_2}\cdots x_{i_k}\right)$ が成立つ。
実際、$|A'|$の展開式で$x_{i_1}x_{i_2}\cdots x_{i_k}$が現れる項は、第$i_1,i_2,\dots,i_k$行でそれぞれ第$i_1,i_2,\dots,i_k$列成分を選んだときであるから
$(a_{i_1i_1}+x_{i_1})(a_{i_2i_2}+x_{i_2})\cdots (a_{i_ki_k}+x_{i_k})|A'_{\overline{i_1i_2\cdots i_k}}|$
に含まれる。ここで $|A'_{\overline{i_1i_2\cdots i_k}}|$ 中の $x_j,\ j\not\in\{i_1,i_2,\dots,i_k\}$ にすべて $0$ を代入すれば、$x_{i_1}x_{i_2}\cdots x_{i_k}$ の係数は $|A_{\overline{i_1i_2\cdots i_k}}|$ である。
さらに、$x_1=x_2=\cdots=x_n=-x$ とおけば定理が成立つ。
注.$|aE-xE|=(a-x)^n$だから固有多項式の展開公式は$2$項定理の拡張になっている。実際、$\mathcal{A}_k$の要素数は${}_n \mathrm{C}_k$で、$|aE_{\overline{i_1i_2\cdots i_k}}|=a^{n-k}$ だから、
$(a-x)^n=|aE-xE|=\dsum_{k=0}^n {}_n \mathrm{C}_ka^{n-k}(-x)^k$。
(この公式と注は本多恭子氏のご教示による。)