Try   HackMD

Classification of 2-by-2 matrices

Jordan normal form

給定一個

2×2 矩陣
A
, 他的特徵多項式是個二次多項式, 定義為

(1)p(λ)=det(AλI).

並且我們知道其首項係數為

1,
p(λ)=λ2+
, 因此一定可以因式分解成為

(2)p(λ)=(λλ1)(λλ2).

Lemma

首先我們證明說如果兩個 eigenvector 相對應的 eigenvalue 不同, 那他們兩個組起來一定線性獨立.

Lemma: If

Av1=λ1v1 and
Av2=λ2v2
,
v10
,
v20
and
λ1λ2
, then
{v1,v2}
is linearly independent.

pf: Assume

c1v1+c2v2=0, then
c1Av1+c2Av2=0
. So we have

(3)c1λ1v1+c2λ2v2=0.

We also know that (multiplying the original equation by

λi)

(4)c1λ1v1+c2λ1v2=0.(5)c1λ2v1+c2λ2v2=0.

(3), (4) gives

c2=0 and (3), (5) gives
c1=0
. Therefore
{v1,v2}
is linearly independent.

Two distinct real roots

λ1 以及
λ2
都是實數並且不一樣, 那可以找到相對應的 eigenvectors
{v1,v2}
他們是線性獨立的. 因此我們有

(6)A[v1,v2]=[v1,v2][λ1λ2].

若我們定義

V=[v1,v2], 那就有

(7)A=V[λ1λ2]V1.

Remark: 因爲

V 是方陣, 並且他的 columns 線性獨立, 因此一定有
V1
.

Two complex roots

對角化

若有一個 eigenvalue 是複數. 由於

A 是實係數矩陣,
p(λ)
就會是實係數多項式, 他的虛根就會成對, 也就是
λ2=λ¯1
, 其中上面那一橫代表共軛 (complex conjugate).

而若

Av1=λ1v1, 那我們直接對他取 complex conjugate 得到
Av¯1=λ¯1v¯1=λ2v¯1
. 所以我們知道
v2=v¯1
.

不過不管怎樣我們都有兩個不一樣的 eigenvalue 以及線性獨立的 eigenvectors, 我們就可以把矩陣寫成 (6) 以及 (7) 這種樣子, 就把矩陣對角化了. 只不過這樣子寫的

λi 以及
vi
都是複數的也許不是很安心, 不過整個乘起來一定會是實係數矩陣.

Real Jordan form

對於複數 eigenvalue 而言他的 Jordan form 就是 (7) 的中間那個對角矩陣了. 不過我們還可以再把它寫成另一種形式, 便成實係數的矩陣相乘, 這就是所謂的 "real Jordan form". 這裡的英文字 "real" 指的是實數的意思.

我們把 eigenvalue 以及 eigenvector 的實部虛部分開, 記為

λ1=a+ib,v1=v+iw.

那這樣, 根據

Av1=λ1v1, 他的實部虛部兩個方程式寫出來就會是

Av=avbw,Aw=bv+aw.

而這寫成矩陣的樣子就是

(8)A[v,w]=[v,w][abba].

若我們定義

V=[v,w], 那就有

(9)A=V[abba]V1.

Remark: 我們知道

v+iw 以及
viw
是線性獨立的, 這樣可以推得
{v,w}
也是線性獨立.

pf: 我們用反證法. 假設

{v,w} 線性相依, 那就會有
w=cv
.

這樣子就會有

v+iw=(1+ci)v 以及
viw=(1ci)v
, 也就是
v+iw
以及
viw
都變成
v
的倍數, 他們線性相依了.

因此與

{v+iw,viw} linearly independent 的命題矛盾. 所以
{v,w}
一定也是線性獨立.

Double root

λ1=λ2.

Two linear independent eigenvectors

在重根的情形, 若我們能找到兩個線性獨立的 eigenvector, 那就可以直接寫成 (6) 以及 (7) 的樣子, 對角化就沒有任何問題了.

Only one linear independent eigenvectors

若我們無法找到兩個線性獨立的 eigenvector, 那就至少有一個

v1 使得
Av1=λ1v1
. 而另一個就要找 generalized eigenvector.

那這個 generalized eigenvector 要滿足

(10)(Aλ1I)w=v1.

找到了之後我們就可以把兩個方程式寫下來

Av1=λ1v1,Aw=v1+λ1w.

而這寫成矩陣的樣子就是

(11)A[v1,w]=[v1,w][λ110λ1].

若我們定義

V=[v1,w], 那就有

(12)A=V[λ110λ1]V1.

Remark: 我們證明一下

{v1,w} is linearly independent.

pf: Assume

c1v1+c2w=0, then
c1Av1+c2Aw=0
. So we have

(13)c1λ1v1+c2(v1+λ1w)=0.

We also know that (multiplying the original equation by

λ1)

(14)c1λ1v1+c2λ1w=0.

(13) - (14) gives

c2=0, and then plug-in the result back to (14) gives
c1=0
. Therefore,
{v1,w}
is linearly independent.