我們利用數學歸納法來說明為何一定可以將一個矩陣化為 echelon form.
或許有些人會對這裡數學歸納法處理的方式覺得奇怪,
不過若能仔細體會其真意, 會發現這是最好的處理方式. 我們是對矩陣的 row
的個數作數學歸納法. 先說明所有只有一個 row 的矩陣一定是 echelon
form, 然後利用這件事實證明所有有兩個 row 的矩陣皆可利用 elementary
row operations 化為 echelon form. 再利用兩個 row
的矩陣會成立的事實證明有 3 個 row 的矩陣也可利用 elementary row
operations 化為 echelon form, 如此一直下去我們可證有
個 row 的矩陣會成立. 不過這樣的方法我們可以證得有特定個數的 row
的矩陣會成立 (例如 10 個 row), 但無法證得一般的情形 (即任意個數的
row). 此時數學歸納法是最好的論證工具了. 若我們能知道有
個 row
的矩陣一定能利用 elementary row operations 化為 echelon form
這個事實且利用這個事實證得有
個 row 的矩陣一定能利用
elementary row operations 化為 echelon form,
這就表示當我們知道有一個 row 的矩陣能利用 elementary row operations
化為 echelon form 就能推得有兩個 row 的矩陣能利用 elementary row
operations 化為 echelon form, 也進而推得有 3 個 row 的矩陣亦成立,
再進而推得有 4 個 row 的矩陣亦成立,
如此一直下去當然可知任意的矩陣皆能利用 elementary row operations
化為 echelon form.
由於這裡的論證不容易說明清楚, 我們先由一個例子來說明. 考慮一個有
個 row 的矩陣
接下來我們處理一般的情形. 首先我們來看只有一個 row 的矩陣.
此時由於沒有任何的 row 在其下方所以依定義自然是 echelon form.
接著看有兩個 row 的矩陣. 首先注意依定義一個 echelon form 的第一個
row 其 leading entry (若有的話) 必在所有其他 row 的 leading entry
所在位置的左方. 所以我們在此有兩個 row 的矩陣挑出 leading
entry 在最左方的一個 row (若兩個 row 的 leading entry
所在位置相同就任取一個 row) 利用 row 交換的 row operation
將之置於第一個 row. 接下來注意依定義下一個 row 的 leading entry
所在位置需在第一個 row 的 leading entry 的右方. 現若第二個 row 的
leading entry 所在位置和第一個 row 不同, 則因已知第一個 row 的
leading entry 所在位置在最左方, 第二個 row 的 leading entry
所在位置一定在第一個 row 的 leading entry 的右方, 故依定義此時已為
echelon form. 而若第二個 row 的 leading entry 所在位置和第一個 row
相同, 我們可將第一個 row 乘以 , 其中
為第一個 row 的
leading entry 而
為第二個 row 的 leading entry 再加到第二個 row
上. 如此一來第二個 row 原本的 leading entry 所在位置變為 0, 故其
leading entry 所在位置往右移了, 依定義此時為 echelon form.
我們可以如法泡製處理有 個 row 的矩陣, 但由於要使用數學歸納法,
此時我們可直接假設我們以處理到有
個 row 的矩陣了, 亦即有
個
row 的矩陣皆可利用 elementary row operation 化為 echelon form.
現在我們要處理有
個 row 的矩陣. 如欠面首先我們將 leading entry
的位置在最左邊的那個 row 利用兩 row 互換的 row operation
將之置於第一個 row. 假設此時第一個 row 的 leading entry 為
.
接下來我們將 leading entry 的位置與第一個 row 的 leading entry
位置一樣的 row 挑出, 若該 row 的 leading entry 為
,
我們便將第一個 row 乘上
後加到該 row 上. 如此一來該 row 的
leading entry 所在位置便往右移了. 一直重複此步驟, 直到第一個 row
以外的 row 其 leading entry 所在位置皆與第一個 row 的 leading entry
所在位置相異. 注意, 此時第一個 row 以下的各 row 其 leading entry
所在位置皆在第一個 row 的 leading entry 所在位置的右方.
若我們不看第一個 row, 所剩下的是一個有
個 row 的矩陣,
所以利用前面已知有
個 row 的矩陣皆可利用 elementary row
operations 化為 echelon form, 我們可以利用 elementary row
operations 將此矩陣第一個 row 以下的部份化為 echelon form.
但此時因各個 row 的 leading entry 所在位置皆在第一個 row 的 leading
entry 所在位置的右方, 所以整個矩陣亦為 echelon form.
故得證所有矩陣皆可利用 elementary row operations 化為 echelon form.
大家或許注意到我們在化成 echelon form 的過程皆沒有用到將某個 row
乘上一非 0 實數這一個 elementary row operation. 事實上在化成
echelon form 的過程確實不需要這一種 row operation, 不過它在化為
以後要談的 ``reduced'' echelon form 的過程是需要的, 留待以後再談.
既然每一個矩陣都能用 elementary row operations 化為 echelon form,
接下來我們要說明的是利用 elementary row operation
處理後的聯立方程組其解集合不會改變. 要注意這裡指的是將 augmented
matrix 用 elementary row operations 變換後的 augmented matrix
其對應的聯立方程組其解集合不會改變. 亦即聯立方程組
所對應的 augmented matrix
若經一些 elementary row
operations 後變換成
, 那麼其對應的聯立方程組
和原方程組
有相同的解集合.
不要誤以為是將係數矩陣
利用 elementary row operations 變換成
後聯立方程組
的解集合和原方程組
的解集合相同.
首先觀察若將一聯立方程組
的 augmented matrix
利用三種 elementary row operation 的任一種變換成
表示將原方程組利用加減消去法的三個基本方法之ㄧ將之變成方程組
. 然而方程組
若利用加減消去法的三種方法 (即將兩式子對調順序或將某一式乘上某個非
0 實數或將一個式子乘上某個實數加到另一個式子) 變換成方程組
, 原來滿足
的一組解仍會滿足
. 換句話說
的解集合會包含於
的解集合.
不過 elementary row operations 是可以還原回去的, 也就是說方程組
也可以用 elementary row operations 還原回原方程組
. 因此
的解集合也會包含於
的解集合. 因此得證
和
會有相同的解集合. 我們證得了
若經由一個 elementary row operation 後得
,
則它們所對應的聯立方程組會有相同的解集合. 因此若
經由好幾次的 elementary row operation 變換成
,
它們所對應的聯立方程組當然也會有相同的解集合.
我們已經了解要解一個聯立方程組
經要將 augmented
matrix
利用 elementary row operations 換成
其中
為 echelon form 後, 再解聯立方程組
即可. 所以我們僅需探討
其中
為 echelon form 這樣的聯立方程組的解即可. 在下節中
我們要說明此時為何聯立方程組的解就是如上一節所述的情形.