乾貨 | 線性代數的本質課程筆記完整合集

  • 2019 年 10 月 8 日
  • 筆記

0、系列目錄

1.向量究竟是什麼:https://www.bilibili.com/video/av5987715/?spm_id_from=333.788.reco_list.2
2.線性組合、張成的空間與基:https://www.bilibili.com/video/av6025713/?spm_id_from=333.788.videocard.0
3.矩陣與線性變換:https://www.bilibili.com/video/av6043439/?spm_id_from=333.788.videocard.0
4.矩陣乘法與線性變換複合:https://www.bilibili.com/video/av6128021/?spm_id_from=333.788.videocard.0、https://www.bilibili.com/video/av6143355/?spm_id_from=333.788.videocard.1
5.行列式:https://www.bilibili.com/video/av6179111/?spm_id_from=333.788.videocard.0
6.逆矩陣、列空間與零空間:https://www.bilibili.com/video/av6240005/?spm_id_from=333.788.videocard.0
7.點積:https://www.bilibili.com/video/av6299284?from=search&seid=12903800853888635103
8.叉積:https://www.bilibili.com/video/av6341515/?spm_id_from=333.788.videocard.1、https://www.bilibili.com/video/av6371571/?spm_id_from=333.788.videocard.19
9.基變換:https://www.bilibili.com/video/av6500834?from=search&seid=3249893627908257126
10.特徵向量與特徵值:https://www.bilibili.com/video/av6540378/?spm_id_from=333.788.videocard.0
11.抽象向量空間:https://www.bilibili.com/video/av6661309?from=search&seid=11789080179301962680

1、向量究竟是什麼?

三種向量的觀點

線性代數中最基礎,最根源的組成部分是向量,那麼什麼是向量呢?從不同學生的視角看,有以下三種觀點:

物理專業學生的視角:向量是空間中的箭頭,決定一個向量的是它的長度和所指的方向,只要這兩個要素相同, 向量可以任意移動。 計算機專業學生的視角:向量是有序的數字列表,數字順序不可以隨意轉變。 數學專業的視角:向量可以是任何東西,只要滿足向量之間相加和數字與向量相乘都有意義即可。

我們先來考慮平面中的x-y坐標系,向量被定義為從原點出發的有方向的箭頭。這與物理專業的看法略有不同,因為他們認為向量在空間中可以自由落腳,但是在線性代數中,向量是從原點作為起點的。而向量的坐標如[2,3],則是有序性的體現,2代表橫坐標,3代表縱坐標,二者不可交換。

接下來,我們來介紹下向量的幾何意義、向量加法的幾何意義,以及向量乘法的幾何意義。

向量的幾何意義 考慮平面中的x-y坐標系,由x軸和y軸組成,二者的交叉部分叫做原點。

一個向量的坐標由一對數組成,這對數指導我們如何從原點走到向量的終點。

如上圖的向量,它告訴我們先沿x軸往左移動2個單位,再沿y軸移動3個方向。

向量加法的幾何意義 假設我們現在有兩個向量:

如果我們把w從原點移動到v的終點,然後再連接原點和w的終點,那麼得到的向量就是二者的和。

為什麼是這樣,還是回到向量的意義來,他定義了一種移動方式,假設v的坐標是[1,2],w的坐標是[3,-1]。v告訴我們要沿x軸向右移動1個單位,沿y軸向上移動2個單位,而w告訴我們要沿x軸向右移動3個單位,沿y軸向下移動一個單位。這樣總體的移動效果就是沿x軸向右移動5個單位,沿y軸向上移動1個單位,得到的結果是[5,1]。因此向量加法的幾何意義,我們可以看作是多次移動的累積結果,從計算上來看,就是如下的式子:

向量乘法的幾何意義 向量乘法就是對向量進行拉伸(乘以一個大於1的正數),壓縮(乘以一個小於1的正數),翻轉向量的行為(乘以一個負數),這些行為統稱為統稱為scaling。而向量乘上的這些數值本身,稱之為向量(scalars)。向量乘法的計算方式如下:

2、 線性組合、張成的空間與基

基向量 我們之間介紹了向量之間兩種最基本的運算,向量相加 以及 向量的縮放。還是以二維平面為例,其實每一個向量都可以通過基向量(basis vectors)經由上面的兩種運算得到,假設我們的基向量是[1,0]和[0,1],如下圖:

當然,基向量可以任意選擇,定義兩個向量v和w,以其為基向量,通過加法和乘法,可以得到平面中任意的向量:

基向量的嚴格定義為:向量空間中的基是張成該空間的一個線性無關的向量集:

線性組合 線性組合Linear Combination的幾何意義如下圖所示,完整上來說,其實是向量之間的線性組合,其主體是向量,線性組合是一個操作,將各個向量縮放之後,相加在一起,就得到了參與操作的向量之間的線性組合。

線性組合有下面是三種情況: 1)如果參與組合的一對向量不共線,那麼由它們進行線性組合所得到的向量可以達到平面上的任意一個點:

2)如果參與組合的一對向量共線,那麼由它們進行線性組合所得到的向量的終點被限制在一條通過原點的直線:

3)如果參與組合的一對向量都是零向量,那麼由它們進行線性組合所得到的向量永遠是零向量:

向量張成的空間 張成的空間:v與w全部的線性組合所構成向量集合被稱為張成的空間。

對於平面來說,如果兩個向量不共線,那麼可以張成整個二維平面,如果共線,只能張成一條直線。

對於三維空間來說,如果三個向量共線,那麼只能張成一條直線,如果三個向量共平面,那麼只能張成一個平面,如果三個向量不共平面,則可以張成整個三維空間。

線性相關 線性相關:如果一組向量中,至少有一個對張成的空間沒有幫助,或者說其中一個向量可以表示成其他向量的線性組合,或者說其中一個向量在其他向量所張成的向量空間中。

線性無關則與線性相關相反,所有向量都不能表示成其他向量的線性組合:

3、矩陣與線性變換

線性變換Linear transformation 變換其實也是一種函數,我們有一個輸入向量,然後經過變換之後,得到一個輸出向量。整個過程,可以看作是輸入的向量移動到了輸出的輸出的位置。考慮整個平面上的向量,在經過變換之後,得到了一個最新的位置。

變換前的向量

變換後的向量

那什麼是線性變換呢?滿足下面兩個條件: 1)所有的直線還是直線。即原先終點在一條直線上的向量,在經過線性變換之後,這些向量還落在一條直線上。 2)原點還在原來的位置。

那麼如何來描述我們的線性變換呢?考慮向量v = [-1,2],在i = [1,0]和j = [0,1]為基的情況下,v = -1 * i+2 * j,假設線性變換如下:

上圖中,原先的i=[1,0]變換到i'=[1,-2],原先的j=[0,1]變換到j'=[3,0],而原先的v變換到v'=[5,2],而關係 v' = -1 * i' + 2 * j'仍然存在。即圖中的式子成立。

所以說,一個2*2的矩陣,[[a,c],[b,d]]其實代表了一種線性變換,它把原來的[1,0]變換到[a,b]的位置,把原先空間中的[0,1]變換到[c,d]的位置。而該矩陣與一個向量[x,y]相乘的結果,相當於對該向量做了一次線性變換,把向量移動到新平面中對應的位置:

4、矩陣乘法與線性變換複合

兩個2*2矩陣a和b相乘,可以看作是對原始空間連續做了兩次線性變換,而得到的計算結果c也是一個2*2的矩陣。使用c對原始空間進行一次線性變換,和連續使用a和b對原始空間進行兩次線性變換的效果相同。

矩陣的計算就不細講了,我們只需要知道,矩陣相乘的幾何意義是將兩次單獨的變換變為一次組合變換即可。

該結論到三維空間中也是同樣成立的。

5、行列式

如果在二維空間中,我們畫出相對應的網格,那麼線性變換,就是對這些網格做了拉伸,收縮或者反轉。那麼如何來定義這種變換的程度呢?就需要用到行列式determinant的概念了。

舉一個簡單的例子吧:

線性變換前

線性變換後

在進行線性變換後,原來一個面積為1的單位方格,變成了面積為6的矩形。可以說,線性變換將原空間放大了6倍。

再看一個例子:

該線性變換把原二維空間壓縮成一條直線,行列式為0

上面的例子中,當二維空間經過一次線性變換被壓縮成一條直線甚至是一個點時,行列式為0,因此可以通過行列式是否為0來判斷線性變換後的空間的維度是否與原空間相同。

我們知道,行列式的值是有正有負的,那麼怎麼判斷是負數呢?我們可以通過變換後的基向量i和j的方向來判定。

在變換之前,j是在i的左側的:

如果經過線性變換後,j變成了在i的右側,那麼得到的行列式的值是負的:

那麼到三維空間中,行列式的值就告訴我們經過線性變換後,單位體積變化的程度,而行列式的值可以通過右手定則來判定:

那麼行列式如何來計算呢?

二維空間行列式的計算

三維空間行列式的計算

6、逆矩陣、列空間與零空間

逆矩陣 我們先從線性方程組着手,一個線性方程組可以表示成Ax = v:

看到這裡,你也許已經知道這代表什麼含義了,矩陣A相當於一個線性變換,向量x在經過A這個線性變換後,得到的向量為v。線性方程組的求解過程其實就是找到向量v在經由A這個線性變換之前所在的位置x。

因此,我們可以把它變成另一個過程,即將v所在的線性空間,經過另一個逆向的過程,變回x所在的線性空間,那麼這個線性變換用矩陣表示,就是A的逆矩陣,用A-1表示。即逆矩陣A-1所代表的線性變換,是A所代表的線性變換的逆過程。因此A-1A相對於任何事情都沒有做。

那麼既然逆矩陣相當於線性變換的逆操作,因此只有在線性變換後空間的維數不變的情況下,才能進行逆操作。再結合之前學習到的,線性變換不降維,前提條件是矩陣的行列式值不為0,因此矩陣的逆矩陣存在的前提,即矩陣的行列式值不為0。

矩陣的秩Rank 矩陣的秩即經由該矩陣代表的線性變換後,所形成的空間的維數。比如在三維空間中,如果經過某個矩陣A代表的線性變換後,空間變為一條直線,那麼這個矩陣的秩為1。如果空間變為一個平面,那麼這個矩陣的秩為2。如果還是三維空間,那麼矩陣的秩為3.

列空間有兩種解釋: 1)假設矩陣A代表一個矩陣變換,原始空間中所有的向量,在經由矩陣A的變換之後,所得到的所有新向量的集合 2)由矩陣A的列向量所張成的空間

比如下面的例子,[[2,-2],[1,-1]]這個矩陣,將二維空間變換為一條直線,那麼這條直線就是矩陣的列空間。

零空間:如果某個向量空間在線性變換之後,存在降維,那麼就會有一系列原來不是零向量的向量落到了零向量的位置,所有這些向量的集合構成了零空間。

7、點積

點積的標準觀點

如果我們有兩個維數相同的向量,他們的點積就是對應位置的數相乘,然後再相加:

從投影的角度看,要求兩個向量v和w的點積,可以將向量w朝着過原點的向量v所在的直線進行投影,然後將w投影后的長度乘上向量v的長度(注意兩個向量的的夾角)。

當兩個向量的夾角小於90度時,點積後結果為正,如果兩個向量垂直,點積結果為0,如果兩個向量夾角大於90度,點積結果為負。

一個有趣的發現是,你把w投影到v上面,或者把v投影到w上面,結果是相同的。

但是你不覺得上面兩個過程是完全不同的嘛?接下來就直觀解釋一下。

假設我們有兩個長度完全相同的向量v和w,利用其對稱性,無論將v投影到w上還是將w投影到v上,結果都是一樣的:

如果我們把其中一個向量變為2倍,這種對稱性被破壞了。假設我們把w投影到v上,此時投影的長度沒變,但v的長度變為兩倍,因此是原來結果的兩倍。同樣如果把v投影到w上,投影長度變為2倍,但w長度沒變,所以結果也是原結果的兩倍。所以對於兩個向量的點積來說,無論選擇哪個向量進行投影,結果都是一樣的。

問題又來了,投影的思路和對位相乘再相加的思路,有什麼聯繫呢?聯想之前所學的線性變換過程,假設u是二維空間變換到一維空間後的基向量:

在第三講中我們已經知道,一個2*2的矩陣,[[a,c],[b,d]]其實代表了一種線性變換,它把原來的[1,0]變換到[a,b]的位置,把原先空間中的[0,1]變換到[c,d]的位置。那麼想要知道什麼樣的線性變換可以將二維空間中的基向量i和j變換到一維空間中的基向量u,只需要知道i和j變換後的位置即可。i和j變換後的位置,相當於對u所在的直線進行投影,利用對稱性,可以得到相應的結果,如下圖:

所以二維空間中的任意一個向量,通過上面的線性變換可以得到的一維向量。這個過程相當於對二維向量進行了投影。而根據矩陣乘法的計算方法,便可以將投影的計算方法和對位相乘再相加的方法聯繫起來。

上面的思路總結起來,就是無論何時你看到一個二維到一維的線性變換,那麼應用這個線性變換和與這個向量點乘在計算上等價:

上面是數學中「對偶性」的一個有趣實例。

8、叉積

首先來看叉積的標準介紹。叉積是通過兩個三維向量生成一個新的向量,新的向量滿足下面三個條件: 1)垂直於這兩個向量所張成的平面 2)其長度等於這兩個向量所形成的四邊形的面積 3)其方向滿足右手定則

右手定則如下:

接下來看看叉積的具體計算,求行列式得到的是叉積後向量的長度,叉積得到的向量的坐標是下圖中的三個「某些數」。

接下來,深入理解叉積的含義,我們通過線性變換的眼光來看叉積。我們首先定義一個三維到一維的線性變換:

先回顧一下行列式的定義,三維空間中,3 * 3矩陣的行列式是三個向量所形成的平行六面體的有向體積(絕對值是體積,但需要根據方向判定其正負號),但這並非真正的叉積,但很接近:

假設我們把第一個向量變為變量,輸入一個向量(x,y,z),通過矩陣的行列式得到一個數,這個數就代表我們輸入的向量與v和w所組成的平行六面體的有向體積:

為什麼要這麼定義呢?首先要指出的是,上面的函數是線性的。所以我們就可以將上面的行列式過程表示成一個變換過程:

同時,當線性變換是從多維到一維時,線性變換過程又可以表示為點積的形式:

即p的結果是:

所以,問題其實變換為了,找到一個向量p,使得p和某個向量(x,y,z)求點積的結果,等於對應的三維方陣行列式的值(即(x,y,z)和向量u、v所組成的平行六面體的有向體積)。

左邊是一個點積,相當於把(x,y,z)向p上投影,然後投影長度和p的長度相乘:

而右邊平行六面體的體積,可以拆解為底面積 * 高。底面積可以認為是v和w所組成的平行四邊形的面積,高的話是(x,y,z)在垂直於v和w所張成的平面的方向上的分量的長度。

那麼:

點積 = (x,y,z)在p上投影的長度 * p的長度 體積 = v和w所組成的平行四邊形的面積 * (x,y,z)在垂直於v和w所張成的平面的方向上的分量的長度

根據二者相等,可以認為p的長度是v和w所組成的平行四邊形的面積、p的方向垂直於v和w所張成的平面。這樣我們的p就找到了,而p就是我們要找的叉積的結果,是不是很奇妙!

詳細的過程還是推薦大家看一下視頻,講的真的非常好!

9、基變換

在二維空間中的向量[3,2],我們可以將其看作向量伸縮再相加的結果,比如把i即[1,0]變長為3倍,把j即[0,1]變長為2倍,再相加。

一個向量本沒有坐標,之所以能夠把向量轉換成一組坐標,或者說能把向量轉換成一組有序的數,是因為我們設定了一個坐標系。

發生在向量與一組數之間的任意一種轉化,都被稱為一組坐標系。之所以上面的向量表示為[3,2],是因為把i伸長為3倍、把j伸長為2倍,再相加的結果。平面中任意其他向量都可以表示為i和j的有向伸縮倍數,此時i和j就被稱為坐標系的基向量。

但本節想主要介紹的是基變換的概念,假設我們的朋友詹妮弗使用另一組坐標系,即有另一組不同的基向量b1和b2。

那原先在我們的坐標系中[3,2]的向量,使用詹妮弗的坐標系的話,就不再是[3,2]了,而是b1和b2的縮放倍數,即[5/3,1/3]:

同一個向量,使用不同的坐標系,得到的坐標是完全不同的,那麼如何在不同的坐標系中進行坐標轉換呢?在詹妮佛的坐標系中,她的b1和b2是[1,0]和[0,1]:

但在我們的坐標系中,b1和b2分別是[2,1]和[-1,1]:

假設在詹妮佛的坐標系中,有一個坐標是[-1,2]的向量,那麼在我們的空間中,這個向量的坐標是什麼呢?

這個向量的坐標是-1 * b1 + 2 * b2,而b1和b2在我們的坐標系中的坐標分別是,[2,1]和[-1,1],因此結果是[-4,1]

上面的過程用矩陣相乘來表示,即:

前面介紹過,一個矩陣其實代表一個線性變換,矩陣[2,-1;1,1]的意思可以理解為,將我們空間中的[1,0]、[0,1],轉換到詹妮佛空間中的[1,0]、[0,1],而詹妮佛空間中的[1,0]、[0,1],在我們空間看的話,坐標分別是[2,1]和[-1,1]。

因此將詹妮佛坐標系下一個向量的坐標轉換成我們坐標系下的坐標,只需要左乘上這個矩陣即可。

相反的,如果把我們坐標系下的一個向量的坐標,轉換成詹妮佛坐標系下對應的坐標,應該是一個相反的過程,因此使用對應矩陣的逆:

因此,想要知道我們空間中[3,2]如何轉換在詹妮佛坐標系下的坐標,需要乘上相應的逆矩陣:

最後再總結一下上面的過程,現在有兩個坐標系,我們的坐標系和詹妮佛的坐標系,兩個坐標系各有一組基向量,從各自的角度看,基向量的坐標都是[1,0]和[0,1],但是在我們的坐標系中,詹妮佛的基向量對應的坐標分別是[2,1]和[-1,1],那麼將用詹妮佛的坐標系描述的向量轉換為用我們的坐標系描述的相同向量,只需要左乘用我們的坐標系來描述的詹妮佛的基向量矩陣即可:

逆矩陣則相反:

更進一步,考慮一個旋轉90度的線性變換,我們的基向量[1,0]和[0,1],變換後的坐標分別是[0,1]和[-1,0]:

那麼在詹妮佛空間中如何表示同樣的變換呢?是左乘下面的矩陣么?

答案是否定的,上面的矩陣是在追蹤我們所選的基向量的變化,也就是說,把我們的坐標系旋轉90度得到了另一個坐標系b,坐標系b下的基向量用我們的坐標系表示的話是[0,1]和[-1,0]。

那在詹妮佛坐標系下,一個向量旋轉90度後的坐標是什麼呢?比如詹妮佛坐標系下的坐標為[-1,2]的向量,首先需要轉換到我們的空間中坐標,然後在進行旋轉90度的變換,最後在變回到詹妮佛空間中的坐標:

三個矩陣相乘的結果,就是用詹妮佛語言描述的變換矩陣:

因此,每當你看到A-1MA的時候,它其實代表的是一種數學上的轉移作用,將我們坐標系中的一個線性變換M,作用到另一個坐標系中!非常神奇!

10、特徵向量與特徵值

本篇來講一下線性代數中非常重要的一個概念:特徵向量/特徵值。

前面介紹過,一個矩陣代表的是一種線性變換,考慮二維空間中的某個線性變換,它將i即[1,0]變換到[3,0]的位置,將j即[0,1]變換到[1,2]的位置,那麼對應的矩陣就是[3,1;0,2](先說一下寫法,這裡的[3,1;0,2],其中3,1是第一行,0,2是第二行):

在這個變換過程中,很多向量都離開了其原本所張成的空間,即所在的直線,但也有一些向量在變換後,仍恰好落在原來的直線上:

如上面的例子中,基向量i就落在了原來的直線即x軸上,只不過是被拉長了三倍,同樣的,x軸上的任何其他向量在經過變換後都只是被拉伸為原來的三倍,且方向不變:

除了x軸上的向量外,向量[-1,1] 所在的直線上的向量在變換後仍在原來的直線上,只是長度被拉長了兩倍:

總結一下,在剛才的線性變換中,有兩條直線上的向量,在變換後仍在其所在的直線上,只不過長度和方向發生了改變,但其他的向量,都離開了它所張成的直線:

想必大家都知道結果了,經過上面矩陣所代表的線性變換,兩條位置不變的直線上的向量都可以稱之為特徵向量,而對應伸縮的大小,就稱之為特徵值。值得一提的是,如果線性變換後是反向伸縮,那麼特徵值是負的:

接下來簡單介紹一下特徵值和特徵向量的計算方法,首先根據剛才的介紹,一個矩陣A的特徵向量,在經過這個矩陣所代表的線性變換之後,沒有偏離其所張成的直線,而只是發生了伸縮或方向改變,所以首先可以寫出下面的式子:

接下來要求解特徵向量和特徵值,首先需要做下變換,因為等式的左邊代表的是矩陣和向量相乘,右邊代表的是一個數和向量相乘,所以先把右邊變為矩陣和向量相乘的形式,即讓λ與單位矩陣相乘:

然後就可以都移到等號左邊,提出公因子來:

接下來的目標就是求解向量v,使得v與(A-λI)相乘的結果為零向量。如果v本身是零向量的話,那等式恆成立。但我們真正想找的是非零的特徵向量。

回顧本系列視頻第五講的內容,當一個二維矩陣的行列式為0時,它能代表的線性變換能將空間壓縮為一條直線或者是零點。因此,想讓v經過(A-λI)變換後的結果為零向量,(A-λI)的行列式值必須為0,所以整個過程如下:

以最開頭提到的矩陣作為例子,很容易求解出特徵值是2或者3:

求解出特徵值了,如何求解對應的特徵向量呢?以特徵值2為例子,求解如下的方程組即可,你可以發現,一條直線上的所有向量都可以作為特徵向量:

一般情況下,一個二維矩陣有兩個特徵值,而對應的特徵向量在兩條直線上,但也存在一些特殊情況。如有時候只有一個特徵值,以及特徵向量分佈在一條直線上,如下面的矩陣,只有1個特徵值,為1:

有一些矩陣並沒有對應的特徵值,比如將空間旋轉90度的線性變換所對應的矩陣,空間中所有的向量在經過其變換後都偏離了原來的直線,旋轉了90度,因此其沒有特徵向量。

更特別的,有時候一個矩陣只有一個特徵值,但是其對應的特徵向量分佈在不同的直線上,如下面的矩陣將空間中所有的向量都拉伸了兩倍,它只有一個特徵值2,但是所有的向量都是其特徵向量:

最後,講一下特徵基的概念。講到基,又得搬出坐標系的概念了。假設我們坐標系的基是[1,0]和[0,1],如果基向量都是特徵向量,那麼會發生什麼呢?沒錯,如果基向量都是一個矩陣的特徵向量,那麼這個矩陣就是一個對角矩陣,而對角線上的值,就是對應的特徵值:

這句話反過來說對不對呢?即如果一個矩陣是對角矩陣,那麼對應的特徵向量都是基向量?好像有點問題,比如剛才的[2,0;0,2],它是一個對角矩陣,但其特徵向量包括了所有的向量,而並非只有基向量。

但很多情況下,特徵向量並非是基向量,但至少能夠找到一組能夠張成整個空間的向量集合,還是本文開頭所講的例子:

如果能找到這樣一組向量,那我們就能變換坐標系,使這些向量成為新的坐標系下的基向量。這裡先簡單回顧一下上一個視頻中所講到的基變換的概念。假設我們的坐標系基向量分別是[1,0]和[0,1],那麼矩陣[2,-1;1,1]的意思可以理解為,將我們空間中的[1,0]、[0,1],轉換到另一個空間中的[1,0]、[0,1],而另一個空間中的[1,0]、[0,1],在我們空間看的話,坐標分別是[2,1]和[-1,1](這裡可能比較繞,需要轉一下彎)。

因此,矩陣[2,-1;1,1]所代表的線性變換,可以理解為將另一組坐標系下某一個向量的坐標,轉換到我們這組坐標系下的坐標,同樣的,矩陣[2,-1;1,1]的逆代表將一個向量在我們坐標系下的坐標,轉換成另一個坐標系下的坐標。

因此如果想要將我們坐標系下的一個線性變換M,作用到另一個坐標系中,需要怎麼做呢?首先要將一個向量在另一個坐標系中的坐標轉換到我們的空間中坐標,然後在進行線性變換M,最後在變回到另一個空間中的坐標:

最後還是最開始的例子,假設想讓在我們的坐標系下得到的特徵向量(因為直線上所有的向量都可以作為特徵向量,因此這裡取了一個特例[-1,1],[1,0])作為新的坐標系下的基向量,新的坐標系下[1,0]和[0,1]對應的向量,在我們的坐標系下分別是[1,0]和[-1,1],那麼就可以得到一個基變換矩陣[1,-1;0,1](基變換矩陣可以將另一個坐標系下的坐標轉換為我們這個坐標系下的坐標)。

思考下面三個矩陣相乘的結果的結果:

假設中間的矩陣為M,那麼上面三個矩陣相乘的意思其實是對另一個坐標系下定義的向量坐標應用在我們坐標系下的線性變換M。三個矩陣相乘的結果是一個對角矩陣,且對角線元素為對應的特徵值:

從直觀上理解,由於選擇了矩陣M的特徵向量作為新坐標系下的基向量,基向量在變換中只是進行了縮放。從數學上理解,如果把上面式子中左右兩邊同左乘矩陣[1,-1;0,1],其實就是特徵向量的定義。把一個矩陣的特徵向量作為基向量,這組基向量也稱為特徵基:

根據上面的式子,使用矩陣M的特徵向量所組成的矩陣,成功將M進行了對角化。但並不是所有的矩陣都可以對角化,只有矩陣的特徵向量夠多,能夠張成全空間時,才能進行對角化。

11、抽象向量空間

這是本系列課程的最後一節,主要來重談一下什麼是向量。

什麼是向量?以二維向量為例,可以認為他是一個平面內的一個箭頭,然後在坐標系下給它賦予了一組坐標,也可以理解為是一組有序的實數對,我們只是將他形象理解為平面內的一個箭頭。

但本節想討論一下既不是箭頭,也不是一組數字,但具有向量性質的東西,如函數。函數其實是另一種意義上的向量,如滿足向量加法:

同樣滿足數乘性質:

再來說一下函數的線性變換,這個變換接受一個函數,然後把它變成另一個函數,如導數:

一個函數變換是線性的,需要滿足什麼條件呢?先回顧一下線性的嚴格定義,它需要滿足如下的兩個條件:

求導是線性運算,因為它也滿足可加性和成比例:

接下來,我們嘗試用矩陣來描述求導,先把眼光限制在多項式空間中,整個空間中可以包含任意高次的多項式:

首先給這個空間賦予坐標的含義,這需要選取一個基,這裡更準確的說法是選擇一組基函數,一個很自然的想法是(b0(x)=1,b1(x) = x,b2(x) = x2….),這組基函數的包含無限多個基函數,因為多項式的次數可以是無限的:

這樣,一個多項式函數可以表示成一組坐標,例如:

再比如:

更加通用的寫法是:

在這個坐標系中,求導是用一個無限階矩陣描述的,主對角線上方的次對角線有值,而其他地方為0,舉個例子:

這個求導矩陣是怎麼得到的呢?很簡單,對每個基函數進行求導,然後放在對應的列上即可,比如b2:

所以,乍一看矩陣向量乘法和求導是毫不相關的,但其實都是一種線性變換,但是有時候名字可能不太一樣:

哈哈,可以看到,數學中有很多類似向量的事物:

向量可以是任何事物,只要它滿足下面的八條公理即可:

好了,本系列課程的筆記就到這裡了,喜歡的大家點個贊哇!記得一定要去看原視頻喲!