深度學習需要使用到的資料很少只有二維、三維空間,更多的是多維空間,因為數據很少是只有一兩種特徵,數據的特徵愈多,我們需要的維度就愈大。而在這麼多的資料中,我們要分類一組數據,很常就會用到超平面這種模型元件。
多維空間是不可視覺化的,我們常說的「點、線、面」分別就是一維、二維、三維空間的超平面。我們身處的,可以看到的極限也就只是三維空間。那四維、五維等等之後的多維空間呢?
我們可以簡單參考一下 Maths Stack 的回答。
超平面是一種可以以某種型式分割空間的方法(元件),如:
1. 我們可以用線來分割開一個平面
2. 我們可以用平面來分割開一立體
3. N維空間我們就需要使用一個 (N-1) 的超平面來為我們分割。
那為什麼是 (N-1) 呢?
因為在三維中,我們需要平面 (2D) 來分割,而在二維中,我們需要線來分割 (1D) ,所以我們可以推導出在N維空間,我們需要的是 (N-1) 的超平面來進行分割。
而在數學上來看,不管我們的維度是多少,都可以簡化成:
因為在三維空間中,一平面上的所有點都是受方程式:
規範。推廣至多維空間,亦就是以下這個方程式:
所以我們要在深度學習上進行一些線性的分類,我們可以使用上面的方程式作為一種可能的 model !
因為我不是數學專業,對數學推理更有興趣的可以參考:超平面 |線代啟示錄