深度學習:超平面(Hyperplane)

YC
3 min readNov 15, 2017

--

深度學習需要使用到的資料很少只有二維、三維空間,更多的是多維空間,因為數據很少是只有一兩種特徵,數據的特徵愈多,我們需要的維度就愈大。而在這麼多的資料中,我們要分類一組數據,很常就會用到超平面這種模型元件。

多維空間是不可視覺化的,我們常說的「點、線、面」分別就是一維、二維、三維空間的超平面。我們身處的,可以看到的極限也就只是三維空間。那四維、五維等等之後的多維空間呢?

我們可以簡單參考一下 Maths Stack 的回答。

超平面是一種可以以某種型式分割空間的方法(元件),如:
1. 我們可以用線來分割開一個平面

中間的線把二維的平面分開了

2. 我們可以用平面來分割開一立體

平面將三維空間分割開

3. N維空間我們就需要使用一個 (N-1) 的超平面來為我們分割。

那為什麼是 (N-1) 呢?

因為在三維中,我們需要平面 (2D) 來分割,而在二維中,我們需要線來分割 (1D) ,所以我們可以推導出在N維空間,我們需要的是 (N-1) 的超平面來進行分割。

而在數學上來看,不管我們的維度是多少,都可以簡化成:

因為在三維空間中,一平面上的所有點都是受方程式:

規範。推廣至多維空間,亦就是以下這個方程式:

所以我們要在深度學習上進行一些線性的分類,我們可以使用上面的方程式作為一種可能的 model !

因為我不是數學專業,對數學推理更有興趣的可以參考:超平面 |線代啟示錄

如果你覺得我的文章幫助到你,希望你也可以化讚為賞,加入 Liker ,再按下方的綠色拍手按鈕,為文章點讚!為作者增加收益,再回饋更多好文章!

--

--

YC

提供更精確的技術內容為目標,另創立「程式愛好者」專頁。資深軟體工程師,專研後端技術、物件導向、軟體架構。