上一篇的文章中,我們帶投資人了解何謂演算法,並認識了第一個簡單的演算法 KNN(K-Nearest Neighbors,最近鄰居法)。本篇文章將介紹另外一個核心精神與 KNN 相似的演算法 K Means(K-平均演算法,以下簡稱 K Means),並實際將該演算法運用在投資上,展現其簡單運算背後隱藏的大威力。
KNN 演算法是在清楚知道哪些是藍色球、哪些是紅色球的情況下,要判斷手中的灰球會是什麼顏色。而K Means 演算法則是要在完全不知道每顆球的顏色情況下,判斷哪些是紅色球或藍色球。
儘管知道的資訊不同,但核心假設都一樣,同樣顏色的球應該會落在附近(你會跟背景與你相似的人較像)。假設我們知道上圖的灰色球可以分成 3 類(與 KNN 演算法的 K 值一樣,都是自行決定),則演算法會隨機選取 3 顆中心球(上圖的 A、B、C),並分別給與藍紅黃等不同顏色,接著審視每顆剩下的球,看該球與哪顆中心球最接近,便屬於一樣的顏色(以 D 球為例,因為與 A 球最近,所以 D 球是藍色)。判斷完後,計算每顆球與中心球的距離後加總,再隨機選取 3 顆中心球,計算距離總和,反覆此流程,最後以距離總和最小的 3 顆中心球,為最後答案。
K Means 演算法最大的特色,是能夠在對一堆資料沒有頭緒的情形下,讓電腦幫你先分類。以判斷經濟週期為例,假設我們有一大堆不同的經濟指標(失業率、通貨膨脹率、採購經理人只數等),但我們不知道怎麼定義景氣週期。我們只需要把這一大堆資料用 K Means 演算法處理,各類指標相近的便會被分在同一類中。舉例來說,低失業率、低通貨膨脹率、高採購經理人指數的資料可能就會被分在一類,而該類應該代表景氣好,且未來股價表現應該較佳。
下圖與表為我們剛才提到,將一堆經濟資料分為 5 個類別後的結果。假設我們對於景氣週期與股市連結的看法正確,則應該會看到不同的預期報酬率。從下表可看出,群組 3 與 4 應該代表景氣好,未來半年股市上漲機率高達 80% 以上,平均報酬率也較為出色;群組 0 則是景氣接近衰退,未來半年股市上漲機率只有 17.4%,平均報酬率也低至 -10.3%。對應的投資策略應該為,當目前景氣週期屬於群組 3 或 4 時,股市佔資產配置權重應較高,當落到群組 0 時,股市佔比應該顯著降低。
基金操作上,建議如下:
對於不知道如何判斷景氣週期或財報好壞的投資人,可以放心將任務交給可一次檢視大量資料的機器人,讓阿發總管成為財富管理的最佳幫手。
精選基金 | 申購 |
鉅亨阿發總管 | 更多詳情 |