2023年5月18日 星期四

AI 入門:6.為資料加上維度的概念(人工智慧 28 堂基礎課程)

目前為止,您已經可以大致區分出不同類型的資料。接下來,我們將從維度 (Dimensions) 的角度來談一談資料。首先,從幾何學來理解維度的概念,當涉及到二維(2-D)和三維(3-D)物體時,維度非常容易理解。例如,畫在紙上的圓形、方形或三角形存在有“寬度”與“高度”這兩個維度。如果是球體、立方體或三角錐體時,便會有“寬度”、“高度”與“深度”這三個維度。

對人類來說,將物體四維視覺化並不是一個困難的任務。在上圖中,有一個四維的例子,從一個顯示 X、Y 和 Z 平面的三維圖形開始,然後加入顏色來代表第四維度。在現實世界中,第四維通常會被稱為時間維度。因此,當一個盒子從一個人手中扔到另一個人手中時,這個盒子存在有四個維度,包括盒子的長度、寬度和高度,以及盒子在空中飛行的時間。

要如何用圖形表示第五維、第六維甚至是更高的維度呢?假設您的資料儲存在一個有四列或更多列的表格中,您可以將每一列都視為資料的不同維度。想像四維以上的資料可能是什麼樣子並不難,但試圖在所有維度中找出資料樣態 (Patterns) 或相互關係 (Correlations) 則變得非常困難。

簡而言之,擁有越多個維度會讓解決問題的難度成倍增加。您的資料若維度越多,您必須檢查更多的資料組合,以便在所有可能的維度組合中找出資料樣態。這也是為什麼線性代數 (Linear Algebra)、機率 (Probability) 和微積分 (Calculus) 成為相當重要的工具。因此,在您嘗試將資料用於人工智慧(AI)、機器學習(ML)和深度學習(DL)之前,消除任何不需要的資料維度是個不錯的主意。





人工智慧 28 堂基礎入門課程,完整目錄連結:
1.課程目的 15.分類(Classification)
2.資料就是新一代的能源 16.低度擬合與過度擬合
3.結構化資料 17.分群(Clustering)
4.非結構化資料 18.整合學習方法
5.半結構化資料 19.模型參數與超參數
6.為資料加上維度的概念 20.深度學習框架
7.人工智慧、機器學習、深度學習的定義 21.深度學習的主力 – 神經網路
8.構成 AI, ML 與 DL 的基本元素 22.影像辨識 - 卷積神經網路(CNN)
9.機器(深度)學習工作流程 23.自然語言處理 - 循環神經網路(RNN)
10.模型具體是什麼? 24.生成式對抗網路(GAN)
11.資料準備-維度縮減 25.移轉學習
12.資料準備-資料分割 26.衡量預測結果的品質
13.機器學習方法概述 27.實作 ML 與 DL 的挑戰
14.迴歸(Regression) 28.IBM AI 階梯方法論







版權聲明
人工智慧 28 堂基礎入門課程系列文章係依據 IBM 原廠英文教材進行適度翻譯與內容調整而成,每一門課程使用的主圖片其版權歸屬於 IBM 公司。文章內容未經授權,請勿進行任何形式的複製、修改或發佈本文內容,如需轉載或引用,請在使用時注明出處並取得授權。本文中提及的特定公司、產品、品牌名稱等僅為描述目的,其版權歸屬於相應的公司或擁有者。

沒有留言:

張貼留言