2023年5月18日 星期四

AI 入門:7.人工智慧、機器學習、深度學習的定義(人工智慧 28 堂基礎課程)

人工智慧(AI)、機器學習(ML)和深度學習(DL)是目前流行的三個術語,用來描述電腦如何從資料中轉化出有價值的見解。儘管這些術語經常被拿來互換使用,但正如下圖所示,它們實際上是有區別的。更準確地說,您可以將人工智慧(AI)、機器學習(ML)和深度學習(DL)比作相互嵌套的俄羅斯娃娃,其中最外層、最大的娃娃是人工智慧(AI),中間的是機器學習(ML),最內層、最小的娃娃則是深度學習(DL)。

.
人工智慧(AI)是一個包羅萬象的概念,它的目的在開發出能夠執行類似於人類智慧所能勝任的工作的一種智慧型機器。機器學習(ML)是一種廣泛的技術,它允許電腦利用既有資料和一個或多個“訓練”演算法自主進行“學習”,而不是經過明確的程式邏輯設計來產生出結果。深度學習(DL)則是一種實現機器學習(ML)的技術,它依靠深度人工神經網路來完成複雜任務,例如圖像識別、物體檢測和自然語言處理。(神經網路是一種演算法集合,鬆散地仿效人腦中的神經網路,以識別出隱藏在資料中的模式)。

人工智慧不是一個近期才出現的新發明。事實上,正如上圖所示,自從 1950 年 Alan Turing 發表了“Computing Machinery and Intelligence”論文以來,它一直存在於我們的想像之中。隨後,在 1955 年,Dartmouth 學院的數學助理教授 John McCarthy 使用“Thinking machines”這個詞彙來描述這一個新興領域的專門研究,自此之後,人工智慧就一直是電腦科學專業詞彙的一部分。

人工智慧可以簡單到像一組 IF-THEN 程式設計語句,也可以複雜到像一個統計模型,其核心精神在於將人類的感知資料轉換為一系列的類別符號。IF-THEN 語句是人類程式設計師明確編碼的規則,事實上,將多組 IF-THEN 語句結合使用,有時被稱為規則引擎、專家系統、Symbolic AI,或者也被稱之為 GOFAI(代表 Good, Old-Fashioned AI 的縮寫)。因此,有些人認為,當一個由人工智慧研究人員設計出的電腦程式在國際象棋比賽中擊敗人類世界冠軍時,這並不能真正證明它是人工智慧,因為這位研究人員對演算法的內部結構非常瞭解。相反,真正的人工智慧是那些被設計成具備認知能力的電腦系統,它能夠察覺上下文中的微小差異並做出經過推理分析的決策。在某種程度上,這些人的想法是正確的,因為人工智慧有兩種不同的解釋方式。

許多早期的人工智慧先驅者夢想著透過電腦建構出一個擁有與人類智慧相同特徵的複雜機器,這種概念在《2001 太空漫遊》和《魔鬼終結者》等美國科幻電影中被塑造成為一股流行熱潮,現在被稱為“通用型人工智慧 (General AI)”。儘管目前仍無法真正實現這類型的人工智慧機器,但我們正處在一個電腦能夠提供“狹義型人工智慧 (Narrow AI) ”(或“先進型人工智慧 (Modern AI)”)的階段,它可以被描述為一種能夠執行特定工作任務的技術,具有可重複性,並且有時可以比人類更加出色地完成任務。

機器學習(ML)是人工智慧(AI)的一個重要子集。相較於其他類型的人工智慧(如規則引擎或專家系統),機器學習之所以被區隔出來,是因為它具備在接觸更多資料時修正自己的能力。機器學習中的“學習”指的是演算法(或模型)試圖朝某個維度進行優化,通常是為了將預測誤差最小化或是將預測正確率極大化。這種“學習”能力使得機器學習能夠從大量的資料中自主學習,不斷地提高預測能力與效率。

深度學習(DL)是機器學習(ML)的一個子集,這個概念已經存在相當長一段時間。當人們使用深度學習這個術語時,通常他們指的是深度人工神經網路 (Deep Artificial Neural Networks)。在這種情況下,“深度”是一個技術術語,指的是神經網路本身使用的層數 (Layers)。淺層神經網路 (Shallow Neural Network) 僅有一個隱藏層 (Hidden Layer),而深度神經網路 (Deep Neural Network) 可以包含數百個隱藏層。多個隱藏層允許深度神經網路在所謂的特徵層次 (Feature Hierarchy) 中學習資料的特徵,較為簡單的特徵(例如圖片中的單點像素)可以從一層重新組合到下一層,形成更為複雜的特徵(例如圖片中的線條)。相較於層數較少的神經網路,層數較多的神經網路可以透過更多的數學運算來傳遞資料(特徵),因此訓練時的資料計算量會更大。

在 2010 年之前,使用深度學習來完成工作的情況相對罕見。因為即使是淺層神經網路也需要進行極其密集的計算,而當時實現深度學習所需的三項重要能力:巨量的標記型資料儲存設備、新發明的深度學習演算法、以及便宜且強大的 CPU 與 GPU 運算資源還未完全普及。這些因素造成深度學習僅能在研究論文和實驗室中實現,但卻較難將這些研究成果轉移到現實世界的商業應用。現在,這三項重要能力已逐漸普及,深度學習的採用和使用方式已成為傳統企業轉型為認知型企業的重要戰略考量。

正如前面所提到的,AI、ML 和 DL 這些術語經常被誤用。然而,這三種技術都涉及分析大量資料以尋找共同樣態的過程,然後將這些樣態轉換為支援企業決策所需的預測力與洞察力。儘管 AI、ML 和 DL 的定義和技術成分不同,但它們的最終目標都是一致的。

學習補充資料:
  • Artificial Intelligence (AI)

    人工智慧(AI)是一個廣泛用於描述讓電腦能夠模擬人類智慧的技術術語。這項技術可以透過邏輯、IF-THEN 規則、決策樹、機器學習(包括深度學習)等技術來實現。在過去幾年中,特別是自 2015 年以來,對人工智慧的興趣和使用呈現出爆炸性的成長。這個現象主要與電腦儲存和運算能力的顯著提升有關。運算能力的提升讓電腦讓電腦平行處理的速度越來越快,成本更低廉。儲存能力的提升也讓各種類型的資料,諸如交易、圖像、視頻和社群媒體貼文等,更容易被儲存和進行分析應用。

    正如我們前面提到的,人工智慧有不同的類型,儘管“General AI”的機器尚無法真正實現,但能夠跟人類一樣,甚至比人類更優秀的“Narrow AI”技術已普遍應用於日常生活中。例如,在電商網站上,它可以分析客戶行為並為客戶推薦商品;在圖片分享社群網站上,它可以對圖片進行分類;在串流視頻網站上,它可以為使用者推薦電影或電視節目等。

  • Machine Learning (ML)

    機器學習(ML)是人工智慧(AI)的一種應用,它為電腦系統提供了自動學習和改進經驗的能力,而無需程式設計師為其定義明確的規則與判斷邏輯。基本上,機器學習是一種以資料為基礎的學習方式,透過存取資料和使用精心調整的演算法來不斷優化自身的學習能力。實現機器學習的演算法包括決策樹學習 (Decision Tree Learning)、歸納式邏輯程式設計 (Inductive Logic Programming)、集群分析 (Clustering)、強化學習 (Reinforcement Learning) 以及單純貝式分類器 (Naive Bayes Classification) 等。這些演算法通常用於解決現實生活中的問題,例如自然語言處理、圖像識別、聲音辨識和推薦系統等。

    多年來,機器學習在許多應用領域中表現卓越,其中之一就是電腦視覺 (Computer Vision)。儘管在實現電腦視覺應用的過程中,仍需要大量的人工程式碼,例如,工程師們會開發邊緣檢測器等特徵提取工具,協助電腦程式識別物體特徵。除此之外,他們還會設計形狀檢測演算法,使電腦程式能夠對圖像中的文字和數字進行判斷與分類,例如車牌辨識等應用。這種視覺識別技術仍存在局限性,實現過程既費時又容易出錯,然而真實世界的應用卻是推動這類機器學習技術發展的最佳原動力。

  • Deep Learning (DL)

    深度學習(DL)是機器學習(ML)的一個子集,它仰賴於一套複雜的演算法來識別資料中隱藏的樣態。這些演算法會根據從輸入樣本資料中發現的相似性對未標記的資料進行分組,並且透過對已標記的資料集進行訓練,讓電腦可以進行分類。深度學習透過將多層神經網路暴露在大量資料中,讓電腦程式能夠學習並執行語音和圖像識別等任務。儘管深度學習需要大量的資料和計算能力,但它在處理複雜問題方面表現出色,並在自然語言處理、圖像處理、語音識別等領域中獲得了巨大的進展。


如果您想進一步了解 AI、ML 和 DL 的相關資訊,可以參考:《這個文章連結》,這篇文章提供了本堂課所述內容的相關說明和補充資料。





人工智慧 28 堂基礎入門課程,完整目錄連結:
1.課程目的 15.分類(Classification)
2.資料就是新一代的能源 16.低度擬合與過度擬合
3.結構化資料 17.分群(Clustering)
4.非結構化資料 18.整合學習方法
5.半結構化資料 19.模型參數與超參數
6.為資料加上維度的概念 20.深度學習框架
7.人工智慧、機器學習、深度學習的定義 21.深度學習的主力 – 神經網路
8.構成 AI, ML 與 DL 的基本元素 22.影像辨識 - 卷積神經網路(CNN)
9.機器(深度)學習工作流程 23.自然語言處理 - 循環神經網路(RNN)
10.模型具體是什麼? 24.生成式對抗網路(GAN)
11.資料準備-維度縮減 25.移轉學習
12.資料準備-資料分割 26.衡量預測結果的品質
13.機器學習方法概述 27.實作 ML 與 DL 的挑戰
14.迴歸(Regression) 28.IBM AI 階梯方法論







版權聲明
人工智慧 28 堂基礎入門課程系列文章係依據 IBM 原廠英文教材進行適度翻譯與內容調整而成,每一門課程使用的主圖片其版權歸屬於 IBM 公司。文章內容未經授權,請勿進行任何形式的複製、修改或發佈本文內容,如需轉載或引用,請在使用時注明出處並取得授權。本文中提及的特定公司、產品、品牌名稱等僅為描述目的,其版權歸屬於相應的公司或擁有者。

沒有留言:

張貼留言