2023年5月18日 星期四

AI 入門:25.移轉學習(人工智慧 28 堂基礎課程)

想像一下,當我們進入一個新的領域,必須學習如何熟悉其中的新事物,而在沒有過去經驗的指導下,這項任務可能會讓人感到困惑。例如,一個從未有過烹飪經驗的人可能會對在傳統市場採買食材這件事感到陌生,甚至得需要透過嘗試錯誤 (Trial-and-error) 的方式才能完成。好在,我們可以參考自己過去在其他相關領域的經驗(例如陪著家人在超市或大賣場購物的經驗),來指導我們在新領域中的行為。這種利用在某種情況下獲得的學習知識來協助另一種情況的能力被稱為"移轉 (Transfer)"。因此,無論是一位正在取得碩士學位的學生,還是一位希望持續擁有市場最新技術的專業人員,都能夠將在一種情況下學習到的經驗與知識移轉到新的領域中。這個能力的重要性再怎麼強調都不過分。

.
在機器學習(ML)領域,尤其是深度學習(DL)領域,移轉學習 (Transfer learning) 是一種設計方法 (Design methodology),它的概念是利用已經在某個任務中訓練好的模型來解決另一個不同但又有點相關的問題。例如,若您訓練了一個簡單的分類器 (Classifier) 來預測一張圖片是否包含一朵花,您可以利用這個模型在訓練期間學習到的知識來識別其他物體,例如昆蟲或鳥類。基本上,移轉學習試圖利用在一個任務中學到的知識來提升對另一個任務的概括能力 (Generalization)。

就本質上而言,移轉學習並非屬於一種 ML/DL 技術,但它已經變得相當普遍,因為它能夠讓深度神經網路利用相對較少的資料進行訓練。這一點很重要,大多數現實世界的問題,通常缺乏數以百萬計的標記資料 (Labeled data) 可用來訓練複雜的神經網路模型。因此,移轉學習的好處除了可以減輕對大量資料的需求,還可以節省訓練時間、訓練成本和提高模型性能所需的運算資源。

儘管移轉學習擁有實用上的價值,但要在不同任務之間成功地應用它仍然需要一定程度的技巧和經驗。一般而言,移轉學習適用於兩個任務之間存在一些共同點的情況,例如類似的輸入、類似的特徵或相似的問題結構。正如資料科學領域經常遇到的難題:很難找到一體適用的規則,來決定要使用哪個機器學習方法。然而,以下是一些基本準則,可以幫助您判斷何時適合使用移轉學習:
  • 無法取得足夠的已標記訓練資料,可以從頭開始訓練一個神經網路;
  • 已經存在一個在大量資料上被訓練來執行類似任務的神經網路;
  • 需要建立一個新的神經網路,但已經有一個預先訓練好,具有相同輸入資料的神經網路可供使用。

然而需要注意,移轉學習只有在從第一個任務中學到的特徵具備泛化的特性 (Generalization),才能將這個神經網路應用於其他相關的任務。回想第 22 堂課提到的 CNN,第一個任務中學到的特徵可以類比為神經網路隱藏層的第一層,它主要萃取一些通用的特徵,例如圖像分類的神經網路,第一個卷積層找出來的都是圖像的基本特徵,像是邊角與線條等。因此,若採用移轉學習,我們可以基於這個預先建立的圖像分類神經網路,從第二個卷積層開始訓練我們的資料。此外,新模型的輸入資料必須具備與已訓練模型相同的特徵數量。如果特徵數量過多,可使用降維的方式減少輸入資料的特徵。

對於常見的深度學習任務(例如圖像分類),實務上有幾個預先訓練的模型可供使用,資料科學家通常都會把它們當作移轉學習的基礎模型。其中最受歡迎的是 Inception-v3,它是一個 CNN 模型,已經在 ImageNet 資料庫的 100 多萬張圖片上完成了訓練。其他的模型還包括 ResNet、AlexNet,以及 MicrosoftML 函式庫(它是由 Microsoft 提供的 Python 函式庫,為 SQL Server 機器學習服務提供高性能的 ML 演算法)。


24.生成式對抗網路(GAN) 《 上一堂課    下一堂課 》 26.衡量預測結果的品質



人工智慧 28 堂基礎入門課程,完整目錄連結:
1.課程目的 15.分類(Classification)
2.資料就是新一代的能源 16.低度擬合與過度擬合
3.結構化資料 17.分群(Clustering)
4.非結構化資料 18.整合學習方法
5.半結構化資料 19.模型參數與超參數
6.為資料加上維度的概念 20.深度學習框架
7.人工智慧、機器學習、深度學習的定義 21.深度學習的主力 – 神經網路
8.構成 AI, ML 與 DL 的基本元素 22.影像辨識 - 卷積神經網路(CNN)
9.機器(深度)學習工作流程 23.自然語言處理 - 循環神經網路(RNN)
10.模型具體是什麼? 24.生成式對抗網路(GAN)
11.資料準備-維度縮減 25.移轉學習
12.資料準備-資料分割 26.衡量預測結果的品質
13.機器學習方法概述 27.實作 ML 與 DL 的挑戰
14.迴歸(Regression) 28.IBM AI 階梯方法論







版權聲明
人工智慧 28 堂基礎入門課程系列文章係依據 IBM 原廠英文教材進行適度翻譯與內容調整而成,每一門課程使用的主圖片其版權歸屬於 IBM 公司。文章內容未經授權,請勿進行任何形式的複製、修改或發佈本文內容,如需轉載或引用,請在使用時注明出處並取得授權。本文中提及的特定公司、產品、品牌名稱等僅為描述目的,其版權歸屬於相應的公司或擁有者。

沒有留言:

張貼留言