2023年5月18日 星期四

AI 入門:2.資料就是新一代的能源(人工智慧 28 堂基礎課程)

在 2006 年,英國數學家 Clive Humby,同時也是資料科學與商業策略領域的知名企業家,提出了“Data is the new oil.”這句話。不久之後,美國國家廣告商協會的執行副總裁 Michael Palmer 在一篇文章中擴大闡述了這一觀點,他寫道:「就像石油一樣,資料也是有價值的,但如果沒有經過適當提煉,就無法真正發揮其價值。它必須被轉化為瓦斯、塑膠原料、化學製品等,才能創造出有價值的實體,推動有利可圖的活動;因此,資料必須被分解和分析,才能突顯其價值。」

.
然而,企業該如何處理他們所掌握的海量資料?又如何將這些有價值的“原油”轉換成更有價值的商品,以獲得支援決策所需的洞察力呢?考慮到資料量正以指數級成長,這些問題在當今比 2006 年更具意義。根據統計資料網站 Statista(https://www.statista.com)的統計數據,2021 年全球共產生、複製、擷取或使用了將近 74 zettabytes 的資料,而這個數字預計到 2024 年將成長翻倍!因此,企業必須更有效地善用人工智慧(AI)、機器學習(ML)和深度學習(DL)等技術工具,以處理這些大量的資料並獲得支援決策所需的洞察力,進而提升企業的數位轉型競爭力。

那麼,究竟什麼是資料?在電腦科學領域中,資料被轉換成一種易於儲存、移動和處理的二進位格式,也就是只使用 0 和 1 兩個數字所代表的數位模式。在資料科學領域中,資料通常會被歸類為以下三種類型:

  • 結構化資料 (Structured Data)
  • 非結構化資料 (Unstructured Data)
  • 半結構化資料 (Semi-structured Data)

從技術角度來看,所有的資料都有一定的結構。要歸類於結構化、非結構化或半結構化資料,往往需要先確定該資料是否具有預先定義的結構或以預先定義的方式進行組織。接下來的三堂課,我們將分別介紹結構化資料、非結構化資料和半結構化資料的定義。

參考資料:


1.課程目的 《 上一堂課    下一堂課 》 3.結構化資料



人工智慧 28 堂基礎入門課程,完整目錄連結:
1.課程目的 15.分類(Classification)
2.資料就是新一代的能源 16.低度擬合與過度擬合
3.結構化資料 17.分群(Clustering)
4.非結構化資料 18.整合學習方法
5.半結構化資料 19.模型參數與超參數
6.為資料加上維度的概念 20.深度學習框架
7.人工智慧、機器學習、深度學習的定義 21.深度學習的主力 – 神經網路
8.構成 AI, ML 與 DL 的基本元素 22.影像辨識 - 卷積神經網路(CNN)
9.機器(深度)學習工作流程 23.自然語言處理 - 循環神經網路(RNN)
10.模型具體是什麼? 24.生成式對抗網路(GAN)
11.資料準備-維度縮減 25.移轉學習
12.資料準備-資料分割 26.衡量預測結果的品質
13.機器學習方法概述 27.實作 ML 與 DL 的挑戰
14.迴歸(Regression) 28.IBM AI 階梯方法論







版權聲明
人工智慧 28 堂基礎入門課程系列文章係依據 IBM 原廠英文教材進行適度翻譯與內容調整而成,每一門課程使用的主圖片其版權歸屬於 IBM 公司。文章內容未經授權,請勿進行任何形式的複製、修改或發佈本文內容,如需轉載或引用,請在使用時注明出處並取得授權。本文中提及的特定公司、產品、品牌名稱等僅為描述目的,其版權歸屬於相應的公司或擁有者。

沒有留言:

張貼留言