非結構化資料指的是沒有預先定義的資料結構或沒有以預先定義的方式進行組織的資料,例如圖畫 (Drawings)、攝影圖片 (Photographic images)、音訊檔案 (Audio clips) 和影像視頻 (Videos),這些都屬於非結構化資料。需要注意的是,少量詮釋資料 (Metadata),也就是用於定義資料本身的屬性,也可以和這種類型的資料一起儲存,以利於後續使用。例如,在 JPEG (Joint Photographic Experts Group) 格式檔中,圖像資料儲存時會有一些結構化的中繼資料伴隨著圖像資料一起儲存,因此選定的應用程式將知道如何使用這些資料在電腦螢幕上呈現圖像。
.
根據 Gartner 的資料顯示,大約 80% 的企業資料是以非結構化形式所產生。同時,IDC 也指出,非結構化資料每年的成長率約為 26.8%,而結構化資料的成長率僅為 19.6%。推動這個趨勢的不僅僅是人們每天產生的數位影像、錄音、視頻和社交媒體文章,還包括越來越多由機器設備或醫療設備等機器所產生的非結構化資料,以及用來協助電子零件設計與地理空間建模等工作任務的軟體所產生的非結構化資料。
隨著企業擁抱人工智慧(AI)、機器學習(ML)和深度學習(DL),非結構化資料正在成為企業產品設計和商業運營的關鍵要素。這是因為 ML 和 DL 演算法能夠從非結構化資料中獲得有價值的見解,而這些見解以前是難以獲得的。例如,醫療產業開始意識到,ML 和 DL 模型可以利用以影像形式呈現的非結構化資料來診斷癌症和其他疾病。在其他應用領域,ML 和 DL 模型也正被用於探索社交媒體模式,以了解使用者對特定產品或服務的情緒反應(他們的感受),並透過聊天機器人(通過音訊或文本進行對話的軟體)來回答傳統上由客戶服務工作人員處理的問題。這已經充分表現出非結構化資料的價值越來越受到重視,並且在幫助企業獲取競爭優勢方面發揮著重要作用。
人工智慧 28 堂基礎入門課程,完整目錄連結:
版權聲明
人工智慧 28 堂基礎入門課程系列文章係依據 IBM 原廠英文教材進行適度翻譯與內容調整而成,每一門課程使用的主圖片其版權歸屬於 IBM 公司。文章內容未經授權,請勿進行任何形式的複製、修改或發佈本文內容,如需轉載或引用,請在使用時注明出處並取得授權。本文中提及的特定公司、產品、品牌名稱等僅為描述目的,其版權歸屬於相應的公司或擁有者。
沒有留言:
張貼留言