ADOBE REAL-TIME CDP
何為機器學習?
快速定義: 機器學習是人工智慧 (AI) 的子集,該系統允許計算機比人類更好、更快地執行任務,涉及到的模型在給定更多數據時將提高效能。
雖然機器學習可能聽起來對大許多人來說像高深莫測的進階技術,但是對於許多組織來說,它是一個特別容易上手的工具。實際上,大多數人在日常生活中使用 ML,通常並沒有意識到而已。
關鍵要點:
- ML 模型從特定決策的結果學習,不斷改進。
- ML 具有三個核心區域 — 監管學習、非監管學習以及鞏固學習。
- 當您擁有的數據多到人腦無法處理或者沒有足夠的時間去處理時,就是該使用 ML 的最佳時間了。
- ML 透過接管數據分析師的更繁雜任務來提高效率。
查看本指南了解機器學習的工作原理、ML 的類型、好處與缺點,以及本項技術的未來。
探討此頁面各部分內容
機器學習的工作原理
機器學習的類型
使用機器學習系統的好處
機器學習算法的缺點
企業如何使用機器學習
機器學習的歷史
機器學習的工作原理
ML 是一項協助計算機系統學習和提高輸出的技術類型。機器學習使用算法,它是解決問題的規則,從機器產生更有幫助的創作。
大多數 ML 模型透過將數據輸入算法來作業。接下來,模型將自動根據預測尋找錯誤。使用過去的示例對比輸出,查找任何問題。從這裡,人類使用者將接受或拒絕這些輸出。透過訓練機器學習模型,模型不斷變得更有效和精確。ML 模型收集越多數據和體驗,它們需要的人類干預就越少。
ML 類似於 AI,但又不盡相同。機器學習是透過不斷的疊代讓計算機更加智慧的過程。但是對於 AI,計算機在沒有人類干預情況下使用其知識執行任務。這兩項技術最大的不同在於 AI 可以模擬人類智慧,而 ML 僅根據模型識別執行任務。
機器學習的類型

監管學習
監管學習是一種使用標記數據的數據科學,標記數據標記了與該數據結果相關的具體資訊。然後,訓練模型去學習什麼特征或變數將預測指定給標記輸入數據的結果。然後,模型使用輸出數據的資訊評估其績效,預測結果。
監管學習涉及兩個主要使用案例:分類和線性回歸。分類預測類別標籤。例如,您可能根據購買行為之類的屬性預測客戶是否切斷與品牌的聯繫。
線性回歸預測數值標籤。例如,您根據特定屬性認為您將從客戶收到的預測收入。結果是數值變數,而不是條件。
監管學習需要有力的機器學習模型產生高品質輸出。了解 ML 模型如何影響計算機可能產生的不同輸出類型。
非監管學習
非監管學習從一套原始、非標記數據開始。非監管學習的主要目的是找到數據集和您為模型提供的任何其他數據點之間的聯繫。
此方法可以協助您找到數據有某種關係的群組,或群集,可以用於建立客戶區段。
鞏固學習
鞏固學習先將一套原始的非標記數據輸入模型。然後,該模型採取行動。模型根據該行動,接收行動是否正確的回饋,以及行動的結果。然後,該模型建立另一個行動,不斷學習,直到實現模型最佳化。
電影串流服務(如 Netflix)的推薦算法就是很好的鞏固學習實際示例。服務向您顯示一個您可能喜歡或不喜歡的電影,透過您的「喜歡」或「不喜歡」評分確定是否繼續推薦同一類型的電影。
機器學習的歷史
雖然 ML 可能聽起來像新技術,它已經出現幾十年了。我們今天了解的機器學習可以追溯到 20 世紀 40 年代。
20 世紀 40 年代
在 1943 年,Warren McCulloch 和 Walter Pitts 建立了第一個神經網路。它允許計算機在沒有人類互動的情況下進行相互通信。
20 世紀 50 年代
Alan Turing 建立了 圖靈測試 確定機器行為是否可以像人類一樣。調查人員當今仍舊使用圖靈測試了解人類是否能夠辨析人類產生和機器產生的輸出之間的不同之處。
20 世紀 60 年代
Thomas Cover 和 Peter Hart 發佈的 K-近鄰 (KNN) 算法是第一批 ML 算法之一,可以從大量數據識別模型。
20 世紀 70 年代
Paul Werbos 在 1974 年寫了一篇標題為 The Roots of Backpropagation 的論文,為反向傳播奠定基礎,該技術允許神經網路更精準識別模式。
20 世紀 80 年代
基於解釋的學習 (EBL) 讓計算機可以根據數據來分析和自我訓練,不考慮不重要的數據。人工神經網路 NetTalk 還學習了如何正確讀出英文文字。
20 世紀 90 年代
在 1997 年,IBM 的超級計算機 Deep Blue 打敗象棋高手,讓世界為之一振。這向世界表明機器學習可以對抗甚至超過人的表現。
21 世紀
Torch(現稱 PyTorch)這個免費的軟體庫,是世界首個大型 ML 平台,讓機器學習更容易獲得。在 21 世紀,計算機還學習如何透過深度學習讀出文字和圖像。
21 世紀 10 年代
Google 開發的 Google 大腦是自動分類物件的深度神經網路。Facebook、Amazon 以及 Microsoft 也開發了 ML 模型。
21 世紀 20 年代
在 2022 年 11 月,OpenAI 的 ChatGPT 在世界刮起一股風暴。該技術使 ML 和 AI 讓每一個人都可使用,人們可以使用該技術完成從寫求職信到寫電子郵件等一切事情。

使用機器學習系統的好處
機器學習是協助業務發展的一項有用技術:
- 提高效率。超過 80% 的僱員相信 AI 提高了他們的工作績效。透過讓通常由人類完成的任務實現自動化,ML 可以提高組織的生產效率。
- 協助客戶。 公司使用 ML 最佳化他們的產品,讓客戶活得更輕鬆。實際上,如果分享數據意味著將擁有更好的體驗,62% 的消費者願意分享他們的數據。
- 降低人為錯誤。 ML 自動化通常人們易於出錯和打錯的手動任務。這表明您的組織可以利用更清潔的數據實現更好的業務見解。
- 改進可用性。 考慮到 51% 的消費者期盼業務可以全天候提供。為您的業務實施 ML 解決方案可以讓客戶無論白天黑夜都可以體驗業務。
- 消除風險。 違反合規性可能為您的組織帶來數百萬的罰款,失去業務。幸運的是,ML 遵循預定義的規則,協助您普遍保持合規性。
- 降低重複任務。 ML 自動化繁重的任務,例如數據輸入,使得您的僱員可以集中精力完成價值更高的任務。實際上,68% 的僱員想要更多 AI 技術協助他們執行任務。
- 發現見解。 ML 可以發現人腦甚至都沒有考慮的見解。
機器學習算法的缺點
機器學習算法也包含一些缺點,包括:
- 需要大量數據。 ML 模型常常需要大量數據才能生效。
- 數據集的規模。 數據集的規模和品質是確定模型好壞的兩個最大因素,您擁有的數據越多,就越需要更多時間精確標記數據以便用於監管的學習方法中。
- 結合數據類型。 您需要考慮將不同類型的數據添加到數據集中,讓模型更有力,因為您在教機器按人類的方式制定決策。
- 潛在偏見。 機器學習的另一個缺點涉及道德問題,尤其是深度學習的時候。許多模型不分享他們如何制定決策,所以,您不十分確定他們使用什麼因素。雖然該模型取決於輸入的數據,但是您仍舊不知道模型將注意到的關係類型,以及他們是否道德上公平。
- 可能不精確性。 請記住,雖然機器學習可能比人類輸出更有效,但是也不是無懈可擊。如果數據或邏輯不精確,那麼機器學習模型將反映出這些不精確性。
- 成本。 如果您想要為組織建立自訂的 ML 解決方案,那麼僱用數據科學家建立和維護這些模型需要費用。組織在使用模型的第一個五年平均花費 $60,000 到 $95,000。但是,選擇Adobe Sensei 之類的解決方案可以讓您的組織抵消許多成本。
機器學習是不完美的,但是組織可以透過為合適的場景選取恰當的 ML 來克服其中許多缺陷。
企業如果使用機器學習
有許多實例顯示實施 ML 算法可以協助簡化和最佳化組織的資源。常見的例子是巨量數據多到人類無法篩選,但是其中包含公司決策所需的重要資訊。
此好處不僅僅針對技術企業,全世界 68% 的公司使用 ML,該數字有可能攀升。因為機器學習非常有益,對它的使用也推廣到不同產業。
醫療保健業
醫療保健業公司使用 ML 處理大量患者數據,同時遵從數據保護法律。例如,一些組織使用機器學習改進診斷成像的精確性以發現早期疾病。它還有助於測查欺詐,發現錯誤,以及個人化治療。
製造業
更多製造商使用 ML 進行更智慧的預防性維護。與其浪費時間和金錢維護不需要維護的機器,製造商使用機器學習分析數據趨勢,最佳化哪個機器需要維護。
但是這不是製造商使用機器學習的唯一方法。他們還可以利用此技術管理他們設施內的半自動化和自動化車輛。
娛樂
您具有 Netflix 帳戶嗎?如果有,您就看到 ML 的實際運用了。串流服務使用機器學習,個人化縮圖,推薦電影和劇集,最佳化串流品質。

行銷
假如您的行銷團隊正在審查來自不同客戶區段的新數據。很難透過不同的客戶屬性來識別高效能區段,或者客戶區段 A 區別于客戶區段 B 的偏好是什麼?
有這麼多可用的數據,您的銷售團隊可能根本沒有那麼多精力處理數據,更不用說收集任何有用的見解。這時候就需要 ML 了,它可以更快、更好地完成。
使用機器學習自動化可能帶來預測性見解,而這可能是您的團隊本身發現不到的。
金融
在金融界機器人顧問正在日益受到追捧。例如,Wealthfront 服務使用 ML 和 AI 為使用者自動化資產組合管理。它縮短了金融公司用於管理客戶投資的時間,同時仍舊為客戶提供受管投資的好處。
藉助機器學習助力非凡的客戶體驗。
需要利用機器學習 (ML) 改進分段和個人化?Adobe Real-Time CDP 可以提供協助。