機器學習基礎

人工智能(AI)是使計算機模擬人類認知行爲或智力的任何代碼,算法或技術。 機器學習(ML)是AI的一個子集,它使用統計方法使機器學習和改進經驗。 深度學習是機器學習的一個子集,它使得多層神經網絡的計算變得可行。 機器學習被視爲淺層學習,而深度學習被視爲具有抽象的層次學習。

機器學習涉及廣泛的概念。 這些概念如下 -

  • 監督
  • 無監督
  • 強化學習
  • 線性迴歸
  • 成本功能
  • 過度擬合
  • 根據擬合
  • 超參數等

在監督學習中,我們學習從標記數據預測值。 一種叫作ML的技術可以幫助分類,其中目標值是離散值; 例如,貓和狗。 機器學習中的另一個可能有用的技術是迴歸。 迴歸對目標值起作用。 目標值是連續值; 例如,可以使用迴歸分析股票市場數據。

在無監督學習中,我們根據未標註或結構化的輸入數據進行推理。 如果我們有一百萬條醫療記錄,並且我們必須理解它,找到潛在的結構,異常值或檢測異常,我們使用聚類技術將數據劃分爲大集羣。

數據集分爲訓練集,測試集,驗證集等。

2012年的突破帶來了深度學習的概念突出。 算法使用2個GPU和大數據等最新技術成功將100萬個圖像分爲1000個類別。

關於深度學習和傳統機器學習

傳統機器學習模型遇到的一個主要挑戰是一個稱爲特徵提取的過程。 程序員需要具體,並告訴計算機要查找的功能。 這些功能將有助於做出決定。

將原始數據輸入算法很少有效,因此特徵提取是傳統機器學習工作流程的關鍵部分。

這給程序員帶來了很大的責任,算法的效率在很大程度上依賴於程序員的創造性。 對於複雜的問題,如對象識別或手寫識別,這是一個很大的問題。

深度學習能夠學習多層表示,是幫助我們進行自動特徵提取的少數幾種方法之一。 較低層可以被假定爲執行自動特徵提取,而幾乎不需要程序員的指導。