機器學習就是電腦從數據中學習出規律和模型,以應用在新數據上做預測的任務。它是人工智能(AI:Artificial Intelligence )的子領域;而深度學習 其實是機器學習的分支。機器學習就是利用統計學與要學習的歷史樣本數據的分佈對總體樣本分佈進行估計。分析數據的特性建立數學分佈模型,並利用最優化的知識對模型的參數進行調優學習,使得最終的學習模型能夠對已知樣本進行很好的類比與估計;最終利用學習好的模型對未知標籤的樣本進行預測。【讀友提問】台商○鍾公司鍾總問到:「機器學習,面對沒有數理背景的人,請直白說明好嗎?」答:先說機器學習的特點:(1).以數據為研究物件;(2).對數據進行分析與預測;(3).利用統計學習的方法構建模型,並且利用模型對未知數據進行分析與預測。機器學習研究的物件是多維向量空間的數據,它從各種不同類型的數據(數據元、文本、圖像、音訊、視頻)出發,提取數據的特徵,導出數據的模型,發現數據中的知識,又回到數據的分析與預測。機器學習四分類:(1).無監督學習:採用演算法,把特徵性質相近的樣本聚在一起成為一類(聚類),靠算法(K均值聚類、主成分分析、關聯規則、社會網絡分析)從數據集中發現模型。(2).半監督學習:結合監督學習和無監督學習的一種模型學習方式。因真正的模型建立的過程中,有類標的數據樣本很少,無法直接應用監督的學習方法進行模型的訓練。(3).監督學習:使用數據中已有的模型做預測,就會用到回歸分析、K最近鄰、支持向量機、決策樹、隨機森林及神經網絡等算法。(4).強化學習:使用數據中已有的模型做預測,並根據越來越多的反饋結果不斷改進 模型自身。簡言之,機器學習的關鍵三步驟:(1).準備數據,選擇算法;(2).為數據建立模型;(3).調整算法參數,優化模型與預測。