感恩親情 蒲公英文摘 > 感恩親情 >

機器學(xué)習(xí)發(fā)展現(xiàn)狀及應(yīng)用的研究

發(fā)布時間:2018-07-02 來源: 感恩親情點擊：

　　[摘要]本文首先介紹了近幾年有關(guān)機器學(xué)習(xí)的一些熱門事件，例如大為火熱的AlphaGo以及2017年首次舉行的中國人工智能大會（CCAI）。接下來將文章分為3個部分來闡述機器學(xué)習(xí)：第一部分詳細介紹機器學(xué)習(xí)的發(fā)展歷程，包括萌芽-發(fā)展-繁榮三個階段；第二部分著重分析了機器學(xué)習(xí)的常見方法，有監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)以及強化學(xué)習(xí)；最后介紹了機器學(xué)習(xí)在各行各業(yè)中的一些具體應(yīng)用。
　　[關(guān)鍵詞]人工智能；機器學(xué)習(xí)；強化學(xué)習(xí)；無人駕駛
　　中圖分類號：S265 文獻標識碼：A 文章編號：1009-914X（2018）24-0227-02
　　1.引言
　　2016年年初，AlphaGo以4：1戰(zhàn)勝了世界圍棋冠軍李世石，這一大事件瞬間引起了全球?qū)θ斯ぶ悄艿呐d趣。一時間，人們茶余飯后都在圍繞著人工智能這一領(lǐng)域展開。2017年07月22-23號在杭州舉行了中國國內(nèi)級別最高，規(guī)模最大的人工智能大會—中國人工智能大會（CCAI）。大會上匯聚了全球人工智能領(lǐng)域的頂級專家、學(xué)者和產(chǎn)業(yè)界優(yōu)秀人才，圍繞當前人工智能熱點話題、核心技術(shù)以及廣泛關(guān)注的科學(xué)問題進行深入交流和探討，再一次將人工智能推向了熱潮。
　　人工智能的主要三大驅(qū)動力：大數(shù)據(jù)，機器學(xué)習(xí)以及硬件GPU。本文主要從人工智能的算法——機器學(xué)習(xí)方面來展開論述。機器學(xué)習(xí)（MachineLearning）的本質(zhì)是基于互聯(lián)網(wǎng)的海量數(shù)據(jù)以及系統(tǒng)強大的并行運算能力，讓機器自主模擬人類學(xué)習(xí)的過程，通過不斷“學(xué)習(xí)”數(shù)據(jù)來做出智能決策行為。
　　2.機器學(xué)習(xí)的發(fā)展歷程與相關(guān)要素
　　2.1 機器學(xué)習(xí)的發(fā)展歷程
　　機器學(xué)習(xí)屬于人工智能中一個較為年輕的分支，可以大致分為以下三個發(fā)展歷程：
　　第一階段：20世紀50年代中期—60年代中期，這一時期處于萌芽時期。人們試圖通過軟件編程來操控計算機完成一系列的邏輯推理功能，進而使計算機具有一定程度上類似人類一樣的智能思考能力。然而這時期計算機所推理的結(jié)果遠遠沒有達到人們對機器學(xué)習(xí)的期望。通過進一步研究發(fā)現(xiàn)，只具有邏輯推理能力并不能使得機器智能。研究者們認為，使得機器擁有人工智能的前提還必須是擁有大量的先驗知識[1]。
　　第二階段：20世紀60年代中期—80年代中期，這一時期處于發(fā)展時期。人們試圖利用自身思維提取出來的規(guī)則來教會計算機執(zhí)行決策行為，主流之力便是各式各樣的“專家系統(tǒng)”，然而這些系統(tǒng)總會面臨“知識稀疏”的問題，即面對無窮無盡的知識與信息，人們無法總結(jié)出萬無一失的規(guī)律。因此，讓機器自主學(xué)習(xí)的設(shè)想自然地浮出水面�；�20世紀50年代對于神經(jīng)網(wǎng)絡(luò)的研究，人們開始研究如何讓機器自主學(xué)習(xí)。
　　第三階段：20世紀80年代—至今，機器學(xué)習(xí)達到了一個繁榮時期。由于這一時期互聯(lián)網(wǎng)大數(shù)據(jù)以及硬件GPU的出現(xiàn)，使得機器學(xué)習(xí)脫離了瓶頸期。機器學(xué)習(xí)開始爆炸式發(fā)展，開始成為了一門獨立熱門學(xué)科并且被應(yīng)用到各個領(lǐng)域。各種機器學(xué)習(xí)算法不斷涌現(xiàn)，而利用深層次神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)也得到進一步發(fā)展。同時，機器學(xué)習(xí)的蓬勃發(fā)展還促進了其他分支的出現(xiàn)，例如模式識別，數(shù)據(jù)挖掘，生物信息學(xué)和自動駕駛等等。
　　2.2 機器學(xué)習(xí)的常見方法
　　機器學(xué)習(xí)發(fā)展至今，常用的主要有以下三大類：監(jiān)督學(xué)習(xí)，無監(jiān)督學(xué)習(xí)和強化學(xué)習(xí)（圖1）。
　　2.2.1 監(jiān)督學(xué)習(xí)
　　監(jiān)督學(xué)習(xí)表示機器學(xué)習(xí)的數(shù)據(jù)是帶標記的，這些標記可以包括數(shù)據(jù)類別，數(shù)據(jù)屬性以及特征點位置等等。這些標記作為預(yù)期效果，不斷來修正機器的預(yù)測結(jié)果。具體首先過程是：通過大量帶有標記的數(shù)據(jù)來訓(xùn)練機器，機器將預(yù)測結(jié)果與期望結(jié)果進行比對；之后根據(jù)比對結(jié)果來修改模型中的參數(shù)，再一次輸出預(yù)測結(jié)果；再將預(yù)測結(jié)果與期望結(jié)果進行比對……重復(fù)多次直至收斂，最終生成具有一定魯棒性的模型來達到智能決策的能力。
　　常見的監(jiān)督學(xué)習(xí)有分類，回歸。分類（classification）是將一些實例數(shù)據(jù)分到合適的類別中，它的預(yù)測結(jié)果是離散的�；貧w（regression）是將數(shù)據(jù)歸到一條“線”上，即為離散數(shù)據(jù)生產(chǎn)擬合曲線，因此其預(yù)測結(jié)果是連續(xù)的。
　　2.2.2 無監(jiān)督學(xué)習(xí)
　　無監(jiān)督學(xué)習(xí)表示機器學(xué)習(xí)的數(shù)據(jù)是沒有標記的。機器從無標記的數(shù)據(jù)中探索并推斷出潛在的聯(lián)系。常見的無監(jiān)督學(xué)習(xí)有聚類，降維。
　　在聚類（clustering）工作中，由于事先不知道數(shù)據(jù)類別，因此只能通過分析數(shù)據(jù)樣本在特征空間中的分布，例如基于密度或是基于統(tǒng)計學(xué)概率模型等等，從而將不同數(shù)據(jù)分開，把相似數(shù)據(jù)聚為一類。
　　降維（dimensionality reduction）是將數(shù)據(jù)的維度降低。例如描述一個西瓜，若只考慮外皮色澤，根蒂，敲聲，紋理，密度以及含糖率這6個屬性，這6個屬性代表了西瓜數(shù)據(jù)的維度為6。進一步考慮降維的工作，由于數(shù)據(jù)本身具有龐大的數(shù)量和各種屬性特征，若對全部數(shù)據(jù)信息進行分析，將會增加訓(xùn)練的負擔和存儲空間。因此可以通過主成分分析等其他方法，考慮主要影響因素，舍棄次要因素，來平衡準確度與效率。
　　2.2.3 強化學(xué)習(xí)
　　強化學(xué)習(xí)是帶激勵的，具體來說就是，如果機器行動正確，將施與一定的“正激勵”；如果行動錯誤，也同樣會給出一個懲罰（也可稱為“負激勵”）。因此在這種情況下，機器將會考慮如何在一個環(huán)境中行動才能達到激勵的最大化，具有一定的動態(tài)規(guī)劃思想[2]。例如在貪吃蛇游戲中，貪吃蛇需要不斷吃到“食物”來加分。為了不斷提高分數(shù)，貪吃蛇需要考慮在自身位置上如何轉(zhuǎn)向才能吃到“食物”，這種學(xué)習(xí)過程便可理解為是一種強化學(xué)習(xí)。
　　強化學(xué)習(xí)最為火熱的一個應(yīng)用便是谷歌AlphaGo的升級品—AlphaGo Zero。相較于AlphaGo，AlphaGo Zero舍棄了先驗知識。不再需要人為設(shè)計特征，直接將棋盤上黑白棋子的擺放情況作為原始數(shù)據(jù)輸入到模型中，機器使用強化學(xué)習(xí)來自我博弈，不斷提升自己最終出色完成下棋。AlphaGo Zero的成功證明了在沒有人類的經(jīng)驗和指導(dǎo)下，深度強化學(xué)習(xí)依然能夠出色完成指定任務(wù)。

相關(guān)熱詞搜索：現(xiàn)狀及機器研究發(fā)展學(xué)習(xí)

熱點文章閱讀

版權(quán)所有 蒲公英文摘 m.serialtips.com

谁有黄色毛片黄色网站,天天操美女的逼干,美女131湿影院,完美伴侣电视剧