91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機器學(xué)習(xí)找一個好用的函數(shù)的原因是什么

wFVr_Hardware_1 ? 來源:硬件十萬個為什么 ? 作者:硬件十萬個為什么 ? 2022-11-02 16:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1、機器學(xué)習(xí)定義

我們一起看看AI界的大牛對機器學(xué)習(xí)的定義

(1)機器學(xué)習(xí)中經(jīng)典的“支持向量機(SVM)”的主要提出者弗拉基米爾·萬普尼克(Vladimir Vapnik),在其著作《統(tǒng)計學(xué)習(xí)理論的本質(zhì)》中這樣定義機器學(xué)習(xí)“機器學(xué)習(xí)就是一個基于經(jīng)驗數(shù)據(jù)的函數(shù)估計問題”。

(2)卡耐基梅隆大學(xué)的機器學(xué)習(xí)和人工智能領(lǐng)域知名教授湯姆·米切爾(Tom Mitchell),在他經(jīng)典教材《機器學(xué)習(xí)》中很抽象的定義了機器學(xué)習(xí):對于某類任務(wù)(Task,簡稱T)和某項性能評價準則(Performance,簡稱P),如果一個計算機程序在T上以P作為性能度量,隨著經(jīng)驗(Experience,簡稱E)的積累,不斷自我完善,那么我們稱這個計算機程序從經(jīng)驗E中進行了學(xué)習(xí)。比如學(xué)習(xí)圍棋的程序AlphaGo,它可以通過和自己下棋獲取經(jīng)驗,那么它的任務(wù)T就是“參與圍棋對弈”,它的性能P就是用“贏得比賽的百分比”來度量的。米切爾教授認為,在機器學(xué)習(xí)中我們需要明確三個特征:任務(wù)的類型、衡量任務(wù)性能提升的標準以及獲取經(jīng)驗的來源。

(3)南京大學(xué)的機器學(xué)習(xí)專家周志華在經(jīng)典教材《機器學(xué)習(xí)》中這樣定義:機器學(xué)習(xí)致力于研究如何通過計算的手段,利用經(jīng)驗來改善系統(tǒng)自身的性能,而在計算機系統(tǒng)中,“經(jīng)驗”通常以“數(shù)據(jù)”形式存在,因此機器學(xué)習(xí)研究的主要內(nèi)容是關(guān)于在計算機上從數(shù)據(jù)中產(chǎn)生“模型”(model)的算法,即“學(xué)習(xí)算法”。有了學(xué)習(xí)算法,我們把經(jīng)驗數(shù)據(jù)提供給它,它就能基于這些數(shù)據(jù)產(chǎn)生模型,而在面對新的情況時,模型會給我們提供相應(yīng)的判斷。比如我們在買瓜的時候看到一個沒剖開的西瓜,我們可以利用經(jīng)驗對這個瓜的好壞進行判斷。

結(jié)合這些行業(yè)大牛的定義,我們可以這樣理解機器學(xué)習(xí),“從數(shù)據(jù)中學(xué)習(xí),形成有效經(jīng)驗,提升執(zhí)行任務(wù)/工作的表現(xiàn)”,而我們對于機器學(xué)習(xí)的研究就是一個不斷找尋更有效算法的過程。對于計算機系統(tǒng)而言,所有的“經(jīng)驗”都是以數(shù)據(jù)的形式存在的,而數(shù)據(jù)作為學(xué)習(xí)的對象類型是多樣的,可以是數(shù)字、文字、圖像、音頻、視頻,也可以是它們的各種組合。經(jīng)典機器學(xué)習(xí)中還要依賴人類的先驗知識,把原始數(shù)據(jù)預(yù)處理成各種特征,然后對特征進行分類。而這種分類的效果,高度取決于特征選取的好壞,因此傳統(tǒng)的機器學(xué)習(xí)專家們,把大部分時間都花在如何尋找更加合適的特征上。我們進入在“數(shù)據(jù)泛濫,信息超量”的大數(shù)據(jù)時代后,能自動從大數(shù)據(jù)中獲取知識的機器學(xué)習(xí)一定會扮演重要角色。

2、機器學(xué)習(xí)的主要形式

機器學(xué)習(xí)的主要形式有監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)及強化學(xué)習(xí),我們再來回顧一下每一種形式的特點

(1)有監(jiān)督學(xué)習(xí):有監(jiān)督學(xué)習(xí)使用有標簽的訓(xùn)練數(shù)據(jù),“監(jiān)督”可以理解為已經(jīng)知道訓(xùn)練樣本(輸入數(shù)據(jù))中期待的輸出信號(標簽)。監(jiān)督學(xué)習(xí)過程是,先為機器學(xué)習(xí)算法提供打過標簽的訓(xùn)練數(shù)據(jù)以擬合預(yù)測模型,然后用該模型對未打過標簽的新數(shù)據(jù)進行預(yù)測。以垃圾郵件過濾為例,可以采用監(jiān)督機器學(xué)習(xí)算法在打過標簽的(正確標識垃圾與非垃圾)電子郵件的語料庫上訓(xùn)練模型,然后用該模型來預(yù)測新郵件是否屬于垃圾郵件。當(dāng)前火熱的神經(jīng)網(wǎng)絡(luò)就屬于有監(jiān)督學(xué)習(xí)。

(2)無監(jiān)督學(xué)習(xí):無監(jiān)督學(xué)習(xí)的使用未標記過的訓(xùn)練數(shù)據(jù),“無監(jiān)督”就不知道輸入對應(yīng)的輸出結(jié)果了,無監(jiān)督學(xué)習(xí)讓算法自身發(fā)現(xiàn)數(shù)據(jù)的模型和規(guī)律。比如“聚類”,利用距離的親疏遠近來衡量不同類型。還有“異常檢測”,判斷某些點不合群?!爱惓z測”也是“聚類”的反向應(yīng)用。

(3)半監(jiān)督學(xué)習(xí):則采用“中庸之道”,利用聚類技術(shù)擴大已知標簽范圍,也就是說,訓(xùn)練中使用的數(shù)據(jù)只有一小部分是標記過的,而大部分是沒有標記的,然后逐漸擴大標記數(shù)據(jù)的范圍。

(4)強化學(xué)習(xí):強化學(xué)習(xí)也使用未標記的數(shù)據(jù),它可以通過某種方法(獎懲函數(shù))知道你是離正確答案越來越近,還是越來越遠。強化學(xué)習(xí)的目標是開發(fā)一個系統(tǒng),通過與環(huán)境的交互來提高其性能,我們也可以把強化學(xué)習(xí)看作一個與監(jiān)督學(xué)習(xí)相關(guān)的領(lǐng)域,然而強化學(xué)習(xí)的反饋并非標定過的正確標簽或數(shù)值,而是獎勵函數(shù)對行動度量的結(jié)果。強化學(xué)習(xí)的常見示例是國際象棋,系統(tǒng)根據(jù)棋盤的狀態(tài)或環(huán)境來決定一系列的行動,獎勵定義為比賽的輸或贏。

3、機器學(xué)習(xí)系統(tǒng)的路線圖

9a0f4dc6-4c89-11ed-a3b6-dac502259ad0.png

(1)預(yù)處理:我們能夠獲得的原始數(shù)據(jù)很少以理想形式出現(xiàn),無法滿足學(xué)習(xí)算法的最佳性能,因此數(shù)據(jù)的預(yù)處理是所有機器學(xué)習(xí)應(yīng)用中最關(guān)鍵的步驟。為了獲得模型的最佳性能,許多機器學(xué)習(xí)算法要求所選特征的測量結(jié)果單位相同,通常通過把特征數(shù)據(jù)變換到[0,1]的取值范圍,或者均值為0、方差為1的標準正態(tài)分布來實現(xiàn)。由于某些選定的特征相互之間可能高度相關(guān),因此在某種程度上呈現(xiàn)冗余的現(xiàn)象。在這種情況下,可以通過降維技術(shù)將特征壓縮到低維子空間,減少存儲空間,提高算法的運行速度。預(yù)處理中為了確定機器學(xué)習(xí)算法不僅在訓(xùn)練數(shù)據(jù)集上表現(xiàn)良好,而且對新數(shù)據(jù)也有很好的適應(yīng)性,我們將數(shù)據(jù)集隨機分成單獨的訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集。用訓(xùn)練數(shù)據(jù)集來訓(xùn)練和優(yōu)化機器學(xué)習(xí)模型,同時把測試數(shù)據(jù)集保留到最后以評估最終的模型。

(2)訓(xùn)練和選擇預(yù)測模型:為了完成各種不同的任務(wù),目前開發(fā)了許多不同的機器學(xué)習(xí)算法,但沒有哪個分類算法是完美的。例如,每個分類算法都存在著固有的偏置,如果不對分類任務(wù)做任何假設(shè),沒有哪個分類模型會占上風(fēng)。因此,在實際應(yīng)用中我們至少要比較幾種不同的算法,以便訓(xùn)練和選擇性能最好的模型。在比較不同的模型之前,我們首先要確定度量性能的指標,通常用分類準確率作為度量指標,其定義為正確分類的個體占所有個體的百分比。我們不能期望軟件庫所提供的不同機器學(xué)習(xí)算法的默認參數(shù)值對特定問題最優(yōu),因此使用超參數(shù)調(diào)優(yōu)技術(shù)來調(diào)優(yōu)模型的性能就特別重要,我們可以這樣理解超參數(shù),這不是從數(shù)據(jù)中學(xué)習(xí)的參數(shù),而是模型的調(diào)節(jié)旋鈕,可以來回旋轉(zhuǎn)調(diào)整模型的性能。

(3)評估模型并對未曾謀面的數(shù)據(jù)進行預(yù)測:在訓(xùn)練數(shù)據(jù)集上擬合并選擇模型之后,我們可以用測試數(shù)據(jù)集來評估它在從來沒見過的新數(shù)據(jù)上的表現(xiàn),以評估泛化誤差。如果我們對模型的表現(xiàn)滿意,那么就可以用它來預(yù)測未來的新數(shù)據(jù)。

4、機器學(xué)習(xí)函數(shù)化

(1)機器學(xué)習(xí)就是找一個好用的函數(shù)

《未來簡史》的作者赫拉利這樣定義,人工智能實際上就是找到一種高效的“電子算法”,用以代替或在某項指標上超越人類的“生物算法”。那么,任何一個“電子算法”都要實現(xiàn)一定的功能(Function)才有意義,這種“功能”就是我們使用的“函數(shù)”。

臺灣大學(xué)李宏毅博士的說法更通俗一些,機器學(xué)習(xí)在形式上可近似等同于在數(shù)據(jù)對象中通過統(tǒng)計或推理的方法,尋找一個有關(guān)特定輸入和預(yù)期輸出的功能函數(shù)f。

通常我們把輸入變量空間記作X,也就是特征,變量既可以是標量(scalar),也可以是向量(vector),包括各種數(shù)據(jù)表或矩陣的列;而把輸出變量空間記作Y,也就是目標。所謂的機器學(xué)習(xí)就是完成如下變換:Y=f (X)。

在這樣的函數(shù)中,針對語音識別功能,如果輸入一個音頻信號,就能輸出諸如“你好”或“How are you?”等這類識別信息;針對圖片識別功能,如果輸入的是一張圖片,在這個函數(shù)的加工下,就能輸出一個或貓或狗的判定;針對下棋博弈功能,如果輸入的是一個圍棋的棋譜局勢,它能輸出這盤圍棋下

一步的“最佳”走法;而對于具備智能交互功能的系統(tǒng)(比如微軟小冰),當(dāng)我們給這個函數(shù)輸入諸如“How are you?”,它就能輸出諸如“I am fine,thank you,and you?”等智能的回應(yīng)。

總結(jié)這一下,機器學(xué)習(xí)的過程和目標就是在尋找一個“好用的”函數(shù)。

(2)如何才能尋找到一個好用的函數(shù)

“好用的”函數(shù)并不那么好找,輸入一只貓的圖像后,這個f函數(shù)并不一定就能輸出一只貓,可能它會錯誤地輸出為一條狗或一條蛇,開發(fā)者想要找到好的函數(shù)必須要走好三大步

如何找一系列的函數(shù)來實現(xiàn)預(yù)期的功能,這是建模問題。

如何找出一系列評價標準來評估函數(shù)的好壞,這是評估問題。

如何快速找到性能最佳的函數(shù),這是優(yōu)化問題。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 函數(shù)
    +關(guān)注

    關(guān)注

    3

    文章

    4417

    瀏覽量

    67541
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    66

    文章

    8554

    瀏覽量

    136980

原文標題:機器學(xué)習(xí)為什么要找一個好用的函數(shù)?

文章出處:【微信號:Hardware_10W,微信公眾號:硬件十萬個為什么】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    色差是什么?它產(chǎn)生的原因是什么?

    色像差(簡稱色差)。色差產(chǎn)生的原因色差產(chǎn)生的根本原因就是由于光的色散效應(yīng)。白光是由不同波長的可見光組成的,例如紅色的光波長為620-750納米,藍色的波長為450
    的頭像 發(fā)表于 01-27 17:19 ?723次閱讀
    色差是什么?它產(chǎn)生的<b class='flag-5'>原因是</b>什么?

    使用ads1292r,上電后,DOUT有持續(xù)波形,但是drdy始終為低,可能的原因是什么?

    上電后,按照手冊的上電時序,start置1,clksel在電路板連avdd。結(jié)果DOUT有持續(xù)波形,但是drdy始終為低,可能的原因是什么?
    發(fā)表于 01-25 15:38

    機器學(xué)習(xí)和深度學(xué)習(xí)中需避免的 7 常見錯誤與局限性

    無論你是剛?cè)腴T還是已經(jīng)從事人工智能模型相關(guān)工作段時間,機器學(xué)習(xí)和深度學(xué)習(xí)中都存在些我們需要時刻關(guān)注并銘記的常見錯誤。如果對這些錯誤置之不
    的頭像 發(fā)表于 01-07 15:37 ?203次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>中需避免的 7 <b class='flag-5'>個</b>常見錯誤與局限性

    請問如何從函數(shù)內(nèi)部判斷本函數(shù)是否是成員函數(shù)還是非成員函數(shù)?

    如何從函數(shù)內(nèi)部判斷本函數(shù)是否是成員函數(shù)還是
    發(fā)表于 01-06 06:30

    激活函數(shù)ReLU的理解與總結(jié)

    ,對數(shù)運算計算量大的原因,而不太被人使用。并且從些人的使用經(jīng)驗來看,效果也并不比ReLU好。 softplus的導(dǎo)數(shù)恰好是sigmoid函數(shù),softplus函數(shù)圖像如下:
    發(fā)表于 10-31 06:16

    自動駕駛中常提的“強化學(xué)習(xí)”是啥?

    [首發(fā)于智駕最前沿微信公眾號]在談及自動駕駛時,有些方案中會提到“強化學(xué)習(xí)(Reinforcement Learning,簡稱RL)”,強化學(xué)習(xí)類讓機器通過試錯來學(xué)會做決策的技術(shù)。
    的頭像 發(fā)表于 10-23 09:00 ?689次閱讀
    自動駕駛中常提的“強化<b class='flag-5'>學(xué)習(xí)</b>”是<b class='flag-5'>個</b>啥?

    線程超時函數(shù)中 assert 失敗是什么原因導(dǎo)致的?

    最近調(diào)試 gd32h759 遇到了十分奇怪的問題,在初步調(diào)通所有的邏輯功能后,發(fā)現(xiàn)系統(tǒng)經(jīng)常會在運行段時間后死在奇怪的線程超時
    發(fā)表于 09-09 06:56

    FPGA在機器學(xué)習(xí)中的具體應(yīng)用

    隨著機器學(xué)習(xí)和人工智能技術(shù)的迅猛發(fā)展,傳統(tǒng)的中央處理單元(CPU)和圖形處理單元(GPU)已經(jīng)無法滿足高效處理大規(guī)模數(shù)據(jù)和復(fù)雜模型的需求。FPGA(現(xiàn)場可編程門陣列)作為種靈活且高效的硬件加速平臺
    的頭像 發(fā)表于 07-16 15:34 ?2902次閱讀

    電容三點式無法起振的原因

    設(shè)計了如圖所示的電容三點式振蕩電路,但是電路無法起振,想請問原因是什么呢。
    發(fā)表于 06-19 17:06

    系統(tǒng)壓力測試出現(xiàn)問題的原因和解決方法

    系統(tǒng)壓力測試發(fā)現(xiàn)的問題通常都比較復(fù)雜,作者最近解決了有意思的系統(tǒng)穩(wěn)定性問題,也想請各位讀者起思考下,想想問題的原因是什么。
    的頭像 發(fā)表于 05-24 14:52 ?919次閱讀
    系統(tǒng)壓力測試出現(xiàn)問題的<b class='flag-5'>原因</b>和解決方法

    【「# ROS 2智能機器人開發(fā)實踐」閱讀體驗】機器人入門的引路書

    的限制和調(diào)控) 本書還有很多前沿技術(shù)項目的擴展 比如神經(jīng)網(wǎng)絡(luò)識別例程,機器學(xué)習(xí)圖像識別的原理,yolo圖像追蹤的原理 機器學(xué)習(xí)訓(xùn)練三大點: 先準備
    發(fā)表于 04-30 01:05

    面向AI與機器學(xué)習(xí)應(yīng)用的開發(fā)平臺 AMD/Xilinx Versal? AI Edge VEK280

    AMD/Xilinx Versal? AI Edge VEK280評估套件是款面向AI與機器學(xué)習(xí)應(yīng)用的開發(fā)平臺,專為邊緣計算場景優(yōu)化設(shè)計。以下從核心配置、技術(shù)特性、應(yīng)用場景及開發(fā)支持等方面進行詳細
    的頭像 發(fā)表于 04-11 18:33 ?2462次閱讀
    面向AI與<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>應(yīng)用的開發(fā)平臺 AMD/Xilinx Versal? AI Edge VEK280

    函數(shù)指針的六常見應(yīng)用場景

    函數(shù)指針在嵌入式開發(fā)中有著廣泛的應(yīng)用,它讓代碼更加靈活,減少冗余,提高可擴展性。很多時候,我們需要根據(jù)不同的情況動態(tài)調(diào)用不同的函數(shù),而函數(shù)指針正是實現(xiàn)這需求的重要工具。本文將介紹六
    的頭像 發(fā)表于 04-07 11:58 ?1485次閱讀
    <b class='flag-5'>函數(shù)</b>指針的六<b class='flag-5'>個</b>常見應(yīng)用場景

    詳解RTOS中的Hook函數(shù)

    Hook函數(shù)是RTOS中的關(guān)鍵特性,通過該函數(shù),用戶可以增強對任務(wù)管理的控制,定義系統(tǒng)行為。
    的頭像 發(fā)表于 03-24 16:14 ?1088次閱讀

    一個人形機器人需要近50臺電機,人形機器人成本高的原因在哪里

    人形機器人中,大電機(100~150瓦)約占機器人用的電機總值的25%,中大型電機(50~100瓦)約占電機總值的30%,中型電機(20~50瓦)約占電機總值的30%,小型電機(5~20瓦)約占電機總值的15%。大電機國產(chǎn)成本7000元/
    的頭像 發(fā)表于 03-14 09:55 ?3554次閱讀