91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何用數(shù)學(xué)函數(shù)去理解機(jī)器學(xué)習(xí)的過(guò)程

倩倩 ? 來(lái)源:人人都是產(chǎn)品經(jīng)理 ? 2020-04-15 15:39 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近期也是在做項(xiàng)目的過(guò)程中發(fā)現(xiàn),其實(shí)AI產(chǎn)品經(jīng)理不需要深入研究每一種算法,能了解機(jī)器學(xué)習(xí)的過(guò)程,這其中用到哪些常用算法,分別使用與解決哪些問(wèn)題和應(yīng)用場(chǎng)景,并基于了解的知識(shí),去更好的建立AI產(chǎn)品落地流程、把控項(xiàng)目進(jìn)度、風(fēng)險(xiǎn)評(píng)估,這個(gè)才是最關(guān)鍵的地方,算法研究交給專業(yè)的算法工程師,各司其職,相互配合。

基于最近看的一些文章和書(shū)籍,本文將重點(diǎn)分享,如何用數(shù)學(xué)函數(shù)去理解機(jī)器學(xué)習(xí)的過(guò)程,以及用數(shù)學(xué)原理指導(dǎo)產(chǎn)品工作的一些思考。

一、機(jī)器學(xué)習(xí)的本質(zhì)

機(jī)器學(xué)習(xí),即學(xué)習(xí)人類的分析、判斷、解決問(wèn)題的能力。人的能力如何得來(lái)?通過(guò)長(zhǎng)期的信息輸入,再經(jīng)過(guò)大腦思考,最后輸出對(duì)事物的判斷。

那么機(jī)器如何學(xué)習(xí)?通過(guò)大量的訓(xùn)練數(shù)據(jù),學(xué)習(xí)找規(guī)律,找到問(wèn)題的理想最優(yōu)解。所以,機(jī)器學(xué)習(xí)的本質(zhì)其實(shí)是函數(shù)預(yù)測(cè),即f:x-》y。

圖片來(lái)源:網(wǎng)絡(luò)

中學(xué)時(shí)期,我們常解的數(shù)據(jù)問(wèn)題之一便是:求解方程。已知坐標(biāo)(x1,y1),(x2,y2)…(xn,yn)求解n元n次方程,再將新的x帶入方程對(duì)應(yīng)的y。機(jī)器學(xué)習(xí)的過(guò)程可以類比方程求解過(guò)程:

樣本數(shù)據(jù):已知的坐標(biāo)集D:(x1,y1),(x2,y2)…(xn,yn);

算法:即求解函數(shù)的方法;

模型訓(xùn)練:最后求解的方程或函數(shù);

評(píng)估方法:將新的x帶入方程驗(yàn)證函數(shù)“預(yù)測(cè)”是否正確。

與普通的函數(shù)不同的是,機(jī)器學(xué)習(xí)往往很難求解出完整的方程,通過(guò)各種手段求最接近理想情況下的未知項(xiàng)取值。以人臉識(shí)別為例,預(yù)測(cè)函數(shù)為:f:X(圖片臉部特征)—》Y(身份),其中f則是通過(guò)機(jī)器學(xué)習(xí)后,具有人臉識(shí)別能力的模型。使用不同的機(jī)器學(xué)習(xí)方法訓(xùn)練的模型不同,即對(duì)應(yīng)的函數(shù)形式也不同。

機(jī)器學(xué)習(xí)解決的常見(jiàn)四類問(wèn)題:分類、聚類、排序和推薦。

(1)分類問(wèn)題:一般包括二分類和多分類的問(wèn)題,二分類即非黑即白,比如垃圾郵件過(guò)濾;多分類問(wèn)題,即有多種類別的輸出結(jié)果,比如圖像識(shí)別。

(2)聚類問(wèn)題:在一個(gè)集合中,將相似度高的對(duì)象組成多個(gè)類的過(guò)程叫聚類。比如一些新聞?lì)惖膽?yīng)用,將未標(biāo)注的數(shù)據(jù)通過(guò)聚類算法來(lái)構(gòu)建主題。

(3)排序問(wèn)題:根據(jù)相關(guān)度、重要度、匹配度等,讓用戶在海量的信息中找到想要的信息,常見(jiàn)的應(yīng)用場(chǎng)景,如搜索引擎。

(4)推薦問(wèn)題:典型的應(yīng)用場(chǎng)景,電商行業(yè)的千人千面,根據(jù)用戶的購(gòu)買(mǎi)、收藏等行為,分析用戶的喜好,實(shí)現(xiàn)精準(zhǔn)營(yíng)銷。

在理解了機(jī)器學(xué)習(xí)的本質(zhì)以及常見(jiàn)的問(wèn)題類型后,下面將介紹機(jī)器學(xué)習(xí)的過(guò)程。

二、機(jī)器學(xué)習(xí)的過(guò)程

機(jī)器學(xué)習(xí)的過(guò)程主要分為三個(gè)步驟:樣本準(zhǔn)備、算法選取、模型評(píng)估。

1. 樣本準(zhǔn)備

機(jī)器學(xué)習(xí),需要先學(xué)習(xí)才能預(yù)測(cè)判斷,樣本則是機(jī)器學(xué)習(xí)的信息輸入,樣本的質(zhì)量很大程度上決定了機(jī)器學(xué)習(xí)的效果。以人臉識(shí)別為例,其樣本是大量的人臉圖片。那么,大量的樣本如何獲?。堪磾?shù)據(jù)來(lái)源分類,可分為內(nèi)部樣本和外部樣本。

(1)內(nèi)部樣本

內(nèi)部樣本數(shù)據(jù),一般可基于內(nèi)部已積累的樣本數(shù)據(jù),或通過(guò)對(duì)產(chǎn)品進(jìn)行數(shù)據(jù)標(biāo)注或者埋點(diǎn),來(lái)收集更多維度的樣本數(shù)據(jù)。

(2)外部樣本

若數(shù)據(jù)的量級(jí)或豐富度不夠,則可能需要獲取一些外部樣本。比如通過(guò)搜索典型的大型公開(kāi)數(shù)據(jù)集,或者數(shù)據(jù)爬取等方式,來(lái)獲取一些指定場(chǎng)景的新樣本。

2. 算法選取

在機(jī)器學(xué)習(xí)的過(guò)程中,找到接近理想模型(函數(shù))的方法即算法。機(jī)器學(xué)習(xí)的常用算法很多,不同的算法,解決的問(wèn)題不同,適用的場(chǎng)景也不同。

如下圖,比如解決聚類問(wèn)題,一般使用無(wú)監(jiān)督學(xué)習(xí)算法,分類問(wèn)題,一般使用有監(jiān)督學(xué)習(xí)算法:支持向量機(jī)SVM、神經(jīng)網(wǎng)絡(luò)等,目前神經(jīng)網(wǎng)絡(luò)依然是研究熱點(diǎn)之一。

(1)神經(jīng)網(wǎng)絡(luò)原理

神經(jīng)網(wǎng)絡(luò)是一種模仿人類思考方式的模型,就像飛機(jī)模仿鳥(niǎo)的形態(tài)一樣,神經(jīng)網(wǎng)絡(luò)也借鑒了生物學(xué)的神經(jīng)元結(jié)構(gòu)。神經(jīng)元細(xì)胞主要由樹(shù)突、軸突和細(xì)胞體構(gòu)成,樹(shù)突用于接收信號(hào)并傳遞給細(xì)胞體,細(xì)胞體處理信號(hào),軸突輸出信號(hào)。神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)與此類似,一個(gè)典型的單隱含層神經(jīng)網(wǎng)絡(luò)架構(gòu)如下圖:

圖片來(lái)源:網(wǎng)絡(luò)

輸入層:接收輸入數(shù)據(jù),如圖片、語(yǔ)音特征等;

隱藏層:承載數(shù)據(jù)特征運(yùn)算;

輸出層:輸出計(jì)算的結(jié)果;

其本質(zhì)是,通過(guò)調(diào)整內(nèi)部大量處理單元的連接關(guān)系、激勵(lì)函數(shù)和權(quán)重值,實(shí)現(xiàn)對(duì)理想函數(shù)的逼近。

(2)深度學(xué)習(xí)

深度學(xué)習(xí)是神經(jīng)網(wǎng)絡(luò)的一種算法,目前在計(jì)算機(jī)視覺(jué)等領(lǐng)域應(yīng)用十分廣泛,相比單隱藏層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)是一種多隱藏層、多層感知器的學(xué)習(xí)結(jié)構(gòu)。如下圖所示,增加更多的隱藏層后,網(wǎng)絡(luò)能更深入得表示特征,以及具有更強(qiáng)的函數(shù)模擬能力,能獲得更好的分類能力。

圖片來(lái)源:網(wǎng)絡(luò)

深度學(xué)習(xí)三類經(jīng)典的神經(jīng)網(wǎng)絡(luò)分別是:深度神經(jīng)網(wǎng)絡(luò)DNN、卷積神經(jīng)網(wǎng)絡(luò)CNN、和循環(huán)神經(jīng)網(wǎng)絡(luò)RNN。其中DNN、CNN一般解決計(jì)算機(jī)視覺(jué)、圖像識(shí)別等分類問(wèn)題,RNN適用于自然語(yǔ)言處理等問(wèn)題。

基于大量的樣本、選取合適的算法進(jìn)行模型訓(xùn)練后,下一步則是對(duì)模型的預(yù)測(cè)效果進(jìn)行評(píng)估。

3. 模型評(píng)估

模型評(píng)估一般可分為兩個(gè)階段:實(shí)驗(yàn)階段和上線階段,在實(shí)驗(yàn)階段能達(dá)到一定的使用標(biāo)準(zhǔn)指標(biāo),才能進(jìn)入實(shí)際上線使用階段。

(1)實(shí)驗(yàn)階段

為了評(píng)估模型的可用性,需要對(duì)模型的預(yù)測(cè)能力進(jìn)行評(píng)價(jià),其中很重要的一個(gè)評(píng)價(jià)指標(biāo)就是準(zhǔn)確率,即模型預(yù)測(cè)和標(biāo)簽一致的樣本占所有樣本的比例。即選擇不同于訓(xùn)練數(shù)據(jù)的,有標(biāo)簽數(shù)據(jù)的測(cè)試集,輸入模型進(jìn)行運(yùn)算,計(jì)算預(yù)測(cè)的準(zhǔn)確率,評(píng)估模型對(duì)于測(cè)試集的預(yù)測(cè)效果是否能模型可用指標(biāo)。

(2)上線階段

在模型投入使用后,基于上線后的真實(shí)數(shù)據(jù)反饋,評(píng)估模型的能力,并基于新的反饋數(shù)據(jù),持續(xù)迭代優(yōu)化模型,提高或保持模型的泛化能力。

三、總結(jié)與思考

作為產(chǎn)品賦能的一個(gè)“工具”,產(chǎn)品化的整個(gè)流程可總結(jié)為:業(yè)務(wù)需求-》轉(zhuǎn)化為業(yè)務(wù)函數(shù)》樣本數(shù)據(jù)獲取-》選擇合適的算法-》模型訓(xùn)練-》內(nèi)部評(píng)估-》上線驗(yàn)證迭代。

其實(shí)這個(gè)過(guò)程,最底層的邏輯還是基于數(shù)學(xué)建模原理的思路來(lái)解決問(wèn)題,也可用來(lái)指導(dǎo)一些日常產(chǎn)品工作中的問(wèn)題。比如,《增長(zhǎng)黑客》中的增長(zhǎng)杠桿、北極星指標(biāo)等方法,其本質(zhì)也是數(shù)據(jù)建模的原理。定義業(yè)務(wù)函數(shù)、確定影響因素、權(quán)重成本分析、判斷最優(yōu)解決方案,評(píng)估上線反饋形成閉環(huán)。

所有,很多問(wèn)題表面看起來(lái)各式各樣、各不相同,但抽象出來(lái)可能就是一些學(xué)科問(wèn)題,比如數(shù)學(xué)、物理、經(jīng)濟(jì)學(xué)等,聯(lián)想到我前段時(shí)間分享的一篇文章《透過(guò)《奇葩說(shuō)》論點(diǎn),看背后的多元思維模型》中提到的多元思維模型核心觀點(diǎn)——越往深層次思考,越能挖掘事物本質(zhì),越接近學(xué)科原理。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4784

    瀏覽量

    98082
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8554

    瀏覽量

    136975
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1236

    瀏覽量

    26202
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    數(shù)學(xué)工程計(jì)算+失效分析,雙輪驅(qū)動(dòng)電路可靠性

    數(shù)學(xué)計(jì)算驅(qū)動(dòng)可靠設(shè)計(jì)在電子產(chǎn)品研發(fā)過(guò)程中,你是否經(jīng)常遇到以下問(wèn)題:產(chǎn)品在測(cè)試中偶發(fā)失效,卻找不到根本原因?器件選型憑經(jīng)驗(yàn)、靠感覺(jué),缺乏量化依據(jù)?電路設(shè)計(jì)完成后,總是要經(jīng)歷多輪“試錯(cuò)—改板—測(cè)試
    的頭像 發(fā)表于 02-27 17:44 ?291次閱讀
    <b class='flag-5'>數(shù)學(xué)</b>工程計(jì)算+失效分析,雙輪驅(qū)動(dòng)電路可靠性

    何用軟件實(shí)現(xiàn)系統(tǒng)的復(fù)位?

    看門(mén)狗的工作過(guò)程是怎樣的? 如何用軟件實(shí)現(xiàn)系統(tǒng)的復(fù)位?
    發(fā)表于 01-08 06:15

    機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中需避免的 7 個(gè)常見(jiàn)錯(cuò)誤與局限性

    無(wú)論你是剛?cè)腴T(mén)還是已經(jīng)從事人工智能模型相關(guān)工作一段時(shí)間,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中都存在一些我們需要時(shí)刻關(guān)注并銘記的常見(jiàn)錯(cuò)誤。如果對(duì)這些錯(cuò)誤置之不理,日后可能會(huì)引發(fā)諸多麻煩!只要我們密切關(guān)注數(shù)據(jù)、模型架構(gòu)
    的頭像 發(fā)表于 01-07 15:37 ?203次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>中需避免的 7 個(gè)常見(jiàn)錯(cuò)誤與局限性

    函數(shù)指針及指針函數(shù)的區(qū)別

    學(xué)習(xí)arm過(guò)程中發(fā)現(xiàn)這“指針函數(shù)”與“函數(shù)指針”容易搞錯(cuò),所以今天,我自己想一次把它搞清楚,找了一些資料,和大家的一些總結(jié),整理到此。和大家分享。   首先它們之間的定義:   1、
    發(fā)表于 12-12 06:34

    何用函數(shù)指針調(diào)用函數(shù)

    給大家舉一個(gè)例子: int Func(int x);/*聲明一個(gè)函數(shù)*/ int (*p) (int x);/*定義一個(gè)函數(shù)指針*/ p = Func; /*將Func函數(shù)的首地址賦給指針變量
    發(fā)表于 12-11 06:26

    時(shí)鐘周期、機(jī)器周期、指令周期介紹

    的描述里也叫節(jié)拍,即將一個(gè)機(jī)器周期劃分成若干個(gè)相等的時(shí)間段,每一段僅完成一個(gè)基本操作,用一個(gè)電平信號(hào)寬度對(duì)應(yīng)。 個(gè)人理解:時(shí)鐘周期取決于晶振頻率,它是機(jī)器運(yùn)行過(guò)程中所有時(shí)間的最小單位。
    發(fā)表于 11-17 07:54

    激活函數(shù)ReLU的理解與總結(jié)

    《The Organization of Behavior》論文中描述了神經(jīng)元學(xué)習(xí)法則。 人工神經(jīng)網(wǎng)絡(luò)更進(jìn)一步被美國(guó)神經(jīng)學(xué)家Frank Rosenblatt所發(fā)展。他提出了可以模擬人類感知能力的機(jī)器,并稱之為‘感知機(jī)
    發(fā)表于 10-31 06:16

    量子機(jī)器學(xué)習(xí)入門(mén):三種數(shù)據(jù)編碼方法對(duì)比與應(yīng)用

    在傳統(tǒng)機(jī)器學(xué)習(xí)中數(shù)據(jù)編碼確實(shí)相對(duì)直觀:獨(dú)熱編碼處理類別變量,標(biāo)準(zhǔn)化調(diào)整數(shù)值范圍,然后直接輸入模型訓(xùn)練。整個(gè)過(guò)程更像是數(shù)據(jù)清洗,而非核心算法組件。量子機(jī)器
    的頭像 發(fā)表于 09-15 10:27 ?781次閱讀
    量子<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>入門(mén):三種數(shù)據(jù)編碼方法對(duì)比與應(yīng)用

    如何在機(jī)器視覺(jué)中部署深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)

    人士而言往往難以理解,人們也常常誤以為需要扎實(shí)的編程技能才能真正掌握并合理使用這項(xiàng)技術(shù)。事實(shí)上,這種印象忽視了該技術(shù)為機(jī)器視覺(jué)(乃至生產(chǎn)自動(dòng)化)帶來(lái)的潛力,因?yàn)樯疃?b class='flag-5'>學(xué)習(xí)并非只屬于計(jì)算機(jī)科學(xué)家或程序員。 從頭開(kāi)始:什么
    的頭像 發(fā)表于 09-10 17:38 ?906次閱讀
    如何在<b class='flag-5'>機(jī)器</b>視覺(jué)中部署深度<b class='flag-5'>學(xué)習(xí)</b>神經(jīng)網(wǎng)絡(luò)

    FPGA在機(jī)器學(xué)習(xí)中的具體應(yīng)用

    隨著機(jī)器學(xué)習(xí)和人工智能技術(shù)的迅猛發(fā)展,傳統(tǒng)的中央處理單元(CPU)和圖形處理單元(GPU)已經(jīng)無(wú)法滿足高效處理大規(guī)模數(shù)據(jù)和復(fù)雜模型的需求。FPGA(現(xiàn)場(chǎng)可編程門(mén)陣列)作為一種靈活且高效的硬件加速平臺(tái)
    的頭像 發(fā)表于 07-16 15:34 ?2902次閱讀

    何用FastMCP快速開(kāi)發(fā)自己的MCP Server?

    作者:算力魔方創(chuàng)始人/英特爾創(chuàng)新大使劉力很多讀者反饋:通過(guò) 《用MCP將百度地圖能力輕松接入DeepSeek》 和 《如何用DeepSeek+MCP實(shí)現(xiàn)AutoGLM沉思的能力?》 的實(shí)戰(zhàn),真真切切
    的頭像 發(fā)表于 05-07 16:07 ?2836次閱讀
    如<b class='flag-5'>何用</b>FastMCP快速開(kāi)發(fā)自己的MCP Server?

    【「# ROS 2智能機(jī)器人開(kāi)發(fā)實(shí)踐」閱讀體驗(yàn)】視覺(jué)實(shí)現(xiàn)的基礎(chǔ)算法的應(yīng)用

    閱讀心得體會(huì):ROS2機(jī)器人視覺(jué)與地圖構(gòu)建技術(shù) 通過(guò)對(duì)本書(shū)第7章(ROS2視覺(jué)應(yīng)用)和第8章(ROS2地圖構(gòu)建)的學(xué)習(xí),我對(duì)機(jī)器人視覺(jué)感知和自主導(dǎo)航的核心技術(shù)有了更深入的理解。以下是我
    發(fā)表于 05-03 19:41

    開(kāi)關(guān)電源環(huán)路穩(wěn)定性分析——觀察法找零極點(diǎn)

    網(wǎng)絡(luò)的零極點(diǎn)。比如下面OPA的I型補(bǔ)償網(wǎng)絡(luò),求解零極點(diǎn)的過(guò)程如下:上面是純粹數(shù)學(xué)方式求解的結(jié)果,從結(jié)果可以看出I型補(bǔ)償只有極點(diǎn),沒(méi)有零點(diǎn),相對(duì)來(lái)說(shuō)還算簡(jiǎn)單。 下面求解II型補(bǔ)償器的傳遞函數(shù),寫(xiě)成標(biāo)準(zhǔn)零
    發(fā)表于 04-19 13:31

    嵌入式AI技術(shù)之深度學(xué)習(xí):數(shù)據(jù)樣本預(yù)處理過(guò)程中使用合適的特征變換對(duì)深度學(xué)習(xí)的意義

    ? 作者:蘇勇Andrew 使用神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)機(jī)器學(xué)習(xí),網(wǎng)絡(luò)的每個(gè)層都將對(duì)輸入的數(shù)據(jù)做一次抽象,多層神經(jīng)網(wǎng)絡(luò)構(gòu)成深度學(xué)習(xí)的框架,可以深度理解數(shù)據(jù)中所要表示的規(guī)律。從原理上看,使用深度
    的頭像 發(fā)表于 04-02 18:21 ?1522次閱讀

    馬達(dá)控制上必要的知識(shí) 三角函數(shù)

    為了理解馬達(dá)控制技術(shù),必須理解如下基礎(chǔ)學(xué)問(wèn)。 (1) 數(shù)學(xué):三角函數(shù),指數(shù)函數(shù),復(fù)數(shù)函數(shù),微分,
    發(fā)表于 03-18 12:23