日本无码色情网站免费,色情网站观看午夜大香蕉视屏

近期也是在做項(xiàng)目的過(guò)程中發(fā)現(xiàn)，其實(shí)AI產(chǎn)品經(jīng)理不需要深入研究每一種算法，能了解機(jī)器學(xué)習(xí)的過(guò)程，這其中用到哪些常用算法，分別使用與解決哪些問(wèn)題和應(yīng)用場(chǎng)景，并基于了解的知識(shí)，去更好的建立AI產(chǎn)品落地流程、把控項(xiàng)目進(jìn)度、風(fēng)險(xiǎn)評(píng)估，這個(gè)才是最關(guān)鍵的地方，算法研究交給專業(yè)的算法工程師，各司其職，相互配合。

基于最近看的一些文章和書(shū)籍，本文將重點(diǎn)分享，如何用數(shù)學(xué)函數(shù)去理解機(jī)器學(xué)習(xí)的過(guò)程，以及用數(shù)學(xué)原理指導(dǎo)產(chǎn)品工作的一些思考。

一、機(jī)器學(xué)習(xí)的本質(zhì)

機(jī)器學(xué)習(xí)，即學(xué)習(xí)人類的分析、判斷、解決問(wèn)題的能力。人的能力如何得來(lái)？通過(guò)長(zhǎng)期的信息輸入，再經(jīng)過(guò)大腦思考，最后輸出對(duì)事物的判斷。

那么機(jī)器如何學(xué)習(xí)？通過(guò)大量的訓(xùn)練數(shù)據(jù)，學(xué)習(xí)找規(guī)律，找到問(wèn)題的理想最優(yōu)解。所以，機(jī)器學(xué)習(xí)的本質(zhì)其實(shí)是函數(shù)預(yù)測(cè)，即f:x-》y。

圖片來(lái)源：網(wǎng)絡(luò)

中學(xué)時(shí)期，我們常解的數(shù)據(jù)問(wèn)題之一便是：求解方程。已知坐標(biāo)（x1，y1），（x2，y2）…（xn，yn）求解n元n次方程，再將新的x帶入方程對(duì)應(yīng)的y。機(jī)器學(xué)習(xí)的過(guò)程可以類比方程求解過(guò)程：

樣本數(shù)據(jù)：已知的坐標(biāo)集D：（x1，y1），（x2，y2）…（xn，yn）；

算法：即求解函數(shù)的方法；

模型訓(xùn)練：最后求解的方程或函數(shù)；

評(píng)估方法：將新的x帶入方程驗(yàn)證函數(shù)“預(yù)測(cè)”是否正確。

與普通的函數(shù)不同的是，機(jī)器學(xué)習(xí)往往很難求解出完整的方程，通過(guò)各種手段求最接近理想情況下的未知項(xiàng)取值。以人臉識(shí)別為例，預(yù)測(cè)函數(shù)為：f:X（圖片臉部特征）—》Y（身份），其中f則是通過(guò)機(jī)器學(xué)習(xí)后，具有人臉識(shí)別能力的模型。使用不同的機(jī)器學(xué)習(xí)方法訓(xùn)練的模型不同，即對(duì)應(yīng)的函數(shù)形式也不同。

機(jī)器學(xué)習(xí)解決的常見(jiàn)四類問(wèn)題：分類、聚類、排序和推薦。

（1）分類問(wèn)題：一般包括二分類和多分類的問(wèn)題，二分類即非黑即白，比如垃圾郵件過(guò)濾；多分類問(wèn)題，即有多種類別的輸出結(jié)果，比如圖像識(shí)別。

（2）聚類問(wèn)題：在一個(gè)集合中，將相似度高的對(duì)象組成多個(gè)類的過(guò)程叫聚類。比如一些新聞?lì)惖膽?yīng)用，將未標(biāo)注的數(shù)據(jù)通過(guò)聚類算法來(lái)構(gòu)建主題。

（3）排序問(wèn)題：根據(jù)相關(guān)度、重要度、匹配度等，讓用戶在海量的信息中找到想要的信息，常見(jiàn)的應(yīng)用場(chǎng)景，如搜索引擎。

（4）推薦問(wèn)題：典型的應(yīng)用場(chǎng)景，電商行業(yè)的千人千面，根據(jù)用戶的購(gòu)買(mǎi)、收藏等行為，分析用戶的喜好，實(shí)現(xiàn)精準(zhǔn)營(yíng)銷。

在理解了機(jī)器學(xué)習(xí)的本質(zhì)以及常見(jiàn)的問(wèn)題類型后，下面將介紹機(jī)器學(xué)習(xí)的過(guò)程。

二、機(jī)器學(xué)習(xí)的過(guò)程

機(jī)器學(xué)習(xí)的過(guò)程主要分為三個(gè)步驟：樣本準(zhǔn)備、算法選取、模型評(píng)估。

1. 樣本準(zhǔn)備

機(jī)器學(xué)習(xí)，需要先學(xué)習(xí)才能預(yù)測(cè)判斷，樣本則是機(jī)器學(xué)習(xí)的信息輸入，樣本的質(zhì)量很大程度上決定了機(jī)器學(xué)習(xí)的效果。以人臉識(shí)別為例，其樣本是大量的人臉圖片。那么，大量的樣本如何獲?。堪磾?shù)據(jù)來(lái)源分類，可分為內(nèi)部樣本和外部樣本。

（1）內(nèi)部樣本

內(nèi)部樣本數(shù)據(jù)，一般可基于內(nèi)部已積累的樣本數(shù)據(jù)，或通過(guò)對(duì)產(chǎn)品進(jìn)行數(shù)據(jù)標(biāo)注或者埋點(diǎn)，來(lái)收集更多維度的樣本數(shù)據(jù)。

（2）外部樣本

若數(shù)據(jù)的量級(jí)或豐富度不夠，則可能需要獲取一些外部樣本。比如通過(guò)搜索典型的大型公開(kāi)數(shù)據(jù)集，或者數(shù)據(jù)爬取等方式，來(lái)獲取一些指定場(chǎng)景的新樣本。

2. 算法選取

在機(jī)器學(xué)習(xí)的過(guò)程中，找到接近理想模型（函數(shù)）的方法即算法。機(jī)器學(xué)習(xí)的常用算法很多，不同的算法，解決的問(wèn)題不同，適用的場(chǎng)景也不同。

如下圖，比如解決聚類問(wèn)題，一般使用無(wú)監(jiān)督學(xué)習(xí)算法，分類問(wèn)題，一般使用有監(jiān)督學(xué)習(xí)算法：支持向量機(jī)SVM、神經(jīng)網(wǎng)絡(luò)等，目前神經(jīng)網(wǎng)絡(luò)依然是研究熱點(diǎn)之一。

（1）神經(jīng)網(wǎng)絡(luò)原理

神經(jīng)網(wǎng)絡(luò)是一種模仿人類思考方式的模型，就像飛機(jī)模仿鳥(niǎo)的形態(tài)一樣，神經(jīng)網(wǎng)絡(luò)也借鑒了生物學(xué)的神經(jīng)元結(jié)構(gòu)。神經(jīng)元細(xì)胞主要由樹(shù)突、軸突和細(xì)胞體構(gòu)成，樹(shù)突用于接收信號(hào)并傳遞給細(xì)胞體，細(xì)胞體處理信號(hào)，軸突輸出信號(hào)。神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)與此類似，一個(gè)典型的單隱含層神經(jīng)網(wǎng)絡(luò)架構(gòu)如下圖：

圖片來(lái)源：網(wǎng)絡(luò)

輸入層：接收輸入數(shù)據(jù)，如圖片、語(yǔ)音特征等；

隱藏層：承載數(shù)據(jù)特征運(yùn)算；

輸出層：輸出計(jì)算的結(jié)果；

其本質(zhì)是，通過(guò)調(diào)整內(nèi)部大量處理單元的連接關(guān)系、激勵(lì)函數(shù)和權(quán)重值，實(shí)現(xiàn)對(duì)理想函數(shù)的逼近。

（2）深度學(xué)習(xí)

深度學(xué)習(xí)是神經(jīng)網(wǎng)絡(luò)的一種算法，目前在計(jì)算機(jī)視覺(jué)等領(lǐng)域應(yīng)用十分廣泛，相比單隱藏層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)，深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)是一種多隱藏層、多層感知器的學(xué)習(xí)結(jié)構(gòu)。如下圖所示，增加更多的隱藏層后，網(wǎng)絡(luò)能更深入得表示特征，以及具有更強(qiáng)的函數(shù)模擬能力，能獲得更好的分類能力。

圖片來(lái)源：網(wǎng)絡(luò)

深度學(xué)習(xí)三類經(jīng)典的神經(jīng)網(wǎng)絡(luò)分別是：深度神經(jīng)網(wǎng)絡(luò)DNN、卷積神經(jīng)網(wǎng)絡(luò)CNN、和循環(huán)神經(jīng)網(wǎng)絡(luò)RNN。其中DNN、CNN一般解決計(jì)算機(jī)視覺(jué)、圖像識(shí)別等分類問(wèn)題，RNN適用于自然語(yǔ)言處理等問(wèn)題。

基于大量的樣本、選取合適的算法進(jìn)行模型訓(xùn)練后，下一步則是對(duì)模型的預(yù)測(cè)效果進(jìn)行評(píng)估。

3. 模型評(píng)估

模型評(píng)估一般可分為兩個(gè)階段：實(shí)驗(yàn)階段和上線階段，在實(shí)驗(yàn)階段能達(dá)到一定的使用標(biāo)準(zhǔn)指標(biāo)，才能進(jìn)入實(shí)際上線使用階段。

（1）實(shí)驗(yàn)階段

為了評(píng)估模型的可用性，需要對(duì)模型的預(yù)測(cè)能力進(jìn)行評(píng)價(jià)，其中很重要的一個(gè)評(píng)價(jià)指標(biāo)就是準(zhǔn)確率，即模型預(yù)測(cè)和標(biāo)簽一致的樣本占所有樣本的比例。即選擇不同于訓(xùn)練數(shù)據(jù)的，有標(biāo)簽數(shù)據(jù)的測(cè)試集，輸入模型進(jìn)行運(yùn)算，計(jì)算預(yù)測(cè)的準(zhǔn)確率，評(píng)估模型對(duì)于測(cè)試集的預(yù)測(cè)效果是否能模型可用指標(biāo)。

（2）上線階段

在模型投入使用后，基于上線后的真實(shí)數(shù)據(jù)反饋，評(píng)估模型的能力，并基于新的反饋數(shù)據(jù)，持續(xù)迭代優(yōu)化模型，提高或保持模型的泛化能力。

三、總結(jié)與思考

作為產(chǎn)品賦能的一個(gè)“工具”，產(chǎn)品化的整個(gè)流程可總結(jié)為：業(yè)務(wù)需求-》轉(zhuǎn)化為業(yè)務(wù)函數(shù)》樣本數(shù)據(jù)獲取-》選擇合適的算法-》模型訓(xùn)練-》內(nèi)部評(píng)估-》上線驗(yàn)證迭代。

其實(shí)這個(gè)過(guò)程，最底層的邏輯還是基于數(shù)學(xué)建模原理的思路來(lái)解決問(wèn)題，也可用來(lái)指導(dǎo)一些日常產(chǎn)品工作中的問(wèn)題。比如，《增長(zhǎng)黑客》中的增長(zhǎng)杠桿、北極星指標(biāo)等方法，其本質(zhì)也是數(shù)據(jù)建模的原理。定義業(yè)務(wù)函數(shù)、確定影響因素、權(quán)重成本分析、判斷最優(yōu)解決方案，評(píng)估上線反饋形成閉環(huán)。

所有，很多問(wèn)題表面看起來(lái)各式各樣、各不相同，但抽象出來(lái)可能就是一些學(xué)科問(wèn)題，比如數(shù)學(xué)、物理、經(jīng)濟(jì)學(xué)等，聯(lián)想到我前段時(shí)間分享的一篇文章《透過(guò)《奇葩說(shuō)》論點(diǎn)，看背后的多元思維模型》中提到的多元思維模型核心觀點(diǎn)——越往深層次思考，越能挖掘事物本質(zhì)，越接近學(xué)科原理。

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

算法

算法

+關(guān)注

關(guān)注
23

文章
4784

瀏覽量
98082
機(jī)器學(xué)習(xí)

機(jī)器學(xué)習(xí)

+關(guān)注

關(guān)注
66

文章
8554

瀏覽量
136975
數(shù)據(jù)集

數(shù)據(jù)集

+關(guān)注

關(guān)注
4

文章
1236

瀏覽量
26202