91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

系統(tǒng)機(jī)器學(xué)習(xí)算法總結(jié)知識(shí)分享

zhKF_jqr_AI ? 來源:未知 ? 作者:steve ? 2017-12-15 14:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Statsbot數(shù)據(jù)科學(xué)家Daniil Korbut簡明扼要地介紹了用于推薦系統(tǒng)的主流機(jī)器學(xué)習(xí)算法:協(xié)同過濾、矩陣分解、聚類、深度學(xué)習(xí)。

現(xiàn)在有許多公司使用大數(shù)據(jù)來制定高度相關(guān)的建議以提高收入。數(shù)據(jù)科學(xué)家需要根據(jù)業(yè)務(wù)的限制和需求,在各種推薦算法中選擇最好的算法。

為了簡化這一任務(wù),Statsbot團(tuán)隊(duì)準(zhǔn)備了一份現(xiàn)有主要推薦系統(tǒng)算法的概覽。

協(xié)同過濾

協(xié)同過濾(collaborative filtering, CF)及其改版是最常用的推薦算法之一。 即使是數(shù)據(jù)科學(xué)初學(xué)者也可以使用它來構(gòu)建他們的個(gè)人電影推薦系統(tǒng),比如用它寫一個(gè)簡歷項(xiàng)目。

當(dāng)我們想向用戶推薦東西時(shí),最符合邏輯的做法是找到有相似興趣的人,分析他們的行為,然后給我們的用戶推薦相同的東西。 或者我們可以查看與用戶之前所購類似的物品,并進(jìn)行相應(yīng)的推薦。

這正是CF的兩種基本方法:基于用戶的協(xié)作過濾和基于物品的協(xié)作過濾。

在這兩種情形下,推薦引擎分兩步:

  1. 找出數(shù)據(jù)庫中有多少用戶/物品與給定的用戶/物品類似。

  2. 評(píng)估其他用戶/物品,這一評(píng)估基于比待評(píng)估用戶/物品更相似的用戶/物品的總權(quán)重,以預(yù)測(cè)給用戶推薦相應(yīng)產(chǎn)品的評(píng)分。

算法中的“最相似”是什么意思?

假設(shè)我們有一個(gè)表示每個(gè)用戶的偏好的向量(矩陣 R的行)和一個(gè)表示用戶給每件產(chǎn)品評(píng)分的向量(矩陣 R的列)。

首先,讓我們?nèi)コ恍┰兀槐A魞蓚€(gè)向量中值均已知的元素。

例如,如果我們想比較比爾和簡,我們可以看到,比爾還沒有看過《泰坦尼克號(hào)》,而簡到現(xiàn)在為止還沒看過《蝙蝠俠》,所以我們只能通過《星球大戰(zhàn)》來衡量他們的相似性。怎么會(huì)有人不看《星球大戰(zhàn)》,是吧?:)

最流行的衡量相似性的技術(shù)是用戶/物品向量之間的余弦相似性或加權(quán)平均數(shù)。

矩陣分解

下一個(gè)有趣的算法是矩陣分解。這是一個(gè)非常優(yōu)雅的推薦算法,因?yàn)槭褂镁仃嚪纸鈺r(shí)通常不用考慮要在結(jié)果矩陣的列和行中保留的物品。

u是第i個(gè)用戶的興趣向量,v是表示第j部電影的參數(shù)的向量。因此,我們可以使用u和v的點(diǎn)積來逼近x(第i個(gè)用戶對(duì)第j部電影的評(píng)分)。我們使用已知評(píng)分來構(gòu)建這些向量,并使用它們來預(yù)測(cè)未知評(píng)分。

例如,我們有表示用戶特德的向量(1.4; .9)和表示電影A的向量(1.4; .8),矩陣分解之后我們可以直接通過計(jì)算(1.4; .9)和(1.4; .8)的點(diǎn)積來還原電影A——特德的評(píng)分,結(jié)果為2.68。

聚類

前面兩個(gè)推薦算法非常簡單,比較適合小型系統(tǒng)。到目前為止,我們將推薦問題看作一個(gè)監(jiān)督學(xué)習(xí)任務(wù)?,F(xiàn)在到了應(yīng)用無監(jiān)督方法來解決這個(gè)問題的時(shí)候了。

想象一下,我們正在建立一個(gè)大型推薦系統(tǒng),協(xié)同過濾和矩陣分解會(huì)花很長時(shí)間。這時(shí)第一個(gè)想到的應(yīng)該是聚類(clustering)。

根據(jù)屬于同一聚類的所有客戶的偏好,每個(gè)聚類會(huì)被分配一個(gè)典型偏好。每個(gè)聚類中的客戶將收到在聚類層次計(jì)算出的推薦。

業(yè)務(wù)初期缺乏用戶評(píng)分,因此聚類會(huì)是最佳選擇。

不過,單獨(dú)使用的話,聚類有點(diǎn)弱。因?yàn)橥ㄟ^聚類,我們識(shí)別出用戶群組,然后給同一群組中的每個(gè)用戶都推薦相同的物品。當(dāng)我們有足夠多的數(shù)據(jù)的時(shí)候,更好的選擇是將聚類作為第一步,用來調(diào)整相關(guān)用戶/物品選取,以供協(xié)同過濾算法使用。聚類也能提升復(fù)雜推薦系統(tǒng)的性能。

深度學(xué)習(xí)

十年來,神經(jīng)網(wǎng)絡(luò)有一個(gè)巨大的飛躍。今天,神經(jīng)網(wǎng)絡(luò)被應(yīng)用到許多領(lǐng)域,正逐漸取代傳統(tǒng)的機(jī)器學(xué)習(xí)方法。我想談一下YouTube使用的深度學(xué)習(xí)方法。

毫無疑問,為這樣的服務(wù)打造推薦系統(tǒng)是一項(xiàng)非常具有挑戰(zhàn)性的任務(wù),因?yàn)檫@一服務(wù)的規(guī)模很大,語料庫是動(dòng)態(tài)的,還有各種難以觀察的外部因素。

根據(jù)《YouTube推薦系統(tǒng)的深度神經(jīng)網(wǎng)絡(luò)》,YouTube推薦系統(tǒng)算法包括兩個(gè)神經(jīng)網(wǎng)絡(luò):一個(gè)用于生成候選視頻,另一個(gè)用于排名。如果你沒有足夠的時(shí)間閱讀上面的論文,我這里有一個(gè)快速總結(jié)。

接受用戶的歷史事件作為輸入,候選生成網(wǎng)絡(luò)顯著減少了視頻的數(shù)量,從一個(gè)巨大的語料庫抽取出一組相關(guān)性最高的視頻。生成的候選視頻是最和用戶相關(guān)的,我們即將預(yù)測(cè)用戶給候選視頻的評(píng)分。這個(gè)網(wǎng)絡(luò)的目標(biāo)只是通過協(xié)同過濾來提供一些范圍較廣的個(gè)性化候選視頻。

接下來我們需要更仔細(xì)地分析這些候選視頻,以挑選出其中最好的視頻。我們通過評(píng)分網(wǎng)絡(luò)完成這一任務(wù),評(píng)分網(wǎng)絡(luò)可以通過一個(gè)期望目標(biāo)函數(shù)給每個(gè)視頻賦值一個(gè)分?jǐn)?shù),該期望目標(biāo)函數(shù)使用描述視頻的數(shù)據(jù)和有關(guān)用戶行為的信息。評(píng)分最高的那些視頻將被推薦給用戶。

使用這一兩步方法,我們可以基于一個(gè)非常巨大的視頻語料庫推薦視頻,同時(shí)保證推薦的少量視頻是個(gè)性化的。這一設(shè)計(jì)也允許我們混合從其他來源生成的候選視頻。

這一推薦任務(wù)構(gòu)成了一個(gè)極端多類分類(extreme multiclass classification)問題,基于用戶(U)和情境(C)精確地分類在給定時(shí)刻t觀看(wt)的特定視頻,這一視頻取自一個(gè)語料庫(V),總共有數(shù)百萬的視頻類別(i)。

構(gòu)建你自己的推薦系統(tǒng)

  • 基于大型數(shù)據(jù)庫的在線推薦,最好的辦法是將這個(gè)問題拆分成兩個(gè)子問題:1)選擇排名最高的N個(gè)候選 2)對(duì)它們進(jìn)行評(píng)分。

  • 如何評(píng)估模型質(zhì)量?除了標(biāo)準(zhǔn)的質(zhì)量指標(biāo)之外,還有一些特別針對(duì)推薦問題的指標(biāo):Recall at K和Precision at K,Average Recall at K和Average Precision at K。另外可以參考《A Survey of Accuracy Evaluation Metrics of Recommendation Task》(JMLR 10 (2009))

  • 如果使用分類算法解決推薦問題,則應(yīng)考慮生成負(fù)樣本。如果用戶購買了推薦的物品,不應(yīng)將其作為正樣本,也不應(yīng)將未購買的推薦物品作為負(fù)樣本。

  • 基于在線分?jǐn)?shù)和離線分?jǐn)?shù)考量算法質(zhì)量。 僅使用歷史數(shù)據(jù)的訓(xùn)練模型可能導(dǎo)向簡陋的推薦系統(tǒng),因?yàn)樵撍惴ú恢佬碌某绷骱推谩?/p>


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 聚類
    +關(guān)注

    關(guān)注

    0

    文章

    146

    瀏覽量

    14718
  • 協(xié)同過濾
    +關(guān)注

    關(guān)注

    0

    文章

    45

    瀏覽量

    10144
  • 矩陣分解
    +關(guān)注

    關(guān)注

    1

    文章

    13

    瀏覽量

    3781

原文標(biāo)題:推薦系統(tǒng)機(jī)器學(xué)習(xí)算法概覽

文章出處:【微信號(hào):jqr_AI,微信公眾號(hào):論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    算法工程師需要具備哪些技能?

    算法工程師需要掌握一系列跨學(xué)科的技能,涵蓋數(shù)學(xué)基礎(chǔ)、編程能力、算法理論、工程實(shí)踐以及業(yè)務(wù)理解等多個(gè)方面。 以下是具體技能及學(xué)習(xí)建議: 線性代數(shù)核心內(nèi)容:矩陣運(yùn)算、特征值分解、向量空間等。應(yīng)用場
    發(fā)表于 02-27 10:53

    穿孔機(jī)頂頭檢測(cè)儀 機(jī)器視覺深度學(xué)習(xí)

    LX01Z-DG626穿孔機(jī)頂頭檢測(cè)儀采用深度學(xué)習(xí)技術(shù),能夠?qū)崿F(xiàn)頂頭狀態(tài)的在線實(shí)時(shí)檢測(cè),頂頭丟失報(bào)警,頂頭異常狀態(tài)報(bào)警等功能,響應(yīng)迅速,異常狀態(tài)視頻回溯,檢測(cè)頂頭溫度,配備吹掃清潔系統(tǒng),維護(hù)周期長
    發(fā)表于 12-22 14:33

    AI 驅(qū)動(dòng)三維逆向:點(diǎn)云降噪算法工具與機(jī)器學(xué)習(xí)建模能力的前沿應(yīng)用

    在三維逆向工程領(lǐng)域,傳統(tǒng)方法在處理復(fù)雜數(shù)據(jù)和構(gòu)建高精度模型時(shí)面臨諸多挑戰(zhàn)。隨著人工智能(AI)技術(shù)的發(fā)展,點(diǎn)云降噪算法工具與機(jī)器學(xué)習(xí)建模能力的應(yīng)用,為三維逆向工程帶來了創(chuàng)新性解決方案,顯著提升
    的頭像 發(fā)表于 08-20 10:00 ?692次閱讀
    AI 驅(qū)動(dòng)三維逆向:點(diǎn)云降噪<b class='flag-5'>算法</b>工具與<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>建模能力的前沿應(yīng)用

    PID控制算法學(xué)習(xí)筆記資料

    用于新手學(xué)習(xí)PID控制算法
    發(fā)表于 08-12 16:22 ?7次下載

    FPGA在機(jī)器學(xué)習(xí)中的具體應(yīng)用

    ,越來越多地被應(yīng)用于機(jī)器學(xué)習(xí)任務(wù)中。本文將探討 FPGA 在機(jī)器學(xué)習(xí)中的應(yīng)用,特別是在加速神經(jīng)網(wǎng)絡(luò)推理、優(yōu)化算法和提升處理效率方面的優(yōu)勢(shì)。
    的頭像 發(fā)表于 07-16 15:34 ?2885次閱讀

    機(jī)器學(xué)習(xí)異常檢測(cè)實(shí)戰(zhàn):用Isolation Forest快速構(gòu)建無標(biāo)簽異常檢測(cè)系統(tǒng)

    本文轉(zhuǎn)自:DeepHubIMBA無監(jiān)督異常檢測(cè)作為機(jī)器學(xué)習(xí)領(lǐng)域的重要分支,專門用于在缺乏標(biāo)記數(shù)據(jù)的環(huán)境中識(shí)別異常事件。本文深入探討異常檢測(cè)技術(shù)的理論基礎(chǔ)與實(shí)踐應(yīng)用,通過IsolationForest
    的頭像 發(fā)表于 06-24 11:40 ?1410次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>異常檢測(cè)實(shí)戰(zhàn):用Isolation Forest快速構(gòu)建無標(biāo)簽異常檢測(cè)<b class='flag-5'>系統(tǒng)</b>

    使用MATLAB進(jìn)行無監(jiān)督學(xué)習(xí)

    無監(jiān)督學(xué)習(xí)是一種根據(jù)未標(biāo)注數(shù)據(jù)進(jìn)行推斷的機(jī)器學(xué)習(xí)方法。無監(jiān)督學(xué)習(xí)旨在識(shí)別數(shù)據(jù)中隱藏的模式和關(guān)系,無需任何監(jiān)督或關(guān)于結(jié)果的先驗(yàn)知識(shí)。
    的頭像 發(fā)表于 05-16 14:48 ?1435次閱讀
    使用MATLAB進(jìn)行無監(jiān)督<b class='flag-5'>學(xué)習(xí)</b>

    【「# ROS 2智能機(jī)器人開發(fā)實(shí)踐」閱讀體驗(yàn)】視覺實(shí)現(xiàn)的基礎(chǔ)算法的應(yīng)用

    學(xué)習(xí)建議 對(duì)于初學(xué)者,建議先通過仿真(如Gazebo)驗(yàn)證算法,再遷移到真實(shí)機(jī)器人,以降低硬件調(diào)試成本。 多參與開源社區(qū)(如ROS2的GitHub項(xiàng)目),學(xué)習(xí)前沿技術(shù)并貢獻(xiàn)代碼
    發(fā)表于 05-03 19:41

    【「# ROS 2智能機(jī)器人開發(fā)實(shí)踐」閱讀體驗(yàn)】+內(nèi)容初識(shí)

    、軟件開發(fā)、系統(tǒng)集成等環(huán)節(jié),讓讀者能夠全面了解一個(gè)完整的機(jī)器人應(yīng)用開發(fā)過程。 實(shí)踐項(xiàng)目:除了案例分析,書中還設(shè)計(jì)了一些實(shí)踐項(xiàng)目,供讀者進(jìn)行動(dòng)手實(shí)踐。這些實(shí)踐項(xiàng)目涵蓋了從簡單的傳感器數(shù)據(jù)處理到復(fù)雜的多機(jī)器
    發(fā)表于 04-27 11:24

    機(jī)器人主控芯片平臺(tái)有哪些 機(jī)器人主控芯片一文搞懂

    AI芯片在人形機(jī)器人中的應(yīng)用越來越廣泛。這些AI芯片專門設(shè)計(jì)用于執(zhí)行人工智能算法,如深度學(xué)習(xí)、機(jī)器學(xué)習(xí)等。
    的頭像 發(fā)表于 04-25 16:26 ?7578次閱讀
    <b class='flag-5'>機(jī)器</b>人主控芯片平臺(tái)有哪些  <b class='flag-5'>機(jī)器</b>人主控芯片一文搞懂

    復(fù)合機(jī)器人為什么要使用單點(diǎn)糾偏算法

    復(fù)合機(jī)器人單點(diǎn)糾偏算法
    的頭像 發(fā)表于 04-20 14:59 ?687次閱讀
    復(fù)合<b class='flag-5'>機(jī)器</b>人為什么要使用單點(diǎn)糾偏<b class='flag-5'>算法</b>?

    進(jìn)群免費(fèi)領(lǐng)FPGA學(xué)習(xí)資料!數(shù)字信號(hào)處理、傅里葉變換與FPGA開發(fā)等

    的基礎(chǔ)知識(shí),講述了確定性數(shù)字信號(hào)處理的知識(shí),包括離散時(shí)間信號(hào)及系統(tǒng)的介紹、z變換、傅里葉變換、頻率分析以及濾波器設(shè)計(jì)等。介紹了隨機(jī)數(shù)字信號(hào)處理的知識(shí),主要
    發(fā)表于 04-07 16:41

    十大鮮為人知卻功能強(qiáng)大的機(jī)器學(xué)習(xí)模型

    本文轉(zhuǎn)自:QuantML當(dāng)我們談?wù)?b class='flag-5'>機(jī)器學(xué)習(xí)時(shí),線性回歸、決策樹和神經(jīng)網(wǎng)絡(luò)這些常見的算法往往占據(jù)了主導(dǎo)地位。然而,除了這些眾所周知的模型之外,還存在一些鮮為人知但功能強(qiáng)大的算法,它們能夠
    的頭像 發(fā)表于 04-02 14:10 ?1093次閱讀
    十大鮮為人知卻功能強(qiáng)大的<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>模型

    **【技術(shù)干貨】Nordic nRF54系列芯片:傳感器數(shù)據(jù)采集與AI機(jī)器學(xué)習(xí)的完美結(jié)合**

    機(jī)器學(xué)習(xí)算法,解決傳感器數(shù)據(jù)采集難題! 1. nRF54系列支持OTA嗎? 答:支持!nRF54L系列基于Zephyr的MCUBOOT和SMP DFU庫,支持BLE和UART等多種OTA方式
    發(fā)表于 04-01 00:00

    請(qǐng)問STM32部署機(jī)器學(xué)習(xí)算法硬件至少要使用哪個(gè)系列的芯片?

    STM32部署機(jī)器學(xué)習(xí)算法硬件至少要使用哪個(gè)系列的芯片?
    發(fā)表于 03-13 07:34