91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)所需要的基本數(shù)學(xué)技能

如意 ? 來源:讀芯術(shù) ? 作者:讀芯術(shù) ? 2020-07-06 09:39 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作為一切科學(xué)的基礎(chǔ),數(shù)學(xué)在數(shù)據(jù)科學(xué)領(lǐng)域也占據(jù)著重要地位。如果你是一名數(shù)據(jù)科學(xué)愛好者,一定想過這些問題:

· 我可以在幾乎沒有數(shù)學(xué)背景的情況下,成為一名數(shù)據(jù)科學(xué)家嗎?

· 在數(shù)據(jù)科學(xué)中,哪些基本的數(shù)學(xué)技能是重要的?

有很多好用的包可以用來構(gòu)建預(yù)測(cè)模型,或生成數(shù)據(jù)可視化。一些最常用的描述性分析和預(yù)測(cè)性分析包包括:Ggplot2、Matplotlib、Seaborn、Scikit-learn、Caret、TensorFlow、PyTorch、Keras等。

有了這些包,任何人都可以構(gòu)建模型或者生成數(shù)據(jù)可視化。然而,想要微調(diào)模型,使之能產(chǎn)生具有最佳性能的可靠模型,確實(shí)需要非常扎實(shí)的數(shù)學(xué)基礎(chǔ)知識(shí)。

建立模型是一回事,但是解釋模型,并且總結(jié)出有意義的,且可用于數(shù)據(jù)驅(qū)動(dòng)的決策制定的結(jié)論是另一回事。重要的是,在使用這些包之前,讀者必須要對(duì)每一個(gè)包的數(shù)學(xué)基礎(chǔ)有所了解,不僅限將這些包作為黑盒子工具來使用。

案例研究:構(gòu)建多元回歸模型

假設(shè)現(xiàn)在要建立一個(gè)多元回歸模型。在此之前,我們需要問自己幾個(gè)問題:

· 數(shù)據(jù)集有多大?

· 我的特征變量和目標(biāo)變量是什么?

· 哪些預(yù)測(cè)特征與目標(biāo)變量最相關(guān)?

· 哪些功能很重要?

· 應(yīng)該縮放特征嗎?

· 如何提高模型的預(yù)測(cè)能力?

· 應(yīng)該使用正則回歸模型嗎?

· 回歸系數(shù)是多少?

· 什么是攔截?

· 如何將數(shù)據(jù)集劃分為訓(xùn)練集和測(cè)試集?

· 什么是主成分分析(PCA)?

· 應(yīng)該使用主成分分析來刪除冗余的特征嗎?

· 應(yīng)不應(yīng)該使用非參數(shù)回歸模型,如k鄰近回歸(或支持向量回歸)?

· 模型中有哪些超參數(shù),如何對(duì)它們進(jìn)行微調(diào)以獲得性能最優(yōu)的模型?

· 如何評(píng)估模型?是用R2-score(決定系數(shù)),MSE(均方誤差),還是MAE(平均絕對(duì)誤差)?

沒有良好的數(shù)學(xué)背景,就無法回答上述問題。在數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)中,數(shù)學(xué)技能和編程技能同等重要。作為一名數(shù)據(jù)科學(xué)愛好者,一定要投入時(shí)間來研究數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)的理論和數(shù)學(xué)基礎(chǔ)。

能否建立可靠而有效的模型,使其應(yīng)用于現(xiàn)實(shí)世界的問題,取決于讀者的數(shù)學(xué)技能有多好。接下來我們來討論一下在數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)中所需要的一些基本數(shù)學(xué)技能。

數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)的基本數(shù)學(xué)技能

1. 線性代數(shù)

線性代數(shù)是機(jī)器學(xué)習(xí)中最重要的數(shù)學(xué)技能。數(shù)據(jù)集表示為矩陣,線性代數(shù)用于數(shù)據(jù)預(yù)處理、數(shù)據(jù)轉(zhuǎn)換、降維和模型評(píng)估。

以下是大家需要熟悉的:向量;向量的范數(shù);矩陣;矩陣的轉(zhuǎn)置;逆矩陣;矩陣的行列式;矩陣的跡;點(diǎn)積;特征值;特征向量。

2. 統(tǒng)計(jì)與概率

統(tǒng)計(jì)與概率用于特征可視化、數(shù)據(jù)預(yù)處理、特征轉(zhuǎn)換、數(shù)據(jù)插補(bǔ)、降維、特征工程、模型評(píng)價(jià)等。

以下是大家需要熟悉的:均值、中值、模式、標(biāo)準(zhǔn)差/方差、相關(guān)系數(shù)和協(xié)方差矩陣、概率分布(二項(xiàng)式、泊松分布、正態(tài)分布)、p值、貝葉斯定理(精度、召回率、正預(yù)測(cè)值、負(fù)預(yù)測(cè)值、混淆矩陣、ROC曲線)、中心極限定理,R-2 score,均方誤差(MSE),A/B檢驗(yàn),蒙特卡羅模擬。

3. 多變量微積分

大多數(shù)機(jī)器學(xué)習(xí)模型都是由一個(gè)具有多個(gè)特征或預(yù)測(cè)器的數(shù)據(jù)集建立的。因此,熟悉多變量微積分對(duì)于建立機(jī)器學(xué)習(xí)模型非常重要。

以下是大家需要熟悉的:多元函數(shù);導(dǎo)數(shù)和梯度;階躍函數(shù)、S形函數(shù)、Logit效用函數(shù)、ReLU(修正線性單元)函數(shù);成本函數(shù);函數(shù)繪圖;函數(shù)的最小值和最大值。

4.優(yōu)化方法

大多數(shù)機(jī)器學(xué)習(xí)算法是通過最小化目標(biāo)函數(shù)進(jìn)行預(yù)測(cè)建模,從而學(xué)習(xí)為獲得預(yù)測(cè)標(biāo)簽而必須應(yīng)用于測(cè)試數(shù)據(jù)的權(quán)重。

以下是大家需要熟悉的:成本函數(shù)/目標(biāo)函數(shù);似然函數(shù);誤差函數(shù);梯度下降算法及其變體(例如隨機(jī)梯度下降算法)。

本文討論了數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)所需的基本數(shù)學(xué)和理論技能?;ヂ?lián)網(wǎng)時(shí)代,你能很輕松找到學(xué)習(xí)資源。作為數(shù)據(jù)科學(xué)愛好者一定要記住,數(shù)據(jù)科學(xué)的理論基礎(chǔ)對(duì)于高效可靠的模型建立至關(guān)重要。你應(yīng)該花足夠的時(shí)間來鉆研每種機(jī)器學(xué)習(xí)算法背后的數(shù)學(xué)理論,這對(duì)于數(shù)據(jù)科學(xué)來說是必不可少的。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    算法工程師需要具備哪些技能?

    算法工程師需要掌握一系列跨學(xué)科的技能,涵蓋數(shù)學(xué)基礎(chǔ)、編程能力、算法理論、工程實(shí)踐以及業(yè)務(wù)理解等多個(gè)方面。 以下是具體技能學(xué)習(xí)建議: 線性代
    發(fā)表于 02-27 10:53

    嵌入式驅(qū)動(dòng)開發(fā),需要掌握哪些技能?

    :掌握UART、SPI、I2C等接口常見通信協(xié)議,以及如何開發(fā)和調(diào)試相應(yīng)的通信代碼。 2、 編程技能扎實(shí)的編程基礎(chǔ):嵌入式驅(qū)動(dòng)開發(fā)的核心是軟件編程,因此至少需要掌握C語言技能。 掌握數(shù)據(jù)
    發(fā)表于 01-20 16:46

    機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中需避免的 7 個(gè)常見錯(cuò)誤與局限性

    ,并驗(yàn)證輸出結(jié)果,就能不斷提升專業(yè)技能,養(yǎng)成優(yōu)秀數(shù)據(jù)科學(xué)家的工作習(xí)慣。需避免的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)
    的頭像 發(fā)表于 01-07 15:37 ?211次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>中需避免的 7 個(gè)常見錯(cuò)誤與局限性

    嵌入式需要掌握哪些核心技能?

    嵌入式需要掌握哪些核心技能? 若想通過學(xué)習(xí)嵌入式技術(shù)提升就業(yè)競(jìng)爭(zhēng)力,需重點(diǎn)掌握C語言、嵌入式硬件架構(gòu)、RTOS/Linux開發(fā)、通信協(xié)議四大核心技能,并結(jié)合行業(yè)需求積累項(xiàng)目經(jīng)驗(yàn)。
    發(fā)表于 10-21 16:25

    labview怎么讀取UTF-16 LE 文本數(shù)據(jù)

    各位大佬 請(qǐng)問labview怎么讀取UTF-16 LE 文本數(shù)據(jù) 直接讀數(shù)據(jù)出來會(huì)有空格 但是空格無法刪除,請(qǐng)問怎么獲取UTF-16 LE格式數(shù)據(jù)
    發(fā)表于 10-10 11:23

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的科學(xué)應(yīng)用

    科學(xué)發(fā)現(xiàn)的重要組成部分。 實(shí)驗(yàn)科學(xué):通過觀察和實(shí)驗(yàn)來驗(yàn)證假說 理論科學(xué):通過構(gòu)建邏輯框架來解釋觀察到的現(xiàn)象 模型科學(xué):通過數(shù)學(xué)模型來描述和
    發(fā)表于 09-17 11:45

    量子機(jī)器學(xué)習(xí)入門:三種數(shù)據(jù)編碼方法對(duì)比與應(yīng)用

    在傳統(tǒng)機(jī)器學(xué)習(xí)數(shù)據(jù)編碼確實(shí)相對(duì)直觀:獨(dú)熱編碼處理類別變量,標(biāo)準(zhǔn)化調(diào)整數(shù)值范圍,然后直接輸入模型訓(xùn)練。整個(gè)過程更像是數(shù)據(jù)清洗,而非核心算法組件。量子
    的頭像 發(fā)表于 09-15 10:27 ?784次閱讀
    量子<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>入門:三種<b class='flag-5'>數(shù)據(jù)</b>編碼方法對(duì)比與應(yīng)用

    如何在機(jī)器視覺中部署深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)

    人士而言往往難以理解,人們也常常誤以為需要扎實(shí)的編程技能才能真正掌握并合理使用這項(xiàng)技術(shù)。事實(shí)上,這種印象忽視了該技術(shù)為機(jī)器視覺(乃至生產(chǎn)自動(dòng)化)帶來的潛力,因?yàn)樯疃?b class='flag-5'>學(xué)習(xí)并非只屬于計(jì)算機(jī)
    的頭像 發(fā)表于 09-10 17:38 ?911次閱讀
    如何在<b class='flag-5'>機(jī)器</b>視覺中部署深度<b class='flag-5'>學(xué)習(xí)</b>神經(jīng)網(wǎng)絡(luò)

    盤點(diǎn)嵌入式就業(yè)所需要技能有哪些?

    良好的溝通能力和團(tuán)隊(duì)合作精神,能夠與不同領(lǐng)域的工程師協(xié)作。 綜上所述,嵌入式行業(yè)的就業(yè)方向豐富多樣,不同行業(yè)對(duì)嵌入式技術(shù)的需求也各有側(cè)重。因此,嵌入式工程師需要根據(jù)不同的就業(yè)方向,學(xué)習(xí)和掌握相關(guān)的技能
    發(fā)表于 08-11 15:43

    超小型Neuton機(jī)器學(xué)習(xí)模型, 在任何系統(tǒng)級(jí)芯片(SoC)上解鎖邊緣人工智能應(yīng)用.

    這對(duì)開發(fā)人員意味著什么,以及使用Neuton 模型如何改進(jìn)您的開發(fā)和最終應(yīng)用。 ML 模型對(duì)于您所選微控制器的內(nèi)存來說太大。 創(chuàng)建自定義ML 模型本質(zhì)上是一個(gè)手動(dòng)過程,需要高水平的數(shù)據(jù)科學(xué)
    發(fā)表于 07-31 11:38

    通過NVIDIA Cosmos模型增強(qiáng)機(jī)器人學(xué)習(xí)

    通用機(jī)器人的時(shí)代已經(jīng)到來,這得益于機(jī)械電子技術(shù)和機(jī)器人 AI 基礎(chǔ)模型的進(jìn)步。但目前機(jī)器人技術(shù)的發(fā)展仍面臨一個(gè)關(guān)鍵挑戰(zhàn):機(jī)器需要大量的訓(xùn)練
    的頭像 發(fā)表于 07-14 11:49 ?1101次閱讀
    通過NVIDIA Cosmos模型增強(qiáng)<b class='flag-5'>機(jī)器人學(xué)習(xí)</b>

    任正非說 AI已經(jīng)確定是第四次工業(yè)革命 那么如何從容地加入進(jìn)來呢?

    處理,TensorFlow、PyTorch用于構(gòu)建和訓(xùn)練神經(jīng)網(wǎng)絡(luò)。以Python為例,通過編寫簡(jiǎn)單的程序來處理數(shù)據(jù),如讀取數(shù)據(jù)集、進(jìn)行數(shù)據(jù)清洗和預(yù)處理,這是進(jìn)入AI領(lǐng)域的基本技能。
    發(fā)表于 07-08 17:44

    嵌入式AI技術(shù)漫談:怎么為訓(xùn)練AI模型采集樣本數(shù)據(jù)

    Q 需要為嵌入式AI模型提供多少樣本數(shù)據(jù)? 我在向客戶介紹如何使用AI方法設(shè)計(jì)一款客戶產(chǎn)品時(shí),客戶理解,AI嵌入式項(xiàng)目的開發(fā)都是圍繞數(shù)據(jù)展開的,如此,我經(jīng)常會(huì)被問到這樣的問題:客戶的工程師需要
    的頭像 發(fā)表于 06-11 16:30 ?1403次閱讀

    嵌入式AI技術(shù)之深度學(xué)習(xí)數(shù)據(jù)樣本預(yù)處理過程中使用合適的特征變換對(duì)深度學(xué)習(xí)的意義

    ? 作者:蘇勇Andrew 使用神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)機(jī)器學(xué)習(xí),網(wǎng)絡(luò)的每個(gè)層都將對(duì)輸入的數(shù)據(jù)做一次抽象,多層神經(jīng)網(wǎng)絡(luò)構(gòu)成深度學(xué)習(xí)的框架,可以深度理解數(shù)據(jù)
    的頭像 發(fā)表于 04-02 18:21 ?1525次閱讀

    **【技術(shù)干貨】Nordic nRF54系列芯片:傳感器數(shù)據(jù)采集與AI機(jī)器學(xué)習(xí)的完美結(jié)合**

    【技術(shù)干貨】nRF54系列芯片:傳感器數(shù)據(jù)采集與AI機(jī)器學(xué)習(xí)的完美結(jié)合 近期收到不少伙伴咨詢nRF54系列芯片的應(yīng)用與技術(shù)細(xì)節(jié),今天我們整理幾個(gè)核心問題與解答,帶你快速掌握如何在nRF54上部署AI
    發(fā)表于 04-01 00:00