91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機(jī)器學(xué)習(xí)研究需要掌握的9個(gè)工具

穎脈Imgtec ? 2023-10-12 08:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

學(xué)術(shù)界在推進(jìn)技術(shù)方面發(fā)揮了巨大作用,但學(xué)術(shù)界和工業(yè)界往往存在一種分割狀態(tài)。我們經(jīng)常會(huì)看到這種現(xiàn)象:無數(shù)很棒的輔助工具在學(xué)術(shù)界被忽視,但在工業(yè)界很受歡迎。對于很多研究者來說,學(xué)習(xí)一種新工具可能存在困難,不愿意花費(fèi)過多的時(shí)間去嘗試,在當(dāng)前自己掌握的工具足以應(yīng)對各種問題時(shí)尤其如此。

其實(shí),有些工具一時(shí)未見到效果,在后期可能會(huì)有十倍的回報(bào)。

來自劍橋大學(xué)的計(jì)算機(jī)科學(xué)博士生 Aliaksei Mikhailiuk為我們整理了機(jī)器學(xué)習(xí)博士在獲得學(xué)位之前需要掌握的九種工具。他在劍橋大學(xué)獲得物理學(xué)碩士學(xué)位,在布里斯托大學(xué)獲得工程學(xué)士學(xué)位。他對研究、開發(fā)、部署感興趣,還能熟練掌握計(jì)算機(jī)視覺算法、聚合和自然語言處理等技術(shù)?,F(xiàn)任職華為(英國)高級(jí)人工智能工程師。

Mikhailiuk 將這些工具按用途分為四類:可隔離環(huán)境、實(shí)驗(yàn)跟蹤、相互協(xié)作以及可視化


一、可隔離環(huán)境工具

機(jī)器學(xué)習(xí)是一個(gè)快速發(fā)展的領(lǐng)域,常用的包更新非常頻繁。盡管開發(fā)人員做出了努力,但較新的版本通常與舊版本不兼容,這樣給研究者帶來很多麻煩。幸運(yùn)的是,有工具可以解決這個(gè)問題!在這一方面,Mikhailiuk 推薦了兩個(gè)工具:Docker 和 Conda。

1. Docker

Mikhailiuk 攻讀博士學(xué)位期間,他有一臺(tái)由大學(xué)管理的機(jī)器,學(xué)校會(huì)定期進(jìn)行更新。通常情況下是一夜之間更新,沒有任何通知。你可以想象,當(dāng)更新后的第二天早上發(fā)現(xiàn)自己大部分工作與最新的驅(qū)動(dòng)程序不兼容,是多么令人崩潰。Mikhailiuk 發(fā)現(xiàn) Docker 可以很好地解決。

Docker 允許將軟件包裝在稱為容器的包中。容器是具有自己的軟件、庫和配置文件的獨(dú)立單元。在一個(gè)簡化的視圖中,容器是一個(gè)獨(dú)立的虛擬操作系統(tǒng),它具有與外部世界通信的手段。Docker 是一個(gè)開源的應(yīng)用容器引擎,讓開發(fā)者可以打包他們的應(yīng)用以及依賴包到一個(gè)可移植的容器中,然后發(fā)布到任何流行的 Linux 或 Windows 操作系統(tǒng)的機(jī)器上,也可以實(shí)現(xiàn)虛擬化,容器是完全使用沙箱機(jī)制,相互之間不會(huì)有任何接口。一個(gè)完整的 Docker 由以下幾個(gè)部分組成:

  • DockerClient 客戶端
  • Docker Daemon 守護(hù)進(jìn)程
  • Docker Image 鏡像
  • DockerContainer 容器

2. Conda

現(xiàn)在,復(fù)用別人的代碼成為了一種新的規(guī)范。GitHub 作為一個(gè)代碼托管云服務(wù)網(wǎng)站,幫助開發(fā)者存儲(chǔ)和管理其項(xiàng)目源代碼,且能夠追蹤、記錄并控制用戶對其代碼的修改。研究者可以克隆上面的代碼,安裝并提出自己的解決方案,而不需要自己寫任何東西。

但是 GitHub 也有不方便的情況,當(dāng)多個(gè)項(xiàng)目一起使用時(shí),你會(huì)遇到包管理問題,因?yàn)椴煌捻?xiàng)目需要不同版本的包。

Conda 可以解決這個(gè)問題 。Conda 是一個(gè)開源跨平臺(tái)語言無關(guān)的包管理與環(huán)境管理系統(tǒng),它允許創(chuàng)建多個(gè)環(huán)境并快速安裝、運(yùn)行和更新包及其依賴項(xiàng),用戶可以在隔離的環(huán)境之間快速切換。


二、運(yùn)行、跟蹤和記錄實(shí)驗(yàn)工具

在應(yīng)用領(lǐng)域想要獲得博士學(xué)位,嚴(yán)謹(jǐn)性和一致性是兩個(gè)基本支柱。假如你是研究機(jī)器學(xué)習(xí)模型的,或多或少都能遇到這種情況——你創(chuàng)建了許多不同的模型來試驗(yàn)不同的參數(shù)甚至整個(gè)架構(gòu)。你還想嘗試優(yōu)化器的選擇、學(xué)習(xí)率、時(shí)期數(shù)等。因此,實(shí)際上,你將進(jìn)行許多不同的實(shí)驗(yàn),并且將越來越難以整理結(jié)果。在這一方面,Aliaksei Mikhailiuk 向我們展示了如何正確方便地管理和記錄自己的 ML 和 DL 實(shí)驗(yàn)工具,主要推薦了 Weights & Biases,MLFlow,Screen 工具。

3. Weights & Biases

3a49f7f4-6896-11ee-9788-92fbcf53809c.png

▲wandb panel 一組簡單指標(biāo) Snapshot——訓(xùn)練損失、學(xué)習(xí)率和平均驗(yàn)證損失。請注意,你還可以跟蹤系統(tǒng)參數(shù)。

W&B(Weights & Biases) 是一個(gè)平臺(tái),可以幫助數(shù)據(jù)科學(xué)家跟蹤他們的模型、數(shù)據(jù)集、系統(tǒng)信息等。只需幾行代碼,用戶就可以開始跟蹤有關(guān)這些功能的所有內(nèi)容。它免費(fèi)供個(gè)人使用,團(tuán)隊(duì)使用通常需要付費(fèi),但用于學(xué)術(shù)目的的團(tuán)隊(duì)是免費(fèi)的。你可以將 W&B 與自己喜歡的框架一起使用,例如 TensorFlow、Keras、PyTorch、SKlearn、fastai 等。

W&B 提供了以下 4 個(gè)有用的工具:

  • Dashboard:實(shí)驗(yàn)跟蹤;
  • Artifacts:數(shù)據(jù)集版本控制、模型版本控制;
  • Sweeps:超參數(shù)優(yōu)化;
  • Reports 保存和共享可重現(xiàn)的結(jié)果。

4. MLFlow

MLFlow 是一個(gè)能夠覆蓋機(jī)器學(xué)習(xí)全流程(從數(shù)據(jù)準(zhǔn)備到模型訓(xùn)練到最終部署)的新平臺(tái),它是一款管理機(jī)器學(xué)習(xí)工作流程的工具,主要有三個(gè)功能模塊:Tracking 跟蹤和記錄、Project 項(xiàng)目管理和 Models 模型管理。MLflow 支持 Java、Python、R 和 REST API 等。

MLFlow 具有以下主要組件:

跟蹤:用于跟蹤試驗(yàn),以記錄和比較參數(shù)與結(jié)果;

模型:用于通過各種 ML 庫管理模型,并將其部署到各種模型服務(wù)和推理平臺(tái);

項(xiàng)目:用于將 ML 代碼打包成可重用、可再現(xiàn)的格式,以便與其他數(shù)據(jù)科學(xué)家共享或轉(zhuǎn)移到生產(chǎn)環(huán)境;

模型注冊表:使你可以將模型存儲(chǔ)集中化,以便使用版本控制和批注功能來管理模型的完整生命周期階段轉(zhuǎn)換;

模型服務(wù):可用于將 MLflow 模型以 REST 終結(jié)點(diǎn)的形式托管。

5. Screen

對于每個(gè)研究者來說,讓實(shí)驗(yàn)通宵運(yùn)行而且機(jī)器不會(huì)進(jìn)入休眠狀態(tài)再好不過了。當(dāng)進(jìn)行遠(yuǎn)程工作時(shí),很多人都會(huì)擔(dān)心 ssh 會(huì)話中斷——代碼運(yùn)行幾個(gè)小時(shí)就停止了。

screen 命令允許用戶在一個(gè)窗口內(nèi)使用多個(gè)終端會(huì)話,可以斷開連接,也可以重新連接已斷開連接的會(huì)話。每個(gè)會(huì)話都可以恢復(fù)連接,這樣就算會(huì)話斷開了,用戶也不必?fù)?dān)心數(shù)據(jù)丟失。


四、協(xié)作工具學(xué)術(shù)界缺乏有效的團(tuán)隊(duì)管理機(jī)制,在某種程度上這是由于學(xué)術(shù)界會(huì)嚴(yán)格劃分個(gè)人貢獻(xiàn)造成的。然而,機(jī)器學(xué)習(xí)的發(fā)展速度需要大家共同努力。Mikhailiuk 推薦了兩個(gè)非常基本的工具:GitHub 以及 Lucidchart,它們對于有效的溝通非常方便,尤其是在遠(yuǎn)程工作上。

6. GitHub

GitHub 是通過 Git 進(jìn)行版本控制的軟件源代碼托管服務(wù)平臺(tái),同時(shí)提供付費(fèi)賬戶和免費(fèi)賬戶,這兩種賬戶都可以創(chuàng)建公開或私有的代碼倉庫,但付費(fèi)用戶支持更多功能。除了允許個(gè)人和組織創(chuàng)建和訪問保管中的代碼以外,它也提供了一些方便社會(huì)化共同軟件開發(fā)的功能,包括允許用戶追蹤其他用戶、組織、軟件庫的動(dòng)態(tài),對軟件代碼的改動(dòng)和 bug 提出評論等。GitHub 也提供圖表功能,用于概觀顯示開發(fā)者們怎樣在代碼庫上工作以及軟件的開發(fā)活躍程度。

就在近日,GitHub 正式發(fā)布了2021 年度報(bào)告。過去一年里,有 1600 萬開發(fā)者加入了 GitHub,目前平臺(tái)的開發(fā)者數(shù)量已經(jīng)達(dá)到了 7300 萬;過去一年里,他們在 GitHub 上創(chuàng)建了 6100 萬個(gè)存儲(chǔ)庫。世界財(cái)富 100 強(qiáng)企業(yè)中的 84% 都在使用 GitHub。

7. Lucidchart

Lucidchart 是一款免費(fèi)的可以支持離線操作的谷歌瀏覽器圖表插件,可以幫助用戶繪制包括流程圖、實(shí)體模型、UML、思維導(dǎo)圖等多種圖表的繪制工作。它提供了很多免費(fèi)繪圖模板,大大地加快了用戶的繪圖速度。該應(yīng)用的一大優(yōu)勢是,它基于 HTML5,因此用戶不需要下載本地應(yīng)用程序,就可以在電腦、iPad 等設(shè)備上使用該應(yīng)用。它的另一主要優(yōu)勢是共享的協(xié)作空間和在圖表旁邊做筆記的能力。

3a6e728c-6896-11ee-9788-92fbcf53809c.png


五、可視化工具

提交論文時(shí),研究人員經(jīng)常會(huì)遇到拒稿的情況,這讓 Mikhailiuk 意識(shí)到可視化功能和結(jié)果一樣重要。

如果審稿人沒有太多時(shí)間,或者對論文涉及的領(lǐng)域不熟悉,通常來說論文會(huì)被拒掉,其中一部分原因可能是論文中的視圖給人印象不深刻。因此,Mikhailiuk 推薦了 Inkscape 和 Streamlit 這兩個(gè)工具。

8. Inkscape

Inkscape 是一個(gè)開源的矢量圖編輯工具,使用可伸縮向量圖形 (SVG),以及基于 W3C 標(biāo)準(zhǔn)的 open XML 格式作為其默認(rèn)文件格式。設(shè)計(jì)過程可能從一張涂鴉、一幅素描或者軟件中模型設(shè)計(jì)開始,這些可能不足以完成一整個(gè)項(xiàng)目。Inkscape 可以幫助你將以上不成熟的素材轉(zhuǎn)變?yōu)閷I(yè)的設(shè)計(jì),用于廣告發(fā)布、模型制作等用途。Inkscape 還能提供 TexText 擴(kuò)展,使用此軟件包,你可以將 latex 公式無縫集成到圖像中。

3a732426-6896-11ee-9788-92fbcf53809c.png

9. Streamlit

Streamlit 和常規(guī) Web 框架不同之處在于,它不需要你去編寫任何客戶端代碼(HTML/CSS/JS),只需要編寫普通的 Python 模塊,就可以在很短的時(shí)間內(nèi)創(chuàng)建美觀并具備高度交互性的界面,從而快速生成數(shù)據(jù)分析或者機(jī)器學(xué)習(xí)的結(jié)果;另一方面,和那些只能通過拖拽生成的工具也不同的是,你仍然具有對代碼的完整控制權(quán)。

以上就是 Mikhailiuk 在獲得機(jī)器學(xué)習(xí)博士學(xué)位之前需要掌握的九個(gè)工具,你不妨也學(xué)習(xí)一下,相信這些工具在你之后的學(xué)習(xí)、工作中,會(huì)起到事半功倍的效果。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 軟件
    +關(guān)注

    關(guān)注

    69

    文章

    5335

    瀏覽量

    91619
  • 架構(gòu)
    +關(guān)注

    關(guān)注

    1

    文章

    532

    瀏覽量

    26597
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8556

    瀏覽量

    137002
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    嵌入式驅(qū)動(dòng)開發(fā),需要掌握哪些技能?

    。 4、 熟悉驅(qū)動(dòng)開發(fā)常用工具做驅(qū)動(dòng)開發(fā),會(huì)牽涉到很多軟硬件工具。比如:VS Code、Keil、 J-Link、Git等。 5、 調(diào)試和故障排除嵌入式軟件的測試和調(diào)試非常重要,需要
    發(fā)表于 01-20 16:46

    機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中需避免的 7 個(gè)常見錯(cuò)誤與局限性

    無論你是剛?cè)腴T還是已經(jīng)從事人工智能模型相關(guān)工作一段時(shí)間,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中都存在一些我們需要時(shí)刻關(guān)注并銘記的常見錯(cuò)誤。如果對這些錯(cuò)誤置之不理,日后可能會(huì)引發(fā)諸多麻煩!只要我們密切關(guān)注
    的頭像 發(fā)表于 01-07 15:37 ?213次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>中需避免的 7 <b class='flag-5'>個(gè)</b>常見錯(cuò)誤與局限性

    嵌入式應(yīng)掌握的幾種能力

    中,也會(huì)選擇使用C++來進(jìn)行開發(fā)。 補(bǔ)充編程語言的知識(shí)時(shí),除了掌握語言本身的知識(shí)之外。還需要同時(shí)學(xué)習(xí):編譯、構(gòu)建、調(diào)試等方面的相關(guān)知識(shí)。這類很重要的知識(shí)一般C語言課程都沒教: 2. 芯片
    發(fā)表于 12-08 06:05

    分享一個(gè)嵌入式開發(fā)學(xué)習(xí)路線

    法,這些語法在嵌入式開發(fā)中至關(guān)重要。 2. 技能進(jìn)階期(2-3個(gè)月) 從51單片機(jī)過渡到主流的ARM Cortex-M系列(嵌入式就業(yè)核心平臺(tái)),學(xué)會(huì)使用STM32單片機(jī),掌握嵌入式開發(fā)的“標(biāo)準(zhǔn)工具
    發(fā)表于 12-04 11:01

    嵌入式需要掌握哪些核心技能?

    嵌入式需要掌握哪些核心技能? 若想通過學(xué)習(xí)嵌入式技術(shù)提升就業(yè)競爭力,需重點(diǎn)掌握C語言、嵌入式硬件架構(gòu)、RTOS/Linux開發(fā)、通信協(xié)議四大核心技能,并結(jié)合行業(yè)需求積累項(xiàng)目經(jīng)驗(yàn)。
    發(fā)表于 10-21 16:25

    燒錄工具操作教程:新手也能快速掌握~

    燒錄工具看似復(fù)雜,其實(shí)操作很簡單!現(xiàn)在就為你奉上清晰明了的使用說明,即使是新手也能迅速掌握。 本文就以 Air780EPM 開發(fā)板為例,演示燒錄工具的使用步驟。 ? 一、生成量產(chǎn)文件 1.
    的頭像 發(fā)表于 09-26 19:20 ?968次閱讀
    燒錄<b class='flag-5'>工具</b>操作教程:新手也能快速<b class='flag-5'>掌握</b>~

    如何在機(jī)器視覺中部署深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)

    人士而言往往難以理解,人們也常常誤以為需要扎實(shí)的編程技能才能真正掌握并合理使用這項(xiàng)技術(shù)。事實(shí)上,這種印象忽視了該技術(shù)為機(jī)器視覺(乃至生產(chǎn)自動(dòng)化)帶來的潛力,因?yàn)樯疃?b class='flag-5'>學(xué)習(xí)并非只屬于計(jì)算機(jī)
    的頭像 發(fā)表于 09-10 17:38 ?919次閱讀
    如何在<b class='flag-5'>機(jī)器</b>視覺中部署深度<b class='flag-5'>學(xué)習(xí)</b>神經(jīng)網(wǎng)絡(luò)

    開發(fā)單片機(jī)需要學(xué)習(xí)什么?軟件編程的 4 個(gè)關(guān)鍵層次

    ? ? ? ? ? ? ? ? ? ? 開發(fā)單片機(jī)需要學(xué)習(xí)什么?軟件編程的 4 個(gè)關(guān)鍵層次 單片機(jī)的 “智能” 全靠軟件實(shí)現(xiàn),編程技能需從基礎(chǔ)語法逐步進(jìn)階到復(fù)雜邏輯,每個(gè)層次對應(yīng)不同的開發(fā)需求
    的頭像 發(fā)表于 08-25 11:32 ?885次閱讀

    NVIDIA展示機(jī)器人領(lǐng)域的研究成果

    在今年的機(jī)器人科學(xué)與系統(tǒng)會(huì)議 (RSS) 上,NVIDIA 研究中心展示了一系列推動(dòng)機(jī)器人學(xué)習(xí)研究成果,展示了在仿真、現(xiàn)實(shí)世界遷移和決策制定領(lǐng)域的突破。
    的頭像 發(fā)表于 07-23 10:43 ?1439次閱讀

    ARM入門學(xué)習(xí)方法分享

    的官方文檔,了解ARM架構(gòu)的細(xì)節(jié),并參考一些在線教程和博客來學(xué)習(xí)其他開發(fā)者的經(jīng)驗(yàn)和技巧。 總的來說,學(xué)習(xí)ARM需要一定的耐心和實(shí)踐。通過掌握基本概念、
    發(fā)表于 07-23 10:21

    通過NVIDIA Cosmos模型增強(qiáng)機(jī)器人學(xué)習(xí)

    通用機(jī)器人的時(shí)代已經(jīng)到來,這得益于機(jī)械電子技術(shù)和機(jī)器人 AI 基礎(chǔ)模型的進(jìn)步。但目前機(jī)器人技術(shù)的發(fā)展仍面臨一個(gè)關(guān)鍵挑戰(zhàn):機(jī)器
    的頭像 發(fā)表于 07-14 11:49 ?1109次閱讀
    通過NVIDIA Cosmos模型增強(qiáng)<b class='flag-5'>機(jī)器人學(xué)習(xí)</b>

    輪式移動(dòng)機(jī)器人電機(jī)驅(qū)動(dòng)系統(tǒng)的研究與開發(fā)

    【摘 要】以嵌入式運(yùn)動(dòng)控制體系為基礎(chǔ),以移動(dòng)機(jī)器人為研究對象,結(jié)合三輪結(jié)構(gòu)輪式移動(dòng)機(jī)器人,對二輪差速驅(qū)動(dòng)轉(zhuǎn)向自主移動(dòng)機(jī)器人運(yùn)動(dòng)學(xué)和動(dòng)力學(xué)空間模型進(jìn)行了分析和計(jì)算,
    發(fā)表于 06-11 14:30

    機(jī)器學(xué)習(xí)賦能的智能光子學(xué)器件系統(tǒng)研究與應(yīng)用

    騰訊會(huì)議---六月直播 1.機(jī)器學(xué)習(xí)賦能的智能光子學(xué)器件系統(tǒng)研究與應(yīng)用 2.COMSOL聲學(xué)多物理場仿真技術(shù)與應(yīng)用 3.超表面逆向設(shè)計(jì)及前沿應(yīng)用(從基礎(chǔ)入門到論文復(fù)現(xiàn)) 4.智能光學(xué)計(jì)算成像技術(shù)
    的頭像 發(fā)表于 06-04 17:59 ?650次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>賦能的智能光子學(xué)器件系統(tǒng)<b class='flag-5'>研究</b>與應(yīng)用

    【「零基礎(chǔ)開發(fā)AI Agent」閱讀體驗(yàn)】+ 入門篇學(xué)習(xí)

    ,展現(xiàn)出高度的個(gè)性化 7.AI Agent具備4大能力:規(guī)劃、記憶、使用工具、行動(dòng) 8.短期記憶主要用于處理當(dāng)前任務(wù)與上下文;長期記憶主要用于存儲(chǔ)更持久的信息。 9.開發(fā)AI Agent更需要業(yè)務(wù)和管理專家
    發(fā)表于 05-02 09:26

    **【技術(shù)干貨】Nordic nRF54系列芯片:傳感器數(shù)據(jù)采集與AI機(jī)器學(xué)習(xí)的完美結(jié)合**

    【技術(shù)干貨】nRF54系列芯片:傳感器數(shù)據(jù)采集與AI機(jī)器學(xué)習(xí)的完美結(jié)合 近期收到不少伙伴咨詢nRF54系列芯片的應(yīng)用與技術(shù)細(xì)節(jié),今天我們整理幾個(gè)核心問題與解答,帶你快速掌握如何在nRF54上部署AI
    發(fā)表于 04-01 00:00