91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用NVIDIA TAO工具包和Appen實現(xiàn)AI模型微調(diào)

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者: Titus Capilnean ? 2022-04-13 15:29 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

從頭開始構(gòu)建人工智能模型需要大量的數(shù)據(jù)、時間、金錢和專業(yè)知識。這與在人工智能領(lǐng)域取得成功的條件不符:快速上市,以及快速發(fā)展和定制解決方案的能力。 NVIDIA TAO 是一個人工智能模型調(diào)整框架,與從頭開始的培訓(xùn)相比,它可以讓您利用生產(chǎn)質(zhì)量、預(yù)培訓(xùn)的人工智能模型,并在很短的時間內(nèi)對其進(jìn)行微調(diào)。

要進(jìn)一步微調(diào)這些模型,或確認(rèn)模型的精度,需要額外的高質(zhì)量訓(xùn)練數(shù)據(jù)。 Appen 是 TAO 的數(shù)據(jù)注釋合作伙伴,如果您沒有合適的可用數(shù)據(jù),它可以訪問高質(zhì)量的數(shù)據(jù)集和服務(wù),為您的數(shù)據(jù)添加標(biāo)簽和注釋,以滿足您的獨特需求。

在帖子中,我將向你展示如何使用 NVIDIA TAO 工具包 一個基于 CLI 的NVIDIA TAO 框架的解決方案,以及 AppEN 的數(shù)據(jù)標(biāo)記平臺,以簡化整個培訓(xùn)過程,并為特定用例創(chuàng)建高度定制的模型。

在您的團隊確定了要使用 ML 解決的業(yè)務(wù)問題后,您可以從 NVIDIA 收集的計算機視覺和對話人工智能中的預(yù)訓(xùn)練人工智能模型中進(jìn)行選擇。計算機視覺模型可以包括人臉檢測模型、文本識別、分割等。然后,您可以應(yīng)用 TAO 工具包來構(gòu)建、培訓(xùn)、測試和部署您的解決方案。

為了加快數(shù)據(jù)收集和擴充過程,您現(xiàn)在可以使用 Appen 數(shù)據(jù)注釋平臺為您的用例創(chuàng)建正確的培訓(xùn)數(shù)據(jù)。該強大的平臺使您能夠訪問 Appen 全球超過 100 萬名熟練的注釋員,他們來自 170 多個國家,講 235 種語言。 Appen 的數(shù)據(jù)注釋平臺 和專業(yè)知識還為您提供了其他資源:

高質(zhì)量數(shù)據(jù)集(用于需要數(shù)據(jù)時)

全球采購的人工標(biāo)簽機,用于為未標(biāo)記的數(shù)據(jù)添加注釋

一個易于使用的平臺,您可以在其中啟動注釋作業(yè)并監(jiān)控關(guān)鍵指標(biāo)

質(zhì)量保證檢查和數(shù)據(jù)安全控制

有了干凈、高質(zhì)量的數(shù)據(jù),您可以調(diào)整 經(jīng)過訓(xùn)練的 NVIDIA 模型以滿足您的需求,并進(jìn)行修剪和再培訓(xùn),以達(dá)到所需的性能水平。

如何使用 Appen 的平臺準(zhǔn)備數(shù)據(jù)

如果您還沒有用于訓(xùn)練模型的數(shù)據(jù),您可以自己收集這些數(shù)據(jù),也可以求助于 Appen ,找到適合您的用例的源數(shù)據(jù)集。 Appen 數(shù)據(jù)注釋平臺( ADAP )可使用多種格式:

音頻(. wav ,. mp3 )

圖像(. jpeg ,. png )

文本(. txt )

視頻(網(wǎng)址)

完成數(shù)據(jù)收集階段后,除非您計劃與 Appen 合作以滿足數(shù)據(jù)收集需求,否則您可以使用 Appen 的平臺快速標(biāo)記您收集的數(shù)據(jù)。每行數(shù)據(jù)批注都需要 Appen 平臺許可證和預(yù)算。

在此基礎(chǔ)上,完成以下步驟,部署一個特別適合您需求的模型。在本文中,假設(shè)您正在為對象檢測模型注釋圖像。

準(zhǔn)備好你的數(shù)據(jù)

首先,將圖像數(shù)據(jù)加載到網(wǎng)絡(luò)可訪問的位置:云或 ADAP 可以訪問的位置,例如私有 Amazon S3 存儲桶。

接下來,用兩列結(jié)構(gòu)輸入 CSV 文件。第一列包含文件名,第二列包含圖像的 URL 。您可以通過以下三種方式之一提供 URL :

對數(shù)據(jù)使用公開可用的 URL 。

使用預(yù)先簽名的 URL 。

使用 Appen 的安全數(shù)據(jù)訪問工具,您可以使用該工具將數(shù)據(jù)庫安全地連接到平臺; Appen 僅在需要時訪問您的數(shù)據(jù)。

第二列包含設(shè)備上的本地文件名。圖 1 顯示了 CSV 文件的外觀。

poYBAGJWfAaAbdYuAAHdcm4AAOo145.png

圖 1 。用于 ADAP 中數(shù)據(jù)上傳的 CSV 結(jié)構(gòu)

創(chuàng)建作業(yè)并上載數(shù)據(jù)

如果尚未登錄,可以 創(chuàng)建 ADAP 帳戶 并登錄。在運行新作業(yè)之前,您必須擁有平臺的活動許可證。要了解更多有關(guān)計劃和定價的信息, 聯(lián)系 Appen 。

登錄后,在Jobs下選擇創(chuàng)造就業(yè)機會。

pYYBAGJWfA-ASf2PAACQvL2OgrU139.png

圖 2 。 ADAP 工作概述頁面

選擇最適合工作的模板(情緒分析、搜索相關(guān)性等)。對于本例,請選擇Image Annotation。

poYBAGJWfBqAApn5AAF4dwi-KDc050.png

圖 3 。 ADAP 作業(yè)模板頁面–圖像注釋

在Image Annotation下,選擇使用邊界框?qū)D像中的對象進(jìn)行注釋和分類。將 CSV 文件拖放到Upload選項卡中,上傳 CSV 文件。

設(shè)計你的工作

為 Appen 的 100 多萬名數(shù)據(jù)標(biāo)簽員提供指導(dǎo),說明他們應(yīng)該尋找什么,以及他們應(yīng)該知道的任何要求。該模板提供了一個簡單的工作設(shè)計來幫助您開始。

接下來,選擇管理圖像注釋本體,在這里定義應(yīng)該檢測的類。更新說明,以提供有關(guān)用例的更多上下文,并描述注釋者應(yīng)如何識別和標(biāo)記圖像中的對象。您可以預(yù)覽作業(yè),并查看注釋員將如何查看它。

最后,創(chuàng)建測試問題來測量和跟蹤貼標(biāo)機的性能。

啟動作業(yè)

在平臺上正式啟動注釋作業(yè)之前,先進(jìn)行測試運行。在你開始工作后, Appen 的全球數(shù)據(jù)標(biāo)簽員會根據(jù)你的規(guī)格標(biāo)注你的數(shù)據(jù)。

班長

實時監(jiān)控注釋的準(zhǔn)確率。在工作設(shè)計、試題或注釋員等領(lǐng)域根據(jù)需要進(jìn)行調(diào)整。

poYBAGJWfCeAfYZVAADzSgJf5hM807.png


pYYBAGJWfECAanZNAADsYgStpvw629.png

圖 8 。 ADAP 注釋進(jìn)度監(jiān)控頁面

后果

選擇Download、Full下載標(biāo)簽數(shù)據(jù)輸出的報告。

將輸出轉(zhuǎn)換為 KITTI 格式

從這里開始,您需要一個腳本來將標(biāo)記的數(shù)據(jù)轉(zhuǎn)換為可供 TAO 工具包使用的格式,例如 KITTI 格式。

使用上一步的輸出,可以使用以下部分將標(biāo)記的數(shù)據(jù)轉(zhuǎn)換為類似 Pascal Visual Object Class ( VOC )格式的格式。

訓(xùn)練你的模特

用 Appen 注釋的數(shù)據(jù)現(xiàn)在可以用于訓(xùn)練對象檢測模型。 TAO 工具包允許您根據(jù)數(shù)據(jù)調(diào)整流行的網(wǎng)絡(luò)架構(gòu)和主干,從而訓(xùn)練、微調(diào)、刪減和導(dǎo)出高度優(yōu)化和精確的人工智能模型,以供部署。對于本例,您可以選擇 YOLOV3 對象檢測模型,如下例所示:

$ wget --content-disposition https://api.ngc.nvidia.com/v2/resources/nvidia/tlt_cv_samples/versions/v1.0.2/zip -O tlt_cv_samples_v1.0.2.zip $ unzip -u tlt_cv_samples_v1.0.2.zip -d ./tlt_cv_samples_v1.0.2 && rm -rf tlt_cv_samples_v1.0.2.zip && cd ./tlt_cv_samples_v1.0.2

下載筆記本示例后,您可以使用以下命令啟動筆記本:

$ jupyter notebook --ip 0.0.0.0 --port 8888 --allow-root

在 localhost 上打開 internet 瀏覽器并打開以下 URL :

http://0.0.0.0:8888

因為您正在創(chuàng)建一個 YOLOv3 模型,所以打開 yolo _ v3 / yolo _ v3 。 ipynb 筆記本。按照筆記本上的說明訓(xùn)練模型。

根據(jù)結(jié)果,微調(diào)模型,直到達(dá)到度量目標(biāo)。如果需要,您可以在此階段創(chuàng)建自己的主動學(xué)習(xí)循環(huán)。根據(jù)置信度或其他選擇指標(biāo),使用 CSV 文件方法對數(shù)據(jù)進(jìn)行優(yōu)先級排序,如前面步驟所述。您還可以提前加載數(shù)據(jù)(包括輸入和預(yù)測),這樣 Appen 的注釋員可以在模型經(jīng)過培訓(xùn)后驗證模型,并使用我們的領(lǐng)域?qū)<液?open crowd 查看預(yù)測。

Pro tip:使用 Appen 解決方案 Workflows 輕松構(gòu)建和自動化多步驟數(shù)據(jù)注釋項目。

迭代

隨著您不斷提高模型性能, Appen 可以在后續(xù)的模型培訓(xùn)中進(jìn)一步幫助您進(jìn)行數(shù)據(jù)收集和注釋。為了避免模型漂移或適應(yīng)不斷變化的業(yè)務(wù)需求,請定期對模型進(jìn)行再培訓(xùn)。

結(jié)論

NVIDIATAO 工具包與 Appen 的數(shù)據(jù)平臺相結(jié)合,使您能夠訓(xùn)練、微調(diào)和優(yōu)化預(yù)訓(xùn)練模型,以更快地啟動人工智能解決方案。在不犧牲質(zhì)量的情況下,將開發(fā)時間縮短十倍。在NVIDIA 和 Appen 的綜合專業(yè)知識和工具的幫助下,您將滿懷信心地推出人工智能。

關(guān)于作者

Titus Capilnean 領(lǐng)導(dǎo) Appen 的營銷傳播,推動負(fù)責(zé)任、包容的人工智能,并與全球公司進(jìn)行培訓(xùn)數(shù)據(jù)對話。他擁有 2016 年的機器學(xué)習(xí)證書、霍爾特國際商學(xué)院( Hult International Business School )的行政 MBA 學(xué)位,并在 Forbes 上發(fā)表了幾篇關(guān)于人工智能的評論文章。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5594

    瀏覽量

    109731
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50098

    瀏覽量

    265361
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    NVIDIA推出代理式AI藍(lán)圖與電信推理模型

    借助全新開源大型電信模型NVIDIA Blueprint,電信運營商能夠利用自有數(shù)據(jù)訓(xùn)練 AI 智能體,構(gòu)建自主網(wǎng)絡(luò)。
    的頭像 發(fā)表于 03-06 17:37 ?525次閱讀

    NVIDIA在CES 2026發(fā)布全新開放模型、數(shù)據(jù)和工具

    為擴展開放模型生態(tài),NVIDIA 發(fā)布全新開放模型、數(shù)據(jù)和工具,推動各行業(yè) AI 技術(shù)的發(fā)展。
    的頭像 發(fā)表于 01-09 10:42 ?541次閱讀

    NVIDIA 推出 Alpamayo 系列開源 AI 模型工具,加速安全可靠的推理型輔助駕駛汽車開發(fā)

    的仿真工具和數(shù)據(jù)集。 l Alpamayo 1、AlpaSim 和物理 AI 開放數(shù)據(jù)集可為開發(fā)具備感知、推理與類人決策能力的車輛提供支持,使開發(fā)者能夠進(jìn)行模型調(diào)優(yōu)、蒸餾和測試,從而提升安全性、魯棒性
    的頭像 發(fā)表于 01-06 09:40 ?381次閱讀
    <b class='flag-5'>NVIDIA</b> 推出 Alpamayo 系列開源 <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>與<b class='flag-5'>工具</b>,加速安全可靠的推理型輔助駕駛汽車開發(fā)

    NVIDIA攜手Mistral AI發(fā)布全新開源大語言模型系列

    全新 Mistral 3 系列涵蓋從前沿級到緊湊型模型,針對 NVIDIA 平臺進(jìn)行了優(yōu)化,助力 Mistral AI 實現(xiàn)云到邊緣分布式智能愿景。
    的頭像 發(fā)表于 12-13 09:58 ?1242次閱讀

    NVIDIA推動面向數(shù)字與物理AI的開源模型發(fā)展

    NVIDIA 發(fā)布一系列涵蓋語音、安全與輔助駕駛領(lǐng)域的全新 AI 工具,其中包括面向移動出行領(lǐng)域的行業(yè)級開源視覺-語言-動作推理模型(Reasoning VLA)
    的頭像 發(fā)表于 12-13 09:50 ?1332次閱讀

    利用NVIDIA Cosmos開放世界基礎(chǔ)模型加速物理AI開發(fā)

    NVIDIA 最近發(fā)布了 NVIDIA Cosmos 開放世界基礎(chǔ)模型(WFM)的更新,旨在加速物理 AI 模型的測試與驗證數(shù)據(jù)生成。借助
    的頭像 發(fā)表于 12-01 09:25 ?1135次閱讀

    NVIDIA開源Audio2Face模型及SDK

    NVIDIA 現(xiàn)已開源 Audio2Face 模型與 SDK,讓所有游戲和 3D 應(yīng)用開發(fā)者都可以構(gòu)建并部署帶有先進(jìn)動畫的高精度角色。NVIDIA 開源 Audio2Face 的訓(xùn)練框架,任何人都可以針對特定用例對現(xiàn)有
    的頭像 發(fā)表于 10-21 11:11 ?825次閱讀
    <b class='flag-5'>NVIDIA</b>開源Audio2Face<b class='flag-5'>模型</b>及SDK

    MediaTek攜手NVIDIA開啟個人AI算力新紀(jì)元

    Spark 助力開發(fā)者能在本地端對大型 AI 模型進(jìn)行原型設(shè)計(Prototype)、微調(diào)(Fine-tune)和推理(Inference)。NVIDIA DGX Spark 將于
    的頭像 發(fā)表于 10-16 11:26 ?766次閱讀

    什么是AI模型的推理能力

    NVIDIA 的數(shù)據(jù)工廠團隊為 NVIDIA Cosmos Reason 等 AI 模型奠定了基礎(chǔ),該模型近日在 Hugging Face
    的頭像 發(fā)表于 09-23 15:19 ?1273次閱讀

    NVIDIA從云到邊緣加速OpenAI gpt-oss模型部署,實現(xiàn)150萬TPS推理

    的發(fā)布持續(xù)深化了雙方的 AI 創(chuàng)新合作。NVIDIANVIDIA Blackwell 架構(gòu)上優(yōu)化了這兩款全新的開放權(quán)重模型實現(xiàn)了推理
    的頭像 發(fā)表于 08-15 20:34 ?2303次閱讀
    <b class='flag-5'>NVIDIA</b>從云到邊緣加速OpenAI gpt-oss<b class='flag-5'>模型</b>部署,<b class='flag-5'>實現(xiàn)</b>150萬TPS推理

    在阿里云PAI上快速部署NVIDIA Cosmos Reason-1模型

    NVIDIA 近期發(fā)布了 Cosmos Reason-1 的 7B 和 56B 兩款多模態(tài)大語言模型 (MLLM),它們經(jīng)過了“物理 AI 監(jiān)督微調(diào)”和“物理
    的頭像 發(fā)表于 06-04 13:43 ?966次閱讀

    Deepseek海思SD3403邊緣計算AI產(chǎn)品系統(tǒng)

    海思SD3403邊緣計算AI框架,提供了一套開放式AI訓(xùn)練產(chǎn)品工具包,解決客戶低成本AI系統(tǒng),針對差異化AI 應(yīng)用場景,自己采集樣本數(shù)據(jù),進(jìn)
    發(fā)表于 04-28 11:05

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    的自有模型移植,使首字詞生態(tài)速度比云端方案提升70%,賦能絕影多模態(tài)智能座艙強大的端側(cè)運行能力,讓汽車擁有“有趣的靈魂”。 不僅如此,天璣AI開發(fā)套件已經(jīng)接入NVIDIA TAO生態(tài)
    發(fā)表于 04-13 19:52

    英偉達(dá)GTC2025亮點 NVIDIA推出Cosmos世界基礎(chǔ)模型和物理AI數(shù)據(jù)工具的重大更新

    模型實現(xiàn)物理 AI 的預(yù)測、可控世界生成和推理。 兩款全新Blueprint為機器人和自動駕駛汽車后訓(xùn)練提供海量物理 AI 合成數(shù)據(jù)生成技術(shù)。 1X、Agility Robotic
    的頭像 發(fā)表于 03-20 19:01 ?1339次閱讀

    NVIDIA 宣布推出 DGX Spark 個人 AI 計算機

    的 DGX? 個人 AI 超級計算機。 ? DGX Spark(前身為 Project DIGITS)支持 AI 開發(fā)者、研究人員、數(shù)據(jù)科學(xué)家和學(xué)生,在臺式電腦上對大模型進(jìn)行原型設(shè)計、微調(diào)
    發(fā)表于 03-19 09:59 ?781次閱讀
       <b class='flag-5'>NVIDIA</b> 宣布推出 DGX Spark 個人 <b class='flag-5'>AI</b> 計算機