91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Facebook全新開(kāi)源深度學(xué)習(xí)框架Pythia,即插即用快速構(gòu)建AI模型

DPVg_AI_era ? 來(lái)源:lq ? 2019-05-25 09:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Facebook的人工智能研究部門(mén)近期推出Pythia,一個(gè)模塊化的即插即用框架。目標(biāo)是使數(shù)據(jù)科學(xué)家能夠快速構(gòu)建、復(fù)制和基準(zhǔn)人工智能模型,將VQA v2.0數(shù)據(jù)集模型的性能從65.67%提高到70.22%,已在Github上開(kāi)源。

Facebook最近在開(kāi)發(fā)者社區(qū)拋出了一系列工具。繼一月份image processing library Spectrum、去年底的自然語(yǔ)言處理建??蚣躊yText和11月的人工智能增強(qiáng)學(xué)習(xí)平臺(tái)Horizon的開(kāi)源后,F(xiàn)acebook的人工智能研究部門(mén)又推出了Pythia,一個(gè)模塊化的即插即用框架。

Pythia的目標(biāo)是使數(shù)據(jù)科學(xué)家能夠快速構(gòu)建、復(fù)制和基準(zhǔn)人工智能模型,已在Github上開(kāi)源。

而Pythia(中文一般譯作皮媞亞)這個(gè)名字的來(lái)歷也很有意思。古希臘神話中,Pythia是阿波羅神的女祭司,服務(wù)于帕納塞斯山上的德?tīng)栰常―elphi)神廟,以傳達(dá)阿波羅神的神諭而聞名,被認(rèn)為能預(yù)知未來(lái)。

即插即用Pythia:讓數(shù)據(jù)科學(xué)家快速構(gòu)建、復(fù)制和基準(zhǔn)AI模型

Pythia是什么?

Pythia是一個(gè)深度學(xué)習(xí)框架,支持視覺(jué)和語(yǔ)言領(lǐng)域的多任務(wù)處理。基于PyTorch 框架,模塊化即插即用的設(shè)計(jì)使研究人員能夠快速構(gòu)建、復(fù)制和基準(zhǔn)化人工智能模型。

Pythia是為視覺(jué)和語(yǔ)言任務(wù)而設(shè)計(jì)的,例如回答與視覺(jué)數(shù)據(jù)相關(guān)的問(wèn)題和自動(dòng)生成圖像注釋。

Pythia能做什么?

Pythia加入了最近的人工智能競(jìng)賽(2018年VQA挑戰(zhàn)賽和2018年Vizwiz挑戰(zhàn)賽)中獲獎(jiǎng)作品的元素。功能包括用參考實(shí)現(xiàn)(reference implementations)來(lái)顯示以前最先進(jìn)的模型如何實(shí)現(xiàn)相關(guān)的基準(zhǔn)結(jié)果,并快速衡量新模型的性能。

除了多任務(wù)處理之外,Pythia還支持分布式培訓(xùn)和各種數(shù)據(jù)集,以及自定義損失、度量、調(diào)度(scheduling)和優(yōu)化器。

Pythia的特性

Model Zoo:藝術(shù)級(jí)的視覺(jué)和語(yǔ)言模型的參考實(shí)現(xiàn),包括LoRRA(VQA和TextVQA上的SoTA)、Pythia模型(VQA 2018 挑戰(zhàn)賽獲勝者)和Ban。

多任務(wù)處理:支持多任務(wù)處理,允許對(duì)多個(gè)數(shù)據(jù)集進(jìn)行訓(xùn)練。

數(shù)據(jù)集:包括對(duì)各種內(nèi)置數(shù)據(jù)集的支持,包括VQA, VizWiz, TextVQA and和VisualDialog。

模塊:為視覺(jué)和語(yǔ)言領(lǐng)域中的許多常用層提供實(shí)現(xiàn)

分布式:支持基于數(shù)據(jù)并行和分布式數(shù)據(jù)并行的分布式訓(xùn)練。

Unopinionated:關(guān)于基于它的數(shù)據(jù)集和模型實(shí)現(xiàn)是Unopinionated。

定制:定制損失、度量、調(diào)度、優(yōu)化器、Tensorboard;適合用戶(hù)所有的定制需求。

用戶(hù)可以使用Pythia為自己下一個(gè)視覺(jué)和語(yǔ)言多模式研究項(xiàng)目進(jìn)行引導(dǎo)。Pythia還可以作為圍繞視覺(jué)和語(yǔ)言數(shù)據(jù)集的挑戰(zhàn)的起始代碼庫(kù)(參見(jiàn)TextVQA挑戰(zhàn)賽和VQA挑戰(zhàn)賽)。

Pythia最厲害的地方是什么?

Pythia簡(jiǎn)化了進(jìn)入視覺(jué)和語(yǔ)言發(fā)展子領(lǐng)域的過(guò)程,使研究人員能夠?qū)W⒂诟斓脑椭谱骱蛯?shí)驗(yàn)。Facebook的目標(biāo)是通過(guò)增加這些模型和結(jié)果的再現(xiàn)性來(lái)加速進(jìn)展。這將使社區(qū)更容易建立成功系統(tǒng)的基礎(chǔ)和基準(zhǔn)。

開(kāi)發(fā)者還希望通過(guò)Pythia消除障礙,能夠使研究人員更快地為人們和智能機(jī)器開(kāi)發(fā)新的交流方式。這項(xiàng)工作還應(yīng)該幫助研究人員開(kāi)發(fā)自適應(yīng)人工智能,將多種理解合成一種更基于上下文的多模式理解。除了這個(gè)開(kāi)源版本,F(xiàn)acebook計(jì)劃繼續(xù)添加工具、任務(wù)、數(shù)據(jù)集和引用模型。

在上面提到的VQA 2018比賽中,Pythia v0.1出發(fā)點(diǎn)是自下而上、自上而下模型的模塊化重新實(shí)現(xiàn),最終力壓群雄而勝出。

Pythia v0.1證明,通過(guò)對(duì)模型體系結(jié)構(gòu)和學(xué)習(xí)速率計(jì)劃進(jìn)行細(xì)微但重要的更改、微調(diào)圖像功能和添加數(shù)據(jù)擴(kuò)充,可以顯著提高VQA v2.0數(shù)據(jù)集自上而下模型的性能,從65.67%提高到70.22%。

此外,通過(guò)使用不同特征和不同數(shù)據(jù)集訓(xùn)練的不同模型集合,Pythia v0.1能夠顯著提高1.31%的“標(biāo)準(zhǔn)”集合方式(即具有不同隨機(jī)種子的相同模型)??偟膩?lái)說(shuō),Pythia v0.1在VQA v2.0數(shù)據(jù)集的測(cè)試標(biāo)準(zhǔn)分割上達(dá)到了72.27%。

術(shù)語(yǔ)和概念

Pythia經(jīng)過(guò)精心設(shè)計(jì),從一開(kāi)始就是一個(gè)多任務(wù)框架。這意味著使用Pythia,可以一起訓(xùn)練多個(gè)任務(wù)和數(shù)據(jù)集。

但是,Pythia在其模塊中抽象了許多概念,在Pythia之上進(jìn)行開(kāi)發(fā),有必要理解Pythia代碼庫(kù)中使用的概念和術(shù)語(yǔ)。一旦開(kāi)發(fā)人員理解了這些簡(jiǎn)單的概念,就很容易在Pythia之上進(jìn)行開(kāi)發(fā)。其中主要概念和術(shù)語(yǔ)如下:

任務(wù)和數(shù)據(jù)集

在Pythia中,數(shù)據(jù)集被劃分為一組任務(wù)。因此,任務(wù)對(duì)應(yīng)屬于它的數(shù)據(jù)集的集合。例如,VQA 2.0,VizWiz和TextVQA都屬于VQA任務(wù)。 已為每個(gè)任務(wù)和數(shù)據(jù)集分配了一個(gè)唯一key,用于在命令行參數(shù)中引用。

下表顯示了任務(wù)及其數(shù)據(jù)集:

下表顯示了上表的反轉(zhuǎn),數(shù)據(jù)集及其任務(wù)和key:

模型

已經(jīng)包括了最先進(jìn)模型的參考實(shí)施,作為研究論文復(fù)制和新研究起點(diǎn)的基礎(chǔ)。Pythia曾被用于以下論文:

走向可以閱讀的VQA模型(LoRRA模型)

VQA 2018挑戰(zhàn)賽冠軍

VizWiz 2018挑戰(zhàn)賽冠軍

與任務(wù)和數(shù)據(jù)集類(lèi)似,每個(gè)模型都使用唯一key進(jìn)行注冊(cè),以便在配置和命令行參數(shù)中輕松引用。下表顯示了可以運(yùn)行的每個(gè)模型的關(guān)鍵名稱(chēng)和數(shù)據(jù)集。

注冊(cè)表

受到Redux全球商店的啟發(fā),Pythia生態(tài)系統(tǒng)所需的有用信息已在注冊(cè)表中注冊(cè)??梢詫⒆?cè)表視為框架的多個(gè)部分所需的信息的通用存儲(chǔ),并在需要該信息的任何地方起作用信息源。

注冊(cè)表還基于如上所述的唯一密鑰來(lái)注冊(cè)模型、任務(wù)、數(shù)據(jù)集等。 注冊(cè)表的函數(shù)可以用作需要注冊(cè)的類(lèi)的裝飾器(例如模型等)

導(dǎo)入注冊(cè)表對(duì)象導(dǎo)入:

from pythia.common.registry import registry

配置

根據(jù)研究需要,Pythia中的大多數(shù)參數(shù)/設(shè)置都是可配置的。 Pythia特定的默認(rèn)值(training_parameters)存在于:

pythia/common/defaults/configs/base.yml

其中詳細(xì)的注釋描述了每個(gè)參數(shù)的用法。為了便于使用和模塊化,每個(gè)數(shù)據(jù)集的配置分別保存在:

pythia/common/defaults/configs/tasks/[task]/[dataset].yml

可以從Tasks中的表中獲取數(shù)據(jù)集的[task]值和數(shù)據(jù)集部分。模型配置也是分開(kāi)的,并且是用戶(hù)在創(chuàng)建自己的模型時(shí)需要定義的部分。

由于每個(gè)數(shù)據(jù)集的單獨(dú)配置,這個(gè)概念可以擴(kuò)展到執(zhí)行多任務(wù)并在此包含多個(gè)數(shù)據(jù)集配置。

處理器

處理器的主要目的是使數(shù)據(jù)處理流程盡可能與不同數(shù)據(jù)集相似,并允許代碼重用。

處理器接受帶有與所需數(shù)據(jù)相對(duì)應(yīng)key的字典,并返回帶有處理數(shù)據(jù)的字典。這有助于通過(guò)修復(fù)所需的簽名來(lái)使處理器獨(dú)立于邏輯的其余部分。

處理器用于所有數(shù)據(jù)集以切換數(shù)據(jù)處理需求。在處理器文檔中了解有關(guān)處理器的更多信息。

SampleList

SampleList受到了maskrcnn-benchmark中BBoxList的啟發(fā),但更為通用。與Pythia集成的所有數(shù)據(jù)集都需要返回一個(gè)Sample,該Sample將被整理到SampleList中。

現(xiàn)在,SampleList帶有許多方便的功能,可以輕松地批量處理和訪問(wèn)事物。對(duì)于例如樣本是帶有一些key的字典。在SampleList中,這些key的值將根據(jù)它是張量還是列表而被巧妙地分組,并分配回該字典。

因此,終端用戶(hù)可以很好地將這些key組合在一起,并可以在他們的模型中使用它們。與Pythia集成的模型接收SampleList作為參數(shù),這再次使trainer對(duì)模型和數(shù)據(jù)集不再有任何影響。在其文檔中了解有關(guān)Sample和SampleList的更多信息。

預(yù)訓(xùn)練模型

在Pythia中使用預(yù)訓(xùn)練模型進(jìn)行推理很容易。從下表中選取一個(gè)預(yù)訓(xùn)練模型,并按照步驟進(jìn)行推理或生成預(yù)測(cè)讓EvalAI評(píng)估。(注意,這部分內(nèi)容需要先安裝教程中介紹的數(shù)據(jù),教程鏈接在文末)

現(xiàn)在,假設(shè)你到預(yù)培訓(xùn)模型model是link(從table中選擇>右鍵單擊>復(fù)制鏈接地址),相應(yīng)的配置應(yīng)該位于configs/[task]/[dataset]/[model].yml。例如,vqa2 train_and_val的配置文件應(yīng)該是configs/vqa/vqa2/pythia_train_and_val.yml?,F(xiàn)在要運(yùn)行EvalAI的推斷,請(qǐng)運(yùn)行以下命令:

如果要在val上進(jìn)行培訓(xùn)或評(píng)估,請(qǐng)相應(yīng)地將run_type改為train或val。你還可以使用多個(gè)運(yùn)行類(lèi)型,例如進(jìn)行訓(xùn)練、對(duì)val進(jìn)行推斷、還可以將--run_type設(shè)置為train+val+inference進(jìn)行推斷。

如果刪除--evalai_inference論證,Pythia 將執(zhí)行推斷并直接在數(shù)據(jù)集上提供結(jié)果。請(qǐng)注意,對(duì)于測(cè)試集,這是不能用的,因?yàn)槲覀儧](méi)有它們的答案/目標(biāo)。因此,這對(duì)于在本地執(zhí)行 val集的推理很有用。

如果刪除--evalai_inference論證,Pythia 將執(zhí)行推斷并直接在數(shù)據(jù)集上提供結(jié)果。請(qǐng)注意,對(duì)于測(cè)試集,這是不能用的,因?yàn)槲覀儧](méi)有它們的答案/目標(biāo)。因此,這對(duì)于在本地執(zhí)行 val集的推理很有用。

下表顯示了各種預(yù)培訓(xùn)模型的評(píng)估指標(biāo):

Demo演示

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Facebook
    +關(guān)注

    關(guān)注

    3

    文章

    1432

    瀏覽量

    59002
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5599

    瀏覽量

    124456
  • pytorch
    +關(guān)注

    關(guān)注

    2

    文章

    813

    瀏覽量

    14871

原文標(biāo)題:Facebook全新開(kāi)源深度學(xué)習(xí)框架Pythia,即插即用快速構(gòu)建AI模型

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA推出代理式AI藍(lán)圖與電信推理模型

    借助全新開(kāi)源大型電信模型與 NVIDIA Blueprint,電信運(yùn)營(yíng)商能夠利用自有數(shù)據(jù)訓(xùn)練 AI 智能體,構(gòu)建自主網(wǎng)絡(luò)。
    的頭像 發(fā)表于 03-06 17:37 ?2876次閱讀

    華為昇騰深度適配智譜AI全新開(kāi)源模型GLM-5

    2026年2月12日,智譜AI發(fā)布Agentic Engineering時(shí)代最好的開(kāi)源模型GLM-5,從“寫(xiě)代碼”到“寫(xiě)工程”的能力進(jìn)一步演進(jìn)。在Coding與Agent能力上取得開(kāi)源
    的頭像 發(fā)表于 02-25 14:41 ?909次閱讀
    華為昇騰<b class='flag-5'>深度</b>適配智譜<b class='flag-5'>AI</b><b class='flag-5'>全新開(kāi)源</b><b class='flag-5'>模型</b>GLM-5

    月之暗面全新開(kāi)源旗艦模型Kimi K2.5上線模力方舟

    模力方舟平臺(tái)現(xiàn)已上線來(lái)自月之暗面(Moonshot AI)發(fā)布的全新開(kāi)源旗艦模型Kimi K2.5。
    的頭像 發(fā)表于 01-29 10:20 ?950次閱讀
    月之暗面<b class='flag-5'>全新開(kāi)源</b>旗艦<b class='flag-5'>模型</b>Kimi K2.5上線模力方舟

    NVIDIA在CES 2026發(fā)布全新開(kāi)模型、數(shù)據(jù)和工具

    為擴(kuò)展開(kāi)放模型生態(tài),NVIDIA 發(fā)布全新開(kāi)模型、數(shù)據(jù)和工具,推動(dòng)各行業(yè) AI 技術(shù)的發(fā)展。
    的頭像 發(fā)表于 01-09 10:42 ?587次閱讀

    NVIDIA攜手Mistral AI發(fā)布全新開(kāi)源大語(yǔ)言模型系列

    全新 Mistral 3 系列涵蓋從前沿級(jí)到緊湊型模型,針對(duì) NVIDIA 平臺(tái)進(jìn)行了優(yōu)化,助力 Mistral AI 實(shí)現(xiàn)云到邊緣分布式智能愿景。
    的頭像 發(fā)表于 12-13 09:58 ?1281次閱讀

    NVIDIA推出面向語(yǔ)言、機(jī)器人和生物學(xué)的全新開(kāi)源AI技術(shù)

    NVIDIA 秉持對(duì)開(kāi)源的長(zhǎng)期承諾,推出了面向語(yǔ)言、機(jī)器人和生物學(xué)的全新開(kāi)源 AI 技術(shù),為構(gòu)建開(kāi)源生態(tài)系統(tǒng)做出貢獻(xiàn),擴(kuò)展
    的頭像 發(fā)表于 11-06 11:49 ?1109次閱讀

    NVIDIA 利用全新開(kāi)源模型與仿真庫(kù)加速機(jī)器人研發(fā)進(jìn)程

    科研人員及開(kāi)發(fā)者打造功能更強(qiáng)大、適應(yīng)性更強(qiáng)的機(jī)器人。 ? 全新的 NVIDIA Isaac GR00T 開(kāi)源基礎(chǔ)模型將為機(jī)器人賦予接近人類(lèi)的推理能力,使其能夠拆解復(fù)雜指令,并借助已有知識(shí)與常識(shí)執(zhí)行任務(wù)
    的頭像 發(fā)表于 09-30 09:52 ?3092次閱讀
    NVIDIA 利用<b class='flag-5'>全新開(kāi)源</b><b class='flag-5'>模型</b>與仿真庫(kù)加速機(jī)器人研發(fā)進(jìn)程

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+第二章 實(shí)現(xiàn)深度學(xué)習(xí)AI芯片的創(chuàng)新方法與架構(gòu)

    、Transformer 模型的后繼者 二、用創(chuàng)新方法實(shí)現(xiàn)深度學(xué)習(xí)AI芯片 1、基于開(kāi)源RISC-V的A
    發(fā)表于 09-12 17:30

    澎峰科技完成OpenAI最新開(kāi)源推理模型適配

    澎峰科技現(xiàn)已完成 OpenAI 最新開(kāi)源推理模型 gpt-oss-20b 在 DeepFusion 大模型一體機(jī)上的原生適配與優(yōu)化,用戶(hù)可一鍵啟用這顆“小而強(qiáng)悍”的新引擎,在本地享受企業(yè)級(jí) A
    的頭像 發(fā)表于 08-14 11:34 ?1434次閱讀

    Arm率先適配騰訊混元開(kāi)源模型,助力端側(cè)AI創(chuàng)新開(kāi)發(fā)

    共同賦能端側(cè)人工智能 (AI) 部署,助力本土開(kāi)發(fā)者實(shí)現(xiàn) AI 應(yīng)用創(chuàng)新! 這次的首日開(kāi)源適配是雙方再次攜手提升端側(cè)應(yīng)用功能和用戶(hù)體驗(yàn)的又一例證。去年,Arm 將 Arm KleidiAI 技術(shù)與騰訊混元自研的 Angel 機(jī)器
    的頭像 發(fā)表于 08-08 09:16 ?1422次閱讀
    Arm率先適配騰訊混元<b class='flag-5'>開(kāi)源</b><b class='flag-5'>模型</b>,助力端側(cè)<b class='flag-5'>AI</b>創(chuàng)<b class='flag-5'>新開(kāi)</b>發(fā)

    任正非說(shuō) AI已經(jīng)確定是第四次工業(yè)革命 那么如何從容地加入進(jìn)來(lái)呢?

    GitHub等平臺(tái)上尋找感興趣的AI開(kāi)源項(xiàng)目。例如,可以參與一些小型的深度學(xué)習(xí)框架改進(jìn)項(xiàng)目,或者數(shù)據(jù)標(biāo)注工具的開(kāi)發(fā)項(xiàng)目。通過(guò)參與這些項(xiàng)目,可
    發(fā)表于 07-08 17:44

    寧暢與與百度文心大模型展開(kāi)深度技術(shù)合作

    近日,百度正式開(kāi)源文心大模型4.5系列模型。作為文心開(kāi)源合作伙伴,寧暢在模型開(kāi)源首日即實(shí)現(xiàn)即刻部
    的頭像 發(fā)表于 07-07 16:26 ?896次閱讀

    最新人工智能硬件培訓(xùn)AI基礎(chǔ)入門(mén)學(xué)習(xí)課程參考2025版(離線AI語(yǔ)音視覺(jué)識(shí)別篇)

    視覺(jué)開(kāi)發(fā)板開(kāi)箱即用的離線AI能力,分類(lèi)列出學(xué)習(xí)課程知識(shí)點(diǎn)和實(shí)操參考,希望能夠幫助大家快速掌握離線 AI 智能硬件的基礎(chǔ)知識(shí)與實(shí)戰(zhàn)技能,同時(shí)了
    發(fā)表于 07-04 11:14

    模型時(shí)代的深度學(xué)習(xí)框架

    量是約為 25.63M,在ImageNet1K數(shù)據(jù)集上,使用單張消費(fèi)類(lèi)顯卡 RTX-4090只需大約35~40個(gè)小時(shí) ,即可完成ResNet50模型的預(yù)訓(xùn)練。在 大模型時(shí)代 ,由于大模型參數(shù)規(guī)模龐大,無(wú)法跟CNN時(shí)代的小
    的頭像 發(fā)表于 04-25 11:43 ?865次閱讀
    大<b class='flag-5'>模型</b>時(shí)代的<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>框架</b>

    首創(chuàng)開(kāi)源架構(gòu),天璣AI開(kāi)發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    科正將AI能力體系化并賦能終端生態(tài)。 大會(huì)上,聯(lián)發(fā)科定義了“智能體化用戶(hù)體驗(yàn)”的五大特征:主動(dòng)及時(shí)、知你懂你、互動(dòng)協(xié)作、學(xué)習(xí)進(jìn)化和專(zhuān)屬隱私信息守護(hù)。這五大特征需要跨越從芯片、模型、應(yīng)用、終端乃至整個(gè)
    發(fā)表于 04-13 19:52