91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NLP最難“考卷”成績(jī)出爐:追一科技超越Facebook躍居第二

科訊視點(diǎn) ? 2020-01-16 10:22 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,自然語(yǔ)言處理領(lǐng)域權(quán)威數(shù)據(jù)集SuperGLUE最新榜單排名更新。Google預(yù)訓(xùn)練模型T5保持第一,中國(guó)AI創(chuàng)業(yè)公司追一科技AI Lab團(tuán)隊(duì)超越Facebook AI,躍居榜單第二。值得注意的是,相比谷歌T5等超大規(guī)模研究型模型,追一此次登榜的RoBERTa-mtl-adv模型在商業(yè)化能力也非常強(qiáng)勁,相關(guān)技術(shù)已經(jīng)落地到追一科技的AI數(shù)字員工產(chǎn)品線上,持續(xù)賦能銀行、保險(xiǎn)、證券、零售、地產(chǎn)、能源,教育,互聯(lián)網(wǎng)等多個(gè)行業(yè)。

圖片1.jpg

追一科技躍居SuperGLUE測(cè)試榜第二

SuperGLUE(Super General Language Understanding Evaluation)是當(dāng)下NLP領(lǐng)域難度最大,權(quán)威性最高,含金量最足的測(cè)評(píng)標(biāo)準(zhǔn)之一,由紐約大學(xué)、華盛頓大學(xué)以及谷歌旗下的DeepMind聯(lián)合Facebook作為主要發(fā)起人推出,最大程度涵蓋了現(xiàn)實(shí)生活中可能遇到的不同類型的NLP任務(wù),旨在更真實(shí)地反映當(dāng)前最前沿的NLP技術(shù)可以達(dá)到的認(rèn)知智能水平。

追一科技在為企業(yè)提供智能交互服務(wù)的過(guò)程中,技術(shù)和應(yīng)用互相驅(qū)動(dòng),將實(shí)際商業(yè)化應(yīng)用中總結(jié)出的多任務(wù)學(xué)習(xí)、對(duì)抗訓(xùn)練、知識(shí)蒸餾等技術(shù)手段和經(jīng)驗(yàn)融入到參賽模型中,并在SuperGLUE測(cè)評(píng)數(shù)據(jù)集上拿到第二的成績(jī)。

除去作為參照的人類水平,目前排名榜單第一的是Google的T5模型。從學(xué)術(shù)研究看,T5模型達(dá)到了目前“實(shí)驗(yàn)室智能”的最好水平,但如果考慮商用,T5需要耗費(fèi)大量的算力,且模型自身體積過(guò)于龐大,目前還不能落地到實(shí)際業(yè)務(wù)場(chǎng)景中,缺少實(shí)際的商業(yè)應(yīng)用價(jià)值。

而追一科技通過(guò)多任務(wù)學(xué)習(xí)、對(duì)抗訓(xùn)練以及知識(shí)蒸餾的方式,使得RoBERTa-mtl-adv模型大小合理,效果僅次于Google的T5。同時(shí),相關(guān)技術(shù)也落地到了追一科技AI數(shù)字員工的產(chǎn)品線上。就SuperGLUE排名而言,可以說(shuō)追一科技的RoBERTa-mtl-adv模型在目前全球具有實(shí)際落地能力的NLP模型中效果最好,排名最高。

“學(xué)霸”模型的商業(yè)化能力

SuperGLUE測(cè)試項(xiàng)目并非是“花拳繡腿”,而是實(shí)實(shí)在在考驗(yàn)?zāi)P屯ㄓ媚芰Φ摹拌F人三項(xiàng)”;參加SuperGLUE也并非只是為了刷新評(píng)分,更重要的是檢驗(yàn)當(dāng)前技術(shù)能否很好地落地到實(shí)際應(yīng)用場(chǎng)景中去。

SuperGLUE覆蓋了問(wèn)答、推斷、語(yǔ)義理解、常識(shí)判斷等自然語(yǔ)言理解維度,是人機(jī)智能交互過(guò)程中的核心環(huán)節(jié),在具體的業(yè)務(wù)場(chǎng)景中都有很重要的應(yīng)用價(jià)值。追一科技此次參賽模型的相關(guān)NLP技術(shù)已經(jīng)被成熟運(yùn)用于到自主研發(fā)的全套AI數(shù)字員工產(chǎn)品線上,廣泛服務(wù)于銀行、保險(xiǎn)、泛互聯(lián)網(wǎng)、地產(chǎn)、政企等多個(gè)行業(yè)的標(biāo)桿客戶。例如,在追一科技的智能在線機(jī)器人Bot中就融入了多輪問(wèn)答技術(shù)、語(yǔ)義檢索、機(jī)器閱讀理解技術(shù)等NLP技術(shù),能準(zhǔn)確識(shí)別用戶意圖,滿足用戶需求。

口說(shuō)無(wú)憑,接下來(lái)就結(jié)合SuperGLUE中的任務(wù)與Bot的具體案例,一探虛實(shí)。

單/多輪問(wèn)答技術(shù)是指機(jī)器人和用戶之間一問(wèn)一答,實(shí)現(xiàn)多輪對(duì)話的過(guò)程。例如下面這個(gè)智能在線機(jī)器人Bot服務(wù)餐飲行業(yè)的場(chǎng)景:

智能在線機(jī)器人Bot不僅可以從對(duì)話中準(zhǔn)確識(shí)別出地點(diǎn),人數(shù)等信息,還能進(jìn)一步追問(wèn)用戶未給出的“用餐時(shí)間”的信息,滿足客戶的需求。而傳統(tǒng)的客服機(jī)器人并不會(huì)對(duì)未給出的潛在信息做出反應(yīng)。

機(jī)器閱讀理解技術(shù)在于機(jī)器人去“用力”理解文檔中內(nèi)容的意思,從而根據(jù)用戶需求輸出相應(yīng)的結(jié)果。例如在金融保險(xiǎn)領(lǐng)域會(huì)涉及到大量保險(xiǎn)業(yè)務(wù)文檔的修訂、新增等情況。在面對(duì)客戶時(shí),即使是富有經(jīng)驗(yàn)的客戶經(jīng)理,往往也很難迅速結(jié)合所有新增的文檔內(nèi)容進(jìn)行有效回答。這時(shí),定制了閱讀理解技術(shù)的智能在線機(jī)器人Bot就又可以發(fā)揮作用了——可以實(shí)時(shí)幫助業(yè)務(wù)人員,針對(duì)相關(guān)問(wèn)題從新文檔中提取出答案,解決問(wèn)題,降低出錯(cuò)的概率。

自然語(yǔ)言推斷任務(wù)中“文本蘊(yùn)含”是常出現(xiàn)的形式,在實(shí)際用語(yǔ)中非常的普遍,參考下面這個(gè)銀行領(lǐng)域的例子:

因?yàn)榘捉鹦庞每▽儆谛庞每ǎ虼恕拔业陌捉鹦庞每ㄐ枰獟焓А碧N(yùn)含在“我的信用卡需要掛失”中,因此,智能在線機(jī)器人Bot 在回答用戶時(shí)只需準(zhǔn)確指引用戶如何掛失信用卡即可。

指代消解在人的交流過(guò)程中非常常見(jiàn),在表達(dá)中適當(dāng)?shù)厥褂弥复鷷?huì)讓表達(dá)更加簡(jiǎn)練卻不影響本意的闡述。如下面這個(gè)出行領(lǐng)域的例子:

智能在線機(jī)器人Bot理解了客戶問(wèn)句里的“上次”其實(shí)指代的是“上次中途取消訂單”,所以立馬給出了正確回復(fù)。

然而,最難為機(jī)器人的是常識(shí)推斷,對(duì)語(yǔ)言的理解離不開對(duì)常識(shí)的掌握。舉這么一個(gè)例子:

圖片5.jpg

機(jī)器人需要具備“影子是由太陽(yáng)升起照射留下的”這樣的常識(shí)性推斷,才能正確的選擇答案。對(duì)于人來(lái)說(shuō),這些常識(shí)很簡(jiǎn)單,但是對(duì)于機(jī)器來(lái)說(shuō),大量的這種常識(shí)知識(shí)都潛藏在我們意識(shí)的深處,AI系統(tǒng)的研究者幾乎不可能把所有這樣的常識(shí)都總結(jié)出來(lái),并灌入到系統(tǒng)中,所以機(jī)器人在該數(shù)據(jù)集的表現(xiàn)往往不盡如人意。

落地到現(xiàn)實(shí)場(chǎng)景中,比如我們可以對(duì)智能在線機(jī)器人Bot說(shuō)“我銀行卡弄丟了”,Bot就會(huì)詢問(wèn)你是否需要掛失。因?yàn)樗邆淞恕芭獊G銀行卡需要掛失”這樣的業(yè)務(wù)常識(shí)。

可以看到,真實(shí)的交互場(chǎng)景中模型需要對(duì)語(yǔ)言的不同維度都具有理解能力才能完全正常流暢的對(duì)話。而上述的幾個(gè)例子中的問(wèn)題形式都很好地包含在了SuperGLUE的不同數(shù)據(jù)集中,因此,此次追一科技在SuperGLUE測(cè)評(píng)指標(biāo)上獲得的成績(jī),不僅是對(duì)其RoBERTa-mtl-adv模型在理解自然語(yǔ)言技術(shù)上的一個(gè)肯定,還驗(yàn)證了“技術(shù)驅(qū)動(dòng)應(yīng)用,應(yīng)用導(dǎo)向技術(shù)”策略的可行性,更加堅(jiān)定了追一科技繼續(xù)深耕技術(shù),持續(xù)用AI賦能百業(yè)的信念。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    31109

    瀏覽量

    222394
  • 智能機(jī)器人
    +關(guān)注

    關(guān)注

    17

    文章

    920

    瀏覽量

    85825
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    中國(guó)中車2025年新能源客車銷量位居行業(yè)第二

    近日,中國(guó)客車信息網(wǎng)2025年新能源客車銷量排行榜正式出爐,中國(guó)中車位居行業(yè)第二
    的頭像 發(fā)表于 01-15 16:31 ?839次閱讀

    冰零榮獲DEKRA德凱ISO 26262 ASIL-D認(rèn)證

    近日,冰零智能科技(常州)有限公司(簡(jiǎn)稱:冰零)順利通過(guò)ISO 26262:2018汽車功能安全標(biāo)準(zhǔn)ASIL-D等級(jí)認(rèn)證,并獲得由DEKRA德凱頒發(fā)的功能安全流程認(rèn)證證書。冰零
    的頭像 發(fā)表于 11-14 12:44 ?1735次閱讀

    四維圖新旗下六分榮獲安永復(fù)旦最具潛力企業(yè)獎(jiǎng)

    9月26日,以“無(wú)限可能·智能具身拓未來(lái)”為主題的“安永復(fù)旦最具潛力企業(yè)”2025評(píng)選活動(dòng)在上海揭榜。四維圖新成員企業(yè)六分以高質(zhì)量、可持續(xù)增長(zhǎng)的出色表現(xiàn),摘得“最具潛力企業(yè)獎(jiǎng)”榮譽(yù)。六分
    的頭像 發(fā)表于 09-29 17:04 ?1058次閱讀

    曾被小米投資、特斯拉起訴,清華博士的傳感器初創(chuàng)企業(yè)冰零再獲融資

    近日,冰零智能科技(常州)有限公司(下文簡(jiǎn)稱“冰零”)宣布完成A輪融資,融資金額暫未披露,本輪投資方為國(guó)元?jiǎng)?chuàng)新投。 此次融資將進(jìn)步推動(dòng)冰零
    的頭像 發(fā)表于 09-25 19:25 ?2121次閱讀
    曾被小米投資、特斯拉起訴,清華博士的傳感器初創(chuàng)企業(yè)冰零<b class='flag-5'>科</b><b class='flag-5'>技</b>再獲融資

    全球半導(dǎo)體變天!中國(guó)反超韓國(guó)位居全球第二

    近日,韓國(guó)科學(xué)技術(shù)評(píng)估與規(guī)劃研究院前瞻技術(shù)中心(KISTEP)發(fā)布的《全球半導(dǎo)體技術(shù)競(jìng)爭(zhēng)力評(píng)估報(bào)告》引發(fā)行業(yè)廣泛關(guān)注。報(bào)告顯示,中國(guó)半導(dǎo)體技術(shù)已超越韓國(guó),躍居全球第二,僅次于美國(guó),這
    的頭像 發(fā)表于 09-01 17:30 ?1924次閱讀

    【作品合集】微五CF5010RBT60開發(fā)板測(cè)評(píng)

    :jf_69121293【微五CF5010RBT60開發(fā)板試用體驗(yàn)】硬件IIC點(diǎn)亮OLED小屏幕 第二期合集: 創(chuàng)龍科技TLT113/TL3562-MiniEVM開發(fā)板測(cè)評(píng)作品合集 第三期合集: 嘉楠
    發(fā)表于 09-01 14:48

    【微五CF5010RBT60開發(fā)板試用體驗(yàn)】硬件IIC點(diǎn)亮OLED小屏幕

    微五 CF5010RBT60 測(cè)評(píng):硬件 IIC 驅(qū)動(dòng) OLED 的流暢體驗(yàn) 作為款基于高性能 RISC-V 內(nèi)核 (CF5010RBT60, 160MHz) 的開發(fā)板,微五
    發(fā)表于 08-08 11:01

    【微五CF5010RBT60開發(fā)板試用體驗(yàn)】串口輸出測(cè)試

    立研發(fā)只會(huì)受制于人!??! 這期來(lái)講解串口通信,微五CF5010RBT60開發(fā)板上有個(gè)調(diào)試串口,按照原理圖接線可知,是連接的PC10口,因?yàn)槭褂玫氖荰TL電平,所以只需要連接串口工具上的TX皆可,
    發(fā)表于 07-22 16:52

    【微五CF5010RBT60開發(fā)板試用體驗(yàn)】創(chuàng)建開發(fā)環(huán)境點(diǎn)燈操作

    很高興收到了微五CF5010RBT60開發(fā)板,拿到板子有端時(shí)間了,之前移植卡在開發(fā)環(huán)境上無(wú)法有效的建立和JTAG的通信上,導(dǎo)致沒(méi)有寫測(cè)評(píng)帖子,今天搞定了這個(gè)問(wèn)題,現(xiàn)在就可以開始寫測(cè)評(píng)帖子了
    發(fā)表于 07-22 16:16

    【微五CF5010RBT60開發(fā)板試用體驗(yàn)】開箱評(píng)測(cè)與環(huán)境搭建

    、開箱評(píng)測(cè)(1)產(chǎn)品介紹 微五CF5010RBT60,采用最新代RISC-V高效率的精簡(jiǎn)指令架構(gòu),寬溫域32位通用MCU芯片,內(nèi)部集成
    發(fā)表于 07-01 16:17

    【微五CF5010RBT60開發(fā)板試用體驗(yàn)】開箱曬圖

    引出了JTAG調(diào)試接口。雙排排針引出了所有IO。 BOOT0 與BOOT1 分別引出,在板子背面直接印刷上了啟動(dòng)配置說(shuō)明非常便于使用。 微五(ChinaFive)成立于2019年,是家半導(dǎo)體
    發(fā)表于 06-25 11:06

    中微公司亮相2025金融與產(chǎn)業(yè)創(chuàng)新大會(huì)

    近日,由上海市普陀區(qū)人民政府、中國(guó)證券報(bào)等機(jī)構(gòu)聯(lián)合主辦的“2025金融與產(chǎn)業(yè)創(chuàng)新大會(huì)”在上海普陀區(qū)隆重舉行。中微半導(dǎo)體設(shè)備(上海)股份有限公司(以下簡(jiǎn)稱“中微公司”,股票代碼:688012
    的頭像 發(fā)表于 06-17 11:32 ?1103次閱讀

    六分攜手瑞聲科技推動(dòng)高精定位產(chǎn)業(yè)跨越式發(fā)展

    近日,四維圖新成員企業(yè)六分與瑞聲科技全面戰(zhàn)略合作簽約儀式在武漢舉行。六分CEO李陽(yáng)、瑞聲科技半導(dǎo)體及傳感器事業(yè)部總經(jīng)理吳志江分別代表雙方簽約。簽約儀式后,六分
    的頭像 發(fā)表于 05-27 17:08 ?935次閱讀

    瑞聲科技與六分達(dá)成全面戰(zhàn)略合作

    近日,瑞聲科技集團(tuán)半導(dǎo)體及傳感器事業(yè)部(以下簡(jiǎn)稱瑞聲科技)總經(jīng)理吳志江先生與北京六分有限公司(以下簡(jiǎn)稱六分)首席執(zhí)行官李陽(yáng)先生在武漢瑞聲科技生產(chǎn)制造中心
    的頭像 發(fā)表于 05-26 17:26 ?1191次閱讀

    Nullmax邀您相約2025中國(guó)汽車智能化創(chuàng)新峰會(huì)

    2025年4月26日,2025中國(guó)汽車智能化創(chuàng)新峰會(huì)將在第二十一屆上海國(guó)際汽車工業(yè)展覽會(huì)(簡(jiǎn)稱2025上海車展)同期舉行。中國(guó)汽車智能化創(chuàng)新峰會(huì)是智一科聚焦汽車智能化打造的產(chǎn)業(yè)峰會(huì)IP,已成功舉辦三屆,最近兩屆均是在上海車展同
    的頭像 發(fā)表于 04-25 15:42 ?774次閱讀