91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一文了解百度被收錄ACL 2019的10篇論文

WpOh_rgznai100 ? 來源:lq ? 2019-06-07 16:58 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,自然語言處理(NLP)領(lǐng)域的國際頂級學(xué)術(shù)會議“國際計(jì)算語言學(xué)協(xié)會年會”(ACL 2019)公布了今年大會論文錄用結(jié)果。根據(jù) ACL 2019 官方數(shù)據(jù),今年大會的有效投稿數(shù)量達(dá)到 2694 篇,相比去年的 1544 篇增長高達(dá) 75%。其中,百度共有 10 篇論文被大會收錄。

國際計(jì)算語言學(xué)協(xié)會(ACL,The Association for Computational Linguistics)成立于 1962 年,是自然語言處理領(lǐng)域影響力最大、最具活力的國際學(xué)術(shù)組織之一,自成立之日起就致力于推動計(jì)算語言學(xué)及自然語言處理相關(guān)研究的發(fā)展和國際學(xué)術(shù)交流。百度高級副總裁、AI 技術(shù)平臺體系 (AIG) 和基礎(chǔ)技術(shù)體系(TG)總負(fù)責(zé)人王海峰曾于 2013 年出任 ACL 主席,是 ACL 五十多年歷史上首位華人主席,也是 ACL 亞太分會(AACL)的創(chuàng)始主席,ACL 會士。研究論文能夠被 ACL 學(xué)術(shù)年會錄用,意味著研究成果得到了國際學(xué)術(shù)界的認(rèn)可。

百度被錄用的 10 篇論文,覆蓋了信息抽取、機(jī)器閱讀理解、對話系統(tǒng)、視頻語義理解、機(jī)器翻譯等諸多 NLP 領(lǐng)域的熱點(diǎn)和前沿研究方向,提出了包括基于注意力正則化的 ARNOR 框架(Attention Regularization based NOise Reduction)、語言表示與知識表示深度融合的 KT-NET 模型、多粒度跨模態(tài)注意力機(jī)制、基于端到端深度強(qiáng)化學(xué)習(xí)的共指解析方法等,在人機(jī)交互、智能客服、視頻理解、機(jī)器翻譯等場景中具有很大的應(yīng)用價(jià)值。

附:百度被收錄 ACL 2019 論文概覽

ARNOR: Attention Regularization based Noise Reduction for Distant Supervision Relation Classification

摘要:遠(yuǎn)監(jiān)督通過知識庫自動獲取標(biāo)注語料,是關(guān)系抽取的關(guān)鍵算法。但是遠(yuǎn)監(jiān)督通常會引入大量噪聲數(shù)據(jù),即句子并未表達(dá)自動標(biāo)注的關(guān)系。進(jìn)一步說,基于遠(yuǎn)監(jiān)督學(xué)習(xí)的模型效果不佳、解釋性差,無法解釋關(guān)系的指示詞。

為此,我們提出基于注意力正則化的 ARNOR 框架(Attention Regularization based NOise Reduction)。此方法通過注意力機(jī)制,要求模型能夠關(guān)注關(guān)系的指示詞,進(jìn)而識別噪聲數(shù)據(jù),并通過 bootstrap 方法逐步選擇出高質(zhì)量的標(biāo)注數(shù)據(jù),改善模型效果。此方法在關(guān)系分類及降噪上均顯著優(yōu)于此前最好的增強(qiáng)學(xué)習(xí)算法。

應(yīng)用價(jià)值:在文本信息抽取有廣泛的應(yīng)用價(jià)值。此方法能夠顯著降低對標(biāo)注數(shù)據(jù)的依賴,實(shí)現(xiàn)低成本的基于知識庫的自動關(guān)系學(xué)習(xí),未來可落地在醫(yī)療、金融等行業(yè)信息抽取中。

Enhancing Pre-trained Language Representations with Rich Knowledge for Machine Reading Comprehension

摘要:機(jī)器閱讀理解 (Machine Reading Comprehension) 是指讓機(jī)器閱讀文本,然后回答和閱讀內(nèi)容相關(guān)的問題。該技術(shù)可以使機(jī)器具備從文本數(shù)據(jù)中獲取知識并回答問題的能力,是構(gòu)建通用人工智能的關(guān)鍵技術(shù)之一,長期以來受到學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注。近兩年,預(yù)訓(xùn)練語言表示模型在機(jī)器閱讀理解任務(wù)上取得了突破性進(jìn)展。通過在海量無標(biāo)注文本數(shù)據(jù)上預(yù)訓(xùn)練足夠深的網(wǎng)絡(luò)結(jié)構(gòu),當(dāng)前最先進(jìn)的語言表示模型能夠捕捉復(fù)雜的語言現(xiàn)象,更好地理解語言、回答問題。然而,正如大家所熟知的,真正意義上的閱讀理解不僅要求機(jī)器具備語言理解的能力,還要求機(jī)器具備知識以支撐復(fù)雜的推理。為此,在論文《Enhancing Pre-trained Language Representations with Rich Knowledge for Machine Reading Comprehension》中,百度開創(chuàng)性地提出了語言表示與知識表示的深度融合模型 KT-NET,希望同時(shí)借助語言和知識的力量進(jìn)一步提升機(jī)器閱讀理解的效果。

KT-NET 的模型架構(gòu)如下圖所示。首先,針對給定的閱讀內(nèi)容和結(jié)構(gòu)化知識圖譜,分別利用語言表示模型和知識表示模型對兩者進(jìn)行編碼,得到相應(yīng)的文本表示和知識表示。接下來,利用注意力機(jī)制從知識圖譜中自動篩選并整合與閱讀內(nèi)容高度相關(guān)的知識。最后,通過雙層自注意力匹配,實(shí)現(xiàn)文本表示和知識表示的深度融合,提升答案邊界預(yù)測的準(zhǔn)確性。截止到發(fā)稿日,KT-NET 仍然是常識推理閱讀理解數(shù)據(jù)集 ReCoRD 榜單上排名第一的模型,并在此前很長一段時(shí)期內(nèi)都是 SQuAD 1.1 榜單上效果最好的單模型。

KT-NET: 語言表示與知識表示的深度融合模型

應(yīng)用價(jià)值:該項(xiàng)技術(shù)可應(yīng)用于搜索問答智能音箱等產(chǎn)品中,直接精準(zhǔn)定位用戶輸入問題的答案,并在搜索結(jié)果首條顯著位置呈現(xiàn)或通過語音播報(bào)呈現(xiàn)給用戶。

Know More about Each Other: Evolving Dialogue Strategy via Compound Assessment

摘要:現(xiàn)有的基于監(jiān)督學(xué)習(xí)的對話系統(tǒng),缺乏對多輪回復(fù)方向的控制和規(guī)劃,通常導(dǎo)致對話中發(fā)生重復(fù)、發(fā)散等問題,使得用戶的交互體驗(yàn)偏差。 在本文中,我們對多輪對話進(jìn)行了復(fù)合評估 (compound assessment),并基于該評估利用強(qiáng)化學(xué)習(xí)優(yōu)化兩個(gè)自對話 (self-play) 的機(jī)器人,促進(jìn)生成過程中較好地控制多輪對話的方向??紤]到對話的一個(gè)主要?jiǎng)訖C(jī)是進(jìn)行有效的信息交換,針對 Persona Chat 問題(兩個(gè)人相互對話聊興趣愛好),我們設(shè)計(jì)了一個(gè)較為完善的評估系統(tǒng),包括對話的信息量和連貫度兩個(gè)主要方面。我們利用復(fù)合評估作為 reward,基于策略梯度算法 (policy gradient),指導(dǎo)優(yōu)化兩個(gè)同構(gòu)的對話生成機(jī)器人之間的對話策略 (dialogue strategy)。該對話策略通過控制知識的選擇來主導(dǎo)對話的流向。 我們公開數(shù)據(jù)集上進(jìn)行了全面的實(shí)驗(yàn),結(jié)果驗(yàn)證了我們提出的方法生成的多輪對話質(zhì)量,顯著超過其他最優(yōu)方法。

應(yīng)用價(jià)值:可應(yīng)用于對話系統(tǒng)、智能客服。

Proactive Human-Machine Conversation with Explicit Conversation Goal

摘要:目前的人機(jī)對話還處于初級水平,機(jī)器大多是被動對話,無法像人類一樣進(jìn)行充分交互。我們提出了基于知識圖譜的主動對話任務(wù),讓機(jī)器像人類一樣主動和用戶進(jìn)行對話。對話過程中,機(jī)器根據(jù)知識圖譜主動引領(lǐng)對話進(jìn)程完成提前設(shè)定的話題 (實(shí)體) 轉(zhuǎn)移目標(biāo),并保持對話的自然和流暢性。為此,我們在電影和娛樂任務(wù)領(lǐng)域人工標(biāo)注 3 萬組共 27 萬個(gè)句子的主動對話語料,并實(shí)現(xiàn)了生成和檢索的兩個(gè)主動對話基線模型。

應(yīng)用價(jià)值:可應(yīng)用于智能音箱中的對話技能,也可以基于此開發(fā)閑聊技能,讓機(jī)器主動發(fā)起基于知識圖譜的聊天。

Multi-grained Attention with Object-level Grounding for Visual Question Answering

摘要:視覺問答 (VQA) 是一類跨模態(tài)信息理解任務(wù),要求系統(tǒng)理解視覺圖片信息,并回答圍繞圖片內(nèi)容的文本問題。這篇文章提出一種多粒度跨模態(tài)注意力機(jī)制,在圖片 - 句子粒度注意力的基礎(chǔ)上,提出更細(xì)粒度的物體級別跨模態(tài)信息注意力機(jī)制,并給出 2 種有效的細(xì)粒度信息理解增強(qiáng)的方法。實(shí)驗(yàn)表明我們的方法有助于對復(fù)雜圖像和細(xì)小物體的識別,使系統(tǒng)更準(zhǔn)確地定位到回答文本問題所依賴的視覺信息,從而顯著提升 VQA 準(zhǔn)確率。

應(yīng)用價(jià)值:可應(yīng)用于基于多模態(tài)信息和知識圖譜的小視頻內(nèi)容理解項(xiàng)目。

Hubless Nearest Neighbor Search for Bilingual Lexicon Induction

摘要:這項(xiàng)基礎(chǔ)研究提出了一種提高最近鄰搜索的方法。該方法有非常漂亮的理論基礎(chǔ),不僅能顯著提升雙語詞典編纂(Bilingual Lexicon Induction)的準(zhǔn)確率,對涉及最近鄰搜索的很多任務(wù)都有指導(dǎo)意義。

應(yīng)用價(jià)值:機(jī)器翻譯需要大量對齊的雙語文本作為訓(xùn)練數(shù)據(jù)。這一要求在某些情況下不能被滿足,比如小語種文本,專業(yè)文獻(xiàn)。雙語詞典編纂在這種情況下能提升翻譯系統(tǒng)的準(zhǔn)確率。

STACL: Simultaneous Translation with Implicit Anticipation and Controllable Latency

摘要:同聲翻譯是人工智能領(lǐng)域公認(rèn)的最難問題之一,已經(jīng)困擾學(xué)術(shù)界和工業(yè)界幾十年了。我們提出了歷史上第一個(gè)超前預(yù)測和可控延遲的同聲翻譯算法。去年 10 月發(fā)布以來,被各大技術(shù)外媒廣泛報(bào)導(dǎo),包括 MIT 技術(shù)評論、IEEE Spectrum、財(cái)富雜志等。量子位總結(jié)報(bào)道:“這是 2016 年百度 Deep Speech 2 發(fā)布以來,又一項(xiàng)讓技術(shù)外媒們?nèi)绱思拥男逻M(jìn)展。”

應(yīng)用價(jià)值:2018 年 11 月的百度世界大會采用了這項(xiàng)同傳技術(shù),全程同傳翻譯了 Robin 所有演講,延遲僅為 3 秒左右,而之前的整句翻譯技術(shù)延遲為一整句(可達(dá) 10 秒以上)。同時(shí),翻譯質(zhì)量也沒有明顯的下降。

Simultaneous Translation with Flexible Policy via Restricted Imitation Learning

摘要:本文旨在提高同聲翻譯的質(zhì)量。我們?nèi)ツ晏岢龅?STACL 框架(即上述文章 7)雖然簡單有效,但有時(shí)不夠靈活。現(xiàn)在我們提出一種基于模仿學(xué)習(xí)的同聲翻譯算法,通過模仿本文設(shè)計(jì)的動態(tài)策略,該模型可以實(shí)時(shí)靈活地決定是否需要等待更多信息來繼續(xù)翻譯,進(jìn)而在保持低延遲的情況下提高了翻譯質(zhì)量。

應(yīng)用價(jià)值:該技術(shù)可用于同聲傳譯系統(tǒng)。

Robust Neural Machine Translation with Joint Textual and Phonetic Embedding

摘要:該文章旨在提高翻譯的魯棒性,特別是對同音詞噪音的魯棒性。我們在翻譯的輸入端,通過聯(lián)合嵌入的方式,加入輸入單詞對應(yīng)的發(fā)音信息。實(shí)驗(yàn)結(jié)果表明,該方法不僅大大提高了翻譯系統(tǒng)在噪聲情況下的魯棒性,也大幅提高了翻譯系統(tǒng)在非噪聲情況下的性能。

應(yīng)用價(jià)值:可用于翻譯,特別是語音到語音的同聲傳譯系統(tǒng)。語音翻譯的一個(gè)主要難題是語音識別的錯(cuò)誤太多,而這些錯(cuò)誤大多是同音詞或發(fā)音相似的單詞,此技術(shù)可以很大程度上降低這些來自于語音識別的噪音。

End-to-end Deep Reinforcement Learning Based Coreference Resolution

摘要:共指解析是信息抽取任務(wù)中不可或缺的組成部分。近期的基于端到端深度神經(jīng)網(wǎng)絡(luò)的方法,往往通過優(yōu)化啟發(fā)式的損失函數(shù)并做出一系列局部解析決策,缺乏對整個(gè)篇章的理解。本文首次提出了基于端到端深度強(qiáng)化學(xué)習(xí)的共指解析方法,在同一框架內(nèi)完成指稱檢測和指稱鏈接,并且直接優(yōu)化共指解析的評價(jià)指標(biāo),在 OntoNotes 上取得了良好效果。

應(yīng)用價(jià)值:知可用于識圖譜構(gòu)建,信息抽取。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 百度
    +關(guān)注

    關(guān)注

    9

    文章

    2379

    瀏覽量

    95005
  • 論文
    +關(guān)注

    關(guān)注

    1

    文章

    103

    瀏覽量

    15423
  • ACL
    ACL
    +關(guān)注

    關(guān)注

    0

    文章

    61

    瀏覽量

    12836

原文標(biāo)題:史上最大規(guī)模ACL大會放榜,百度10篇NLP論文被錄用!

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    百度心大模型5.0正式版上線

    今天,在百度心Moment大會現(xiàn)場,心大模型5.0正式版上線。
    的頭像 發(fā)表于 01-23 16:48 ?1342次閱讀

    百度健康升級發(fā)布心健康管家

    面臨醫(yī)療資源分布不均、就診流程繁瑣、就醫(yī)信息不均等難題,“想讓每個(gè)家庭都擁有專屬醫(yī)生”成為百度健康的愿景。
    的頭像 發(fā)表于 12-23 15:01 ?737次閱讀

    百度世界大會亮點(diǎn) 五年五芯 百度宣布打造最硬AI云

    自2006年以來,百度世界大會已連續(xù)舉辦近20屆,百度世界大會是百度每年面向行業(yè)、媒體、合作伙伴和廣大用戶的最高級別盛事,作為百度年度最重要的的戰(zhàn)略、技術(shù)、產(chǎn)品發(fā)布會,自2006年以來
    的頭像 發(fā)表于 11-13 15:47 ?1716次閱讀

    百度世界2025進(jìn)行中 百度昆侖芯超節(jié)點(diǎn)亮相 性能巨幅提升

    百度世界大會是百度每年面向行業(yè)、媒體、合作伙伴和廣大用戶的最高級別盛事,作為百度年度最重要的的戰(zhàn)略、技術(shù)、產(chǎn)品發(fā)布會,自2006年以來已連續(xù)舉辦19年,持續(xù)為行業(yè)搭建起交流前沿技術(shù)、碰撞創(chuàng)新
    的頭像 發(fā)表于 11-13 11:51 ?1303次閱讀

    寧暢與與百度心大模型展開深度技術(shù)合作

    近日,百度正式開源心大模型4.5系列模型。作為心開源合作伙伴,寧暢在模型開源首日即實(shí)現(xiàn)即刻部署,做到“開源即接入、發(fā)布即可用”。據(jù)悉,心4.5開源系列全部基于飛槳深度學(xué)習(xí)框架進(jìn)行
    的頭像 發(fā)表于 07-07 16:26 ?899次閱讀

    歐洲央行行長行到訪百度Apollo Park

    近日,拉加德行到訪位于北京亦莊(經(jīng)濟(jì)技術(shù)開發(fā)區(qū))的百度Apollo Park,與百度Jackson等人交流自動駕駛、AI發(fā)展等話題,并在亦莊東環(huán)南路、宏達(dá)南路等公開道路上,試乘了蘿卜快跑第六代無人駕駛汽車。
    的頭像 發(fā)表于 06-18 15:44 ?879次閱讀

    后摩智能四論文入選三大國際頂會

    2025 年上半年,繼年初 AAAI、ICLR、DAC 三大國際頂會收錄 5 論文后,后摩智能近期又有 4
    的頭像 發(fā)表于 05-29 15:37 ?1366次閱讀

    云知聲四論文入選自然語言處理頂會ACL 2025

    結(jié)果正式公布。云知聲在此次國際學(xué)術(shù)盛會中表現(xiàn)卓越,共有4論文接收,其中包括2主會論文(Main Paper)和2
    的頭像 發(fā)表于 05-26 14:15 ?1342次閱讀
    云知聲四<b class='flag-5'>篇</b><b class='flag-5'>論文</b>入選自然語言處理頂會<b class='flag-5'>ACL</b> 2025

    百度地圖重磅發(fā)布地圖AI開放平臺

    近日,在WGDC25全球時(shí)空智能大會上,百度地圖重磅發(fā)布地圖AI開放平臺。百度地圖深耕20年的數(shù)據(jù)能力、引擎能力與AI技術(shù)全面開放,向開發(fā)者深度開放四大核心能力和五大場景解決方案。
    的頭像 發(fā)表于 05-26 11:26 ?1806次閱讀

    百度心大模型X1 Turbo獲得信通院當(dāng)前大模型最高評級證書

    百度在520居然還領(lǐng)了個(gè)證?是它, 信通院當(dāng)前大模型最高評級證書 ! 在5月20日的百度AI Day 上,中國信通院公布了大模型推理能力評估結(jié)果—— 百度心大模型X1 Turbo在2
    的頭像 發(fā)表于 05-21 18:19 ?1304次閱讀
    <b class='flag-5'>百度</b><b class='flag-5'>文</b>心大模型X1 Turbo獲得信通院當(dāng)前大模型最高評級證書

    百度發(fā)布心4.5 Turbo、X1 Turbo和多款A(yù)I應(yīng)用

    近日,Create2025百度AI開發(fā)者大會在武漢舉辦。百度創(chuàng)始人李彥宏發(fā)布了心大模型4.5 Turbo及深度思考模型X1 Turbo兩大模型,以及多款A(yù)I應(yīng)用。王海峰現(xiàn)場詳細(xì)解讀了背后的技術(shù)。
    的頭像 發(fā)表于 04-30 10:16 ?1181次閱讀

    百度在AI領(lǐng)域的最新進(jìn)展

    近日,我們在武漢舉辦了Create2025百度AI開發(fā)者大會,與全球各地的5000多名開發(fā)者,分享了百度在AI領(lǐng)域的新進(jìn)展。
    的頭像 發(fā)表于 04-30 10:14 ?1369次閱讀

    上汽大眾與百度地圖達(dá)成戰(zhàn)略合作

    近日,上海國際車展期間,百度地圖與上汽大眾舉行科技X生態(tài)戰(zhàn)略合作伙伴簽約儀式,雙方將基于百度領(lǐng)先的車道級地圖產(chǎn)品,為上汽大眾千萬車主打造更安全、高效的智能化出行體驗(yàn)。上汽大眾總經(jīng)理陶海龍、百度副總裁尚國斌等出席簽約儀式。
    的頭像 發(fā)表于 04-29 17:28 ?1264次閱讀

    百度AI榮獲2025愛迪生獎(jiǎng)金獎(jiǎng)和銀獎(jiǎng)

    剛剛,百度AI在「2025愛迪生獎(jiǎng)」中獲得銀兩項(xiàng)大獎(jiǎng)。
    的頭像 發(fā)表于 04-08 15:43 ?1012次閱讀

    百度發(fā)布心大模型4.5和文心大模型X1

    心大模型4.5是百度自主研發(fā)的新代原生多模態(tài)基礎(chǔ)大模型,通過多個(gè)模態(tài)聯(lián)合建模實(shí)現(xiàn)協(xié)同優(yōu)化,多模態(tài)理解能力優(yōu)秀;具備更精進(jìn)的語言能力,理解、生成、邏輯、記憶能力全面提升,去幻覺、邏輯推理、代碼能力顯著提升。
    的頭像 發(fā)表于 03-18 16:29 ?964次閱讀