91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NLP的兩個(gè)部分:NLU和NLG

GKwL_infoqchina ? 來源:InfoQ ? 2019-12-12 14:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

比爾·蓋茨曾說過,「語言理解是人工智能皇冠上的明珠」。自然語言處理的進(jìn)步將會推動(dòng)人工智能整體進(jìn)展。NLP 的歷史幾乎跟計(jì)算機(jī)和人工智能的歷史一樣長。自計(jì)算機(jī)誕生,就開始有了對人工智能的研究,而人工智能領(lǐng)域最早的研究就是機(jī)器翻譯以及自然語言理解。

隨著大數(shù)據(jù)和技術(shù)設(shè)施的完善,人工智能技術(shù)在近年來迎來了井噴式的發(fā)展。在產(chǎn)業(yè)方面,不少專注于計(jì)算機(jī)視覺的公司也獲得了長足發(fā)展。其中比較具有代表性的是估值已經(jīng)超過 20 億美元的商湯科技,在經(jīng)歷了數(shù)輪大額融資之后,其隱隱有從獨(dú)角獸變成巨頭的趨勢。

不過,人工智能另一個(gè)相關(guān)領(lǐng)域自然語言處理似乎沒有達(dá)到這種高度。在技術(shù)方面,這一領(lǐng)域的技術(shù)準(zhǔn)確率遠(yuǎn)遠(yuǎn)沒有達(dá)到計(jì)算機(jī)視覺和語音識別的水平,技術(shù)產(chǎn)品也因?yàn)檩^高的錯(cuò)誤率,缺少實(shí)際價(jià)值。那么 NLP 技術(shù)到底有哪些難點(diǎn)呢?

什么是 NLP?

在人工智能出現(xiàn)之前,計(jì)算機(jī)只能處理結(jié)構(gòu)化的數(shù)據(jù),就比如我們平時(shí)用的表格里的數(shù)據(jù),但是網(wǎng)絡(luò)中大部分的數(shù)據(jù)都是非結(jié)構(gòu)化的,比如我們看到的文章、圖片、視頻等等。在這些數(shù)據(jù)中,文本數(shù)據(jù)又往往是最多的,為了能夠分析和利用這些文本信息,我們就需要利用 NLP 技術(shù),讓機(jī)器理解這些文本信息,并加以利用。

人類可以通過語言來交流,而為了讓計(jì)算機(jī)之間互相交流,人們讓所有計(jì)算機(jī)都遵守一些規(guī)則,計(jì)算機(jī)的這些規(guī)則就是計(jì)算機(jī)之間的語言。自然語言處理(NLP)就是在機(jī)器語言和人類語言之間溝通的橋梁,以實(shí)現(xiàn)人機(jī)交流的目的。

NLP 的兩個(gè)部分:NLU 和 NLG

自然語言理解(NLU) 則是 NLP 的一部分,這幾年深度學(xué)習(xí)技術(shù)的發(fā)展使 NLU 能在一些場景中落地。自然語言理解就是希望機(jī)器像人一樣,具備正常人的語言理解能力,由于自然語言在理解上有很多難點(diǎn) (下面詳細(xì)說明),所以 NLU 是至今還遠(yuǎn)不如人類的表現(xiàn)。

NLU 目前應(yīng)用的領(lǐng)域主要集中在機(jī)器翻譯、機(jī)器客服、智能音箱等領(lǐng)域,但由于需要大量的數(shù)據(jù)訓(xùn)練和 NLU 本身存在的一些語言語義上的難點(diǎn),其實(shí)機(jī)器還不是非常智能。

自然語言生成(NLG)是 NLP 的重要組成部分,NLU 負(fù)責(zé)理解內(nèi)容,NLG 負(fù)責(zé)生成內(nèi)容。他的主要目的是降低人類和機(jī)器之間的溝通鴻溝,將非語言格式的數(shù)據(jù)轉(zhuǎn)換成人類可以理解的語言格式。

自然語言生成 – NLG 有 2 種方式:

text – to – text:文本到語言的生成

data – to – text :數(shù)據(jù)到語言的生成

NLP 的難點(diǎn)

對于機(jī)器來說,難點(diǎn)主要分為 5 類問題:

語言的多樣性,我們?nèi)粘K玫恼Z言是沒有規(guī)律的,不同的組合可以表達(dá)出很多的含義。

語言的歧義性,如果不聯(lián)系上下文,缺少環(huán)境的約束,語言有很大的歧義性

語言是一個(gè)開放集合,我們可以任意的發(fā)明創(chuàng)造一些新的表達(dá)方式。

語言需要知識依賴,需要聯(lián)系到實(shí)踐知識。

語言的上下文

應(yīng)用場景復(fù)雜,很難出現(xiàn)“獨(dú)角獸”

總的來說,NLP 技術(shù)領(lǐng)域之所以沒有出現(xiàn)如計(jì)算機(jī)視覺領(lǐng)域那些獨(dú)角獸公司,是因?yàn)樽匀徽Z言處理的技術(shù)難度太大,和應(yīng)用場景太復(fù)雜。一個(gè)公司的成立發(fā)展都是由需求驅(qū)動(dòng)的,自然語言應(yīng)用主要是機(jī)器翻譯,雖然機(jī)器翻譯的需求長期存在,但機(jī)器翻譯的水平一直未取得突破性的進(jìn)展,即使到今天,機(jī)器也很難翻譯有背景的復(fù)雜句子。

另外,自然語言處理的應(yīng)用太依賴于UI了。圖像識別基本不需要 UI,直接在系統(tǒng)內(nèi)部集成一些技術(shù)就行。一些公司做翻譯軟件,如果UI做得不行,用戶體驗(yàn)不行,人們就不會愿意使用。

技術(shù)產(chǎn)業(yè)化最重要的是商業(yè)模式,也就是怎么讓技術(shù)掙錢。圖像識別公司的掙錢模式已經(jīng)成立了,但翻譯付費(fèi)就難多了。所以自然語言是從研究到技術(shù)到落地到商業(yè)化,面臨一系列的挑戰(zhàn)。目前的現(xiàn)狀是,自然語言處理技術(shù)更多的是作為公司內(nèi)部技術(shù),比如內(nèi)部的商業(yè)情報(bào)或人機(jī)接口功能。

NLP 技術(shù)發(fā)展,未來可期

從今年的 ACL 大會可以看出 NLP 技術(shù)的火爆。會議共收到了 2900 余篇提交的論文,投稿規(guī)模相較于 2018 年增長了 75%!自然語言處理領(lǐng)域?qū)嵲谑侵耸挚蔁?,學(xué)術(shù)界和工業(yè)界的熱情都創(chuàng)下了歷史新高。

從商業(yè)層面來講也涌現(xiàn)出了微軟小冰、小米小愛等比較成熟的機(jī)器人產(chǎn)品,相信在未來的不久 NLP 技術(shù)一定會給我們帶來更多的驚喜。

大咖現(xiàn)場分享 NLP 技術(shù)干貨

王斌博士,是小米人工智能實(shí)驗(yàn)室主任,NLP 首席科學(xué)家。中國中文信息學(xué)會理事,計(jì)算語言學(xué)、信息檢索、社會媒體處理、語言與知識計(jì)算等專委會委員及《中文信息學(xué)報(bào)》編委,中國計(jì)算機(jī)學(xué)會中文信息處理專業(yè)委員會委員。

加入小米之前,他在中科院計(jì)算所、信工所從事自然語言處理和信息檢索相關(guān)的科研工作。在AICon 全球人工智能與機(jī)器學(xué)習(xí)大會現(xiàn)場,他將會帶來 NLP 技術(shù)方面的相關(guān)演講,各位感興趣的小伙伴歡迎來現(xiàn)場聽他分享。

AICon 全球人工智能與機(jī)器學(xué)習(xí)技術(shù)大會,將于 11 月 21-22 日在北京國際會議中心舉行。顏水成、賈揚(yáng)清、崔寶秋等 AI 技術(shù)大咖屆時(shí)也會來現(xiàn)場,跟大家聊一聊今年在 AI 商業(yè)化場景落地的大背景下,又涌現(xiàn)出了哪些新技術(shù)。本次大會我們設(shè)立了機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺、NLP、AI芯片、搜索推薦、產(chǎn)業(yè)互聯(lián)網(wǎng)、硅谷 AI 技術(shù)實(shí)踐等 13+ 技術(shù)專場,細(xì)分到 AI 技術(shù)的各個(gè)領(lǐng)域,為大家全方位的展示 AI 技術(shù)在國內(nèi)目前發(fā)展的現(xiàn)狀。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1819

    文章

    50137

    瀏覽量

    265783
  • 計(jì)算機(jī)視覺
    +關(guān)注

    關(guān)注

    9

    文章

    1715

    瀏覽量

    47658
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    491

    瀏覽量

    23301

原文標(biāo)題:為何NLP領(lǐng)域難以出現(xiàn)“獨(dú)角獸”?丨AICon

文章出處:【微信號:infoqchina,微信公眾號:InfoQ】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    圖像上兩個(gè)多邊形的ROI區(qū)域,如何獲得這兩個(gè)ROI區(qū)域重合部分的ROI

    labview中,圖像上兩個(gè)多邊形的ROI區(qū)域,如何獲得這兩個(gè)ROI區(qū)域重合部分的ROI
    發(fā)表于 03-16 14:03

    兩個(gè)RS485(Modbus RTU)主站與主站之間如何通訊

    本產(chǎn)品能很好解決Master-1主站向模塊寫入數(shù)據(jù),Master-2主站讀取數(shù)據(jù);Master-2主站向模塊寫入數(shù)據(jù),Master-1主站讀取數(shù)據(jù)。由此解決兩個(gè)主站之間的互相讀通信難題。
    的頭像 發(fā)表于 02-08 15:32 ?692次閱讀
    <b class='flag-5'>兩個(gè)</b>RS485(Modbus RTU)主站與主站之間如何通訊

    兩個(gè)RS485-Modbus主站如何通訊

    本產(chǎn)品能很好解決Master-1主站向模塊寫入數(shù)據(jù),Master-2主站讀取數(shù)據(jù);Master-2主站向模塊寫入數(shù)據(jù),Master-1主站讀取數(shù)據(jù)。由此解決兩個(gè)主站之間的互相讀通信難題。
    發(fā)表于 02-08 15:32 ?0次下載

    使用博圖(TIA Portal)監(jiān)控PROFINET從站通訊狀態(tài)的兩個(gè)方法

    如何使用博圖監(jiān)控Profinet從站通訊狀態(tài),這里有兩個(gè)方法供你選擇。 方法一 | 使用DeviceStates指令 創(chuàng)建全局?jǐn)?shù)據(jù)塊 在博圖項(xiàng)目中,創(chuàng)建一個(gè)全局?jǐn)?shù)據(jù)塊(DB),用于存儲從站狀態(tài)信息
    的頭像 發(fā)表于 01-17 11:21 ?1288次閱讀
    使用博圖(TIA Portal)監(jiān)控PROFINET從站通訊狀態(tài)的<b class='flag-5'>兩個(gè)</b>方法

    曙光存儲連續(xù)斬獲兩個(gè)行業(yè)獎(jiǎng)項(xiàng)

    近期,曙光存儲連續(xù)斬獲兩個(gè)行業(yè)獎(jiǎng)項(xiàng),自研技術(shù)產(chǎn)品在國產(chǎn)突破、AI行業(yè)應(yīng)用等方面的成果獲得廣泛關(guān)注。
    的頭像 發(fā)表于 01-15 16:28 ?2599次閱讀

    一文讀懂:直線模組兩個(gè)滑塊距離能否調(diào)節(jié)?

    關(guān)鍵問題:直線模組中的兩個(gè)滑塊距離可以調(diào)節(jié)嗎?答案并非絕對,而是要根據(jù)直線模組的具體類型、結(jié)構(gòu)設(shè)計(jì)來綜合判斷,不同類型的直線模組在滑塊距離調(diào)節(jié)上有著截然不同的特性。?飛
    的頭像 發(fā)表于 12-29 15:47 ?297次閱讀
    一文讀懂:直線模組<b class='flag-5'>兩個(gè)</b>滑塊距離能否調(diào)節(jié)?

    FreeRtos 能否同時(shí)使用兩個(gè) CPU?

    的情況下,CM0 更愿意專門用于管理外設(shè)。 - 是否有在 CM0 和 CM4 中同時(shí)運(yùn)行代碼的簡單示例或教程? - FreeRtos 能否同時(shí)使用兩個(gè) CPU?
    發(fā)表于 11-11 08:28

    個(gè)硬件SPI兩個(gè)CS操作兩個(gè)norflash,怎么互斥操作兩個(gè)norflash?

    個(gè)硬件SPI兩個(gè)CS操作兩個(gè)norflash,怎么互斥操作兩個(gè)norflash,有一個(gè)norflash被模擬成U盤,會在中斷中操作spi。
    發(fā)表于 09-26 06:18

    基本半導(dǎo)體連獲兩個(gè)行業(yè)獎(jiǎng)項(xiàng)

    近日,基本半導(dǎo)體憑借在碳化硅模塊領(lǐng)域的突出表現(xiàn),連獲“國產(chǎn)SiC模塊TOP企業(yè)獎(jiǎng)”和“年度優(yōu)秀功率器件產(chǎn)品獎(jiǎng)”兩個(gè)行業(yè)獎(jiǎng)項(xiàng)。
    的頭像 發(fā)表于 09-05 16:31 ?1139次閱讀

    如何使用 SPI 全雙工在兩個(gè) 5LP MPU 之間連接 RAM?

    我需要將兩個(gè) 5LP MPU 連接在一起以鏡像兩個(gè) 5LP MPU 內(nèi)的 RAM。 我認(rèn)為這將是 DMA 的一個(gè)功能,但我不確定如何實(shí)現(xiàn)該功能。 我的主 SPI 單元將向從屬 MPU 發(fā)送一個(gè)
    發(fā)表于 07-15 06:20

    圖中兩個(gè)按鍵開關(guān)是兩個(gè)干簧管,為什么不直接對GND設(shè)計(jì)來檢測這個(gè)干簧管通斷呢?

    圖中兩個(gè)按鍵開關(guān)是兩個(gè)干簧管,為什么不直接對GND設(shè)計(jì)來檢測這個(gè)干簧管通斷呢? 這樣設(shè)計(jì)的原理是什么?
    發(fā)表于 06-17 06:30

    看到STM8L152用兩個(gè)IO用兩個(gè)或非門檢測兩個(gè)通斷,是什么原理呢?

    圖中兩個(gè)按鍵開關(guān)是兩個(gè)干簧管,為什么不直接對GND設(shè)計(jì)來檢測這個(gè)干簧管通斷呢? 這樣設(shè)計(jì)的原理是什么?
    發(fā)表于 06-12 06:25

    用于四頻 GSM / GPRS / EDGE 的 Tx-Rx FEM,帶兩個(gè) Rx 交換機(jī)端口和雙頻 TD-SCDMA skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()用于四頻 GSM / GPRS / EDGE 的 Tx-Rx FEM,帶兩個(gè) Rx 交換機(jī)端口和雙頻 TD-SCDMA相關(guān)產(chǎn)品參數(shù)、數(shù)據(jù)手冊,更有用于四頻 GSM
    發(fā)表于 05-29 18:31
    用于四頻 GSM / GPRS / EDGE 的 Tx-Rx FEM,帶<b class='flag-5'>兩個(gè)</b> Rx 交換機(jī)端口和雙頻 TD-SCDMA skyworksinc

    ADAU1787四個(gè)ADC、兩個(gè)DAC、帶音頻DSP的低功耗編解碼器技術(shù)手冊

    ADAU1787 是一款具有四個(gè)輸入和兩個(gè)輸出的編解碼器,其中整合了兩個(gè)數(shù)字信號處理器 (DSP)。從模擬輸入到 DSP 內(nèi)核再到模擬輸出的路徑已針對低延遲進(jìn)行優(yōu)化,適用于噪聲消除耳機(jī)。通過加入少量無源組件,ADAU1787 提
    的頭像 發(fā)表于 05-12 14:57 ?1555次閱讀
    ADAU1787四<b class='flag-5'>個(gè)</b>ADC、<b class='flag-5'>兩個(gè)</b>DAC、帶音頻DSP的低功耗編解碼器技術(shù)手冊

    allegro 兩個(gè)pth孔重疊不報(bào)drc

    allegro 如圖兩個(gè)pth孔重疊了!怎么設(shè)置可以不報(bào)drc!網(wǎng)上的關(guān)閉drc,忽略啥的都沒用看到!
    發(fā)表于 04-23 09:27