91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

自然語言分析NLA技術的發(fā)展史

環(huán)音儀說數據 ? 來源:環(huán)音儀說數據 ? 作者:環(huán)音儀說數據 ? 2022-05-11 15:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一、什么是自然語言處理

自然語言處理(Natural Language Processing,簡稱NLP)就是用計算機來處理、理解以及運用人類語言(如中文、英文等),它屬于人工智能的一個分支,是計算機科學與語言學的交叉學科。由于自然語言是人類區(qū)別于其他動物的根本標志,沒有語言,人類的思維也就無從談起,所以NLP體現了人工智能的最高任務與境界。也就是說,只有當計算機具備了處理自然語言的能力時,機器才算實現了真正的智能。

從技術角度看,NLP包括序列標注、分類任務、句子關系判斷和生成式任務等。從應用角度看,NLP具有廣泛的應用場景,例如:機器翻譯、信息檢索、信息抽取與過濾、文本分類與聚類、輿情分析和觀點挖掘等等。它涉及與語言處理相關的數據挖掘、機器學習、知識獲取、知識工程、人工智能研究和與語言計算相關的語言學研究等。

NLP的興起與機器翻譯這一具體任務有著密切聯系?!叭斯ぶ悄堋北蛔鳛橐粋€研究問題正式提出來的時候,創(chuàng)始人把計算機國際象棋和機器翻譯作為兩個標志性的任務,認為只要國際象棋系統(tǒng)能夠打敗人類世界冠軍,機器翻譯系統(tǒng)達到人類翻譯水平,就可以宣告人工智能的勝利。四十年后的1997年,IBM公司的深藍超級計算機已經能夠打敗國際象棋世界冠軍卡斯帕羅夫。而機器翻譯到現在仍無法與人類翻譯水平相比,由此可見NLP有多么的復雜和困難!

二、自然語言處理的發(fā)展趨勢

目前,人們主要通過兩種思路來進行自然語言處理,一種是基于規(guī)則的理性主義,另外一種是基于統(tǒng)計的經驗主義。理性主義方法認為,人類語言主要是由語言規(guī)則來產生和描述的,因此只要能夠用適當的形式將人類語言規(guī)則表示出來,就能夠理解人類語言,并實現語言之間的翻譯等各種NLP任務。而經驗主義方法則認為,從語言數據中獲取語言統(tǒng)計知識,有效建立語言的統(tǒng)計模型。因此只要能夠有足夠多的用于統(tǒng)計的語言數據,就能夠理解人類語言。然而,當面對現實世界充滿模糊與不確定性時,這兩種方法都面臨著各自無法解決的問題。例如,人類語言雖然有一定的規(guī)則,但是在真實使用中往往伴隨大量的噪音和不規(guī)范性。理性主義方法的一大弱點就是魯棒性差,只要與規(guī)則稍有偏離便無法處理。而對于經驗主義方法而言,又不能無限地獲取語言數據進行統(tǒng)計學習,因此也不能夠完美地理解人類語言。二十世紀八十年代以來的趨勢就是,基于語言規(guī)則的理性主義方法不斷受到質疑,大規(guī)模語言數據處理成為目前和未來一段時期內NLP的主要研究目標。統(tǒng)計學習方法越來越受到重視,自然語言處理中越來越多地使用機器自動學習的方法來獲取語言知識。

隨著2013年word2vec技術的發(fā)表,以神經網絡為基礎的深度學習技術開始在NLP中廣泛使用,深度學習的分布式語義表示和多層網絡架構具有強大的擬合和學習能力,顯著提升了NLP各種任務的性能,成為現階段NLP的主要技術方案。

深度學習是純數據驅動技術方案,需要從大規(guī)模標注數據中學習特定任務相關的復雜模式。一方面,有些學者開始探索面向大規(guī)模無標注文本數據的深度學習模型,如ELMo,GPT、BERT等,可以看做從大規(guī)模數據中學習知識的極致探索;另一方面,現有深度學習技術尚未考慮人類積累的豐富知識(包括語言知識、世界知識、常識知識、認知知識、行業(yè)知識等),如果將深度學習看做經驗主義方法,將符號知識看做理性主義方法,那么如何充分發(fā)揮基于規(guī)則的理性主義方法和基于統(tǒng)計的經驗主義方法的優(yōu)勢,兩者互相補充,更好、更快地進行自然語言處理,仍然是我們需要探索的重要課題。

三、自然語言處理在BI的應用

2018年,Gartner 在其發(fā)布的魔力象限報告中,明確指出增強型分析功能是 BI 產品發(fā)展的最重要、也是最顯著的發(fā)展趨勢之一,其原因并不難理解:“當前企業(yè)使用的數據的規(guī)模和復雜度已經逐漸超過人類可以處理的程度,靜態(tài)報表、儀表板等傳統(tǒng)工具已經不能滿足需求,而通過機器學習、人工智能等技術增強分析,可以更好地處理這些數據。而如果利用自然語言處理、人工智能等技術的增強分析就可以自動、快速地對數據進行分析,輔助分析人員得到需要的數據洞察?!?/p>

作為連續(xù)多年入選“Gartner增強分析代表廠商”和“Gartner中國人工智能創(chuàng)業(yè)公司代表廠商(2020)”的Smartbi正是看到了這些趨勢,在2018年便開始自主研發(fā)增強分析工具Smartbi NLA,期望通過引入自然語言處理、知識圖譜、推薦算法和機器問答等人工智能技術,使得Smartbi NLA可以理解用戶的數據分析需求,并幫助其快速完成分析任務獲得數據洞見。

Smartbi NLA的交互式對話實際上是一種特定的語義分析任務。在學術界,類似的任務最早可以追溯到1970年代提出的自然語言編程(Natural-language programming),是指將自然語言(研究比較多的是英語)翻譯為特定的編程語言。在1980年代,人們又針對關系性數據庫提出了自然語言數據庫查詢(Natural Language Database Query),也稱為Text2SQL、NL2SQL等。它將用戶的自然語句轉為可以執(zhí)行的SQL語句,從而免除業(yè)務用戶學習SQL語言的煩惱,成功將NLP應用于BI領域。

Smartbi正是利用了NL2SQL技術,將自然語言通過神經網絡轉化為計算機可以識別的數據庫查詢語言。用戶通過語音或者鍵盤輸入后,“AI智能小麥”會將輸入的自然語言轉為語言元模型的形式,通過小麥內置的知識抽取算法,經過深度學習模型將元模型轉化為機器可以理解的數據庫語言。最后通過Smartbi預置的查詢引擎和圖形引擎,快速準確的找到用戶想要的查詢結果,自動生成圖形輸出,也可以在Smartbi中對查詢結果進行組合和進一步分析。

pYYBAGJ7aY2AIZoPAAKxw2Cq8Xc874.png

圖:NL2SQL模型原理示意圖

Smartbi NLA是時下前沿的數據分析工具,簡化為搜索引擎,僅僅只有一個輸入框,頁面直接輸入描述業(yè)務問題,工具自動把數據查詢出來,免去學習操作的過程,特別適合在展廳大屏、領導辦公室大屏等場合使用,一經推出便廣受客戶歡迎。

1、Smartbi自然語言查詢:臨危受命

2、Smartbi自然語言查詢:游刃有余

3、Smartbi自然語言查詢:堪當大任

4、Smartbi自然語言查詢:如影相隨

審核編輯:符乾江

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 數據挖掘
    +關注

    關注

    1

    文章

    406

    瀏覽量

    25086
  • 數據分析
    +關注

    關注

    2

    文章

    1516

    瀏覽量

    36239
  • 數據可視化
    +關注

    關注

    0

    文章

    500

    瀏覽量

    11480
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    自然語言處理NLP的概念和工作原理

    自然語言處理 (NLP) 是人工智能 (AI) 的一個分支,它會教計算機如何理解口頭和書面形式的人類語言。自然語言處理將計算語言學與機器學習和深度學習相結合來處理語音和文本數據,這些數
    的頭像 發(fā)表于 01-29 14:01 ?400次閱讀
    <b class='flag-5'>自然語言</b>處理NLP的概念和工作原理

    LoRaWAN協議,如何促進人與自然的和諧發(fā)展?

    LoRaWAN促進人與自然和諧發(fā)展,實現生態(tài)監(jiān)測、動物保護與數據支撐。
    的頭像 發(fā)表于 01-13 14:24 ?274次閱讀
    LoRaWAN協議,如何促進人與<b class='flag-5'>自然</b>的和諧<b class='flag-5'>發(fā)展</b>?

    ?基于NLA9306電壓電平轉換器的技術深度解析與應用指南

    安森美 NLA9306電壓電平轉換器是雙路雙向I^2^C總線SMBus電壓電平轉換器,具有使能 (EN) 輸入。這些器件的工作電壓為1.0V至3.6V [V ~ ref(1)~ ] 和1.8V至
    的頭像 發(fā)表于 11-25 14:01 ?576次閱讀
    ?基于<b class='flag-5'>NLA</b>9306電壓電平轉換器的<b class='flag-5'>技術</b>深度解析與應用指南

    云知聲論文入選自然語言處理頂會EMNLP 2025

    近日,自然語言處理(NLP)領域國際權威會議 ——2025 年計算語言學與自然語言處理國際會議(EMNLP 2025)公布論文錄用結果,云知聲提交的《面向門診病歷生成的高質量醫(yī)患對話合成技術
    的頭像 發(fā)表于 11-10 17:30 ?812次閱讀
    云知聲論文入選<b class='flag-5'>自然語言</b>處理頂會EMNLP 2025

    HarmonyOSAI編程自然語言代碼生成

    安裝CodeGenie后,在下方對話框內,輸入代碼需求描述,將根據描述智能生成代碼,生成內容可一鍵復制或一鍵插入至編輯區(qū)當前光標位置。 提問示例 使用ArkTs語言寫一段代碼,在頁面中間部分
    發(fā)表于 09-05 16:58

    北斗生態(tài)環(huán)境監(jiān)測站:讀懂自然的 “語言

    北斗生態(tài)環(huán)境監(jiān)測站:讀懂自然的 “語言”柏峰【BF-BDQX】當生態(tài)監(jiān)測遇上北斗技術,一場關于 “精準守護自然” 的變革正悄然發(fā)生 ——北斗生態(tài)環(huán)境監(jiān)測站以北斗定位導航系統(tǒng)為核心
    的頭像 發(fā)表于 09-04 10:59 ?525次閱讀
    北斗生態(tài)環(huán)境監(jiān)測站:讀懂<b class='flag-5'>自然</b>的 “<b class='flag-5'>語言</b>”

    【HZ-T536開發(fā)板免費體驗】5- 無需死記 Linux 命令!用 CangjieMagic 在 HZ-T536 開發(fā)板上搭建 MCP 服務器,自然語言輕松控板

    )真香,是不是可以沒有YOLO和OCR了? - 北京合眾恒躍科技有限公司 - 電子技術論壇 - 廣受歡迎的專業(yè)電子論壇!已經詳細介紹了,這里不再贅述。 四、測試驗證:用自然語言控制開發(fā)板 啟動服務器
    發(fā)表于 08-23 13:10

    開腦洞,Modbus為什么叫Modbus?

    Modbus 協議為什么叫這個名字?本文帶你回到 1979 年,揭秘 Modbus 名字的由來,梳理其從 RTU、ASCII 到 TCP 的發(fā)展史,回顧在 Modbus 出現之前 PLC 是如何通訊
    的頭像 發(fā)表于 08-22 11:13 ?1399次閱讀

    聊聊倒裝芯片凸點(Bump)制作的發(fā)展史

    凸點(Bump)是倒裝芯片的“神經末梢”,其從金凸點到Cu-Cu鍵合的演變,推動了芯片從平面互連向3D集成的跨越。未來,隨著間距縮小至亞微米級、材料與工藝的深度創(chuàng)新,凸點將成為支撐異構集成、高帶寬芯片的核心技術,在AI、5G、汽車電子等領域發(fā)揮關鍵作用。
    的頭像 發(fā)表于 08-12 09:17 ?5602次閱讀
    聊聊倒裝芯片凸點(Bump)制作的<b class='flag-5'>發(fā)展史</b>

    人工智能技術的現狀與未來發(fā)展趨勢

    人工智能技術的現狀與未來發(fā)展趨勢 ? ? 近年來,人工智能(AI)技術迅猛發(fā)展,深刻影響著各行各業(yè)。從計算機視覺到自然語言處理,從自動駕駛到
    的頭像 發(fā)表于 07-16 15:01 ?1885次閱讀

    云知聲四篇論文入選自然語言處理頂會ACL 2025

    近日,第63屆國際計算語言學年會ACL 2025(Annual Meeting of the Association for Computational Linguistics,簡稱ACL)論文接收
    的頭像 發(fā)表于 05-26 14:15 ?1322次閱讀
    云知聲四篇論文入選<b class='flag-5'>自然語言</b>處理頂會ACL 2025

    自然語言處理的發(fā)展歷程和應用場景

    你是否曾經對著手機說:“嘿,Siri,今天天氣怎么樣?”或者在出國旅行時,打開翻譯軟件,對著菜單說:“請把這道菜翻譯成英文”。
    的頭像 發(fā)表于 04-17 11:40 ?1331次閱讀

    半導體材料發(fā)展史:從硅基到超寬禁帶半導體的跨越

    半導體材料是現代信息技術的基石,其發(fā)展史不僅是科技進步的縮影,更是人類對材料性能極限不斷突破的見證。從第一代硅基材料到第四代超寬禁帶半導體,每一代材料的迭代都推動了電子器件性能的飛躍。 1 第一代
    的頭像 發(fā)表于 04-10 15:58 ?3229次閱讀

    自然語言提示原型在英特爾Vision大會上首次亮相

    在英特爾Vision大會上,Network Optix首次展示了自然語言提示原型,該方案將重新定義視頻管理,為各行各業(yè)由AI驅動的洞察和效率提速。
    的頭像 發(fā)表于 04-09 09:30 ?973次閱讀

    【「芯片通識課:一本書讀懂芯片技術」閱讀體驗】圖文并茂,全面詳實,值得閱讀的芯片科普書

    產業(yè)基礎技術是安全保障,一定要有,同時又要積極產于國際產業(yè)合作, 另外附錄中介紹的芯片發(fā)展史介乎貢獻人員,中國相關行業(yè)奠基人,重大事件等也可以翻翻,可以用這些名人大事激勵自己,作為從業(yè)人員做好自己的工作也是一種貢獻,保持不斷學習,應用到工作當中去也是從業(yè)人員的自豪。
    發(fā)表于 03-27 16:07