91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

為提升虛擬助手智能谷歌發(fā)布了最大的的任務型對話數(shù)據(jù)集SGD幫其開發(fā)

姚小熊27 ? 來源:新智元 ? 作者:佚名 ? 2019-10-30 15:01 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,谷歌軟件工程師Abhinav Rastogi和工程主管Pranav Khaitan稱在谷歌虛擬助手中,已經(jīng)引入了新的方法,更好地支持新服務。谷歌團隊稱,目前虛擬助手可幫助用戶完成各種各樣的任務,包括尋找航班,搜索附近的活動和電影并進行預訂,從網(wǎng)上獲取信息等等。他們通過為網(wǎng)絡上的各種服務提供統(tǒng)一的自然語言界面來提供此功能。

為了適應未來的增長,虛擬助手必須能夠輕松支持新服務,并減少維護工作量,而無需收集其他數(shù)據(jù)或重新訓練模型。

而像Google Assistant這樣的大型虛擬助手,需要與眾多領域中不斷增加的大量服務集成在一起,但每種服務都可能具有重疊的功能。這一適應性問題在最新模型中常常被忽略。這在一定程度上是由于缺乏合適的數(shù)據(jù)集,這些數(shù)據(jù)集無法與虛擬助手所面對的規(guī)模和復雜性相匹配。

在谷歌最近的論文《邁向可擴展的多域對話代理:模式指導的對話數(shù)據(jù)集》(Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset)中,研究團隊引入了一個新的數(shù)據(jù)集SGD(Schema-Guided Dialogue dataset)來解決這些問題。該團隊表示,此數(shù)據(jù)集將會成為有效的測試平臺,可用于意圖預測,槽位填充,狀態(tài)跟蹤和語言生成以及大型虛擬助手的其他任務。

目前,谷歌已發(fā)布SGD數(shù)據(jù)集,谷歌表示,發(fā)布SGD數(shù)據(jù)集的基本目標是應對許多現(xiàn)有數(shù)據(jù)集無法充分解決的現(xiàn)實挑戰(zhàn)。谷歌研究團隊稱,SGD數(shù)據(jù)集是目前公開可用的、最大的任務型對話數(shù)據(jù)集。

在此之前,9月17日,亞馬遜在GitHub上發(fā)布了超470萬單詞21萬句子的語料庫 , 并聲稱這個數(shù)據(jù)集支持“高質量”和“可重復”的對話系統(tǒng)研究,將成為研究界公開可用的最大的基于知識的社交對話數(shù)據(jù)集 。

SGD數(shù)據(jù)集由人類和虛擬助手之間超過18000條的帶注釋的任務型對話組成。這些對話涉及17個領域。對于大多數(shù)領域,數(shù)據(jù)集包含多個不同的API,其中許多API 具有重疊的功能,但接口不同,這反映了典型的真實場景。SGD是第一個涵蓋多個領域并為每個域提供多個API的數(shù)據(jù)集。此外,為了量化模型對API接口更改或添加新API,評估集還包含了許多訓練集沒有的新服務。

目前,利用SGD數(shù)據(jù)集就可以訓練虛擬助手來支持互聯(lián)網(wǎng)上各種各樣的服務。而為達到這種功能,通用方法是需要一個master schema,來列出所有受支持的功能及其參數(shù)。但是,開發(fā)出適合所有使用案例的master schema很難。即使開發(fā)成功,master schema也會使新的或小型服務的集成復雜化,并會增加維護虛擬助手的工作量。此外,盡管跨服務可以有許多相似的概念可以聯(lián)合建模,例如用于查詢或指定電影票、機票或音樂會票數(shù)量在邏輯上有相似性,但除非手動定義它們之間的顯式映射,否則master schema方法并不便于對此類概念進行聯(lián)合建模。

對此,谷歌團隊提出了的新的模式指導方法。此方法不需要為助手設定master schema。相反,每個服務或API都會提供其模式功能及其相關屬性的自然語言描述。然后,這些描述會用于學習模式的分布式語義表示,語義表示則會作為對話系統(tǒng)的附加輸入。對話系統(tǒng)之后就會被作為不包含域或服務特定參數(shù)的單個統(tǒng)一模型。這種統(tǒng)一模型利于在不同服務中相似概念之間的常識表示,而使用模式的分布式表示可以對訓練數(shù)據(jù)中不存在的新服務進行操作。

目前,谷歌已經(jīng)將這一方法用在了開源對話狀態(tài)跟蹤模型中,該模型在常規(guī)設置中仍具有競爭力,且適用于 zero-shot 設置(即沒有針對新服務和API的訓練數(shù)據(jù))。

“我們認為該數(shù)據(jù)集將會成為建立大規(guī)模對話模型的良好基準,” Rastogi和Khaitan稱?!拔覀兤诖芯拷鐚⑵溆糜趯υ捈夹g的發(fā)展創(chuàng)新?!?br /> 責任編輯:lw

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6255

    瀏覽量

    111879
  • 人工智能
    +關注

    關注

    1819

    文章

    50218

    瀏覽量

    266504
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    Riskified宣布擴展AI智能智能,保障商家原生AI購物助手安全

    提升客戶體驗,Riskified正確保這些全新觸點能夠防范復雜欺詐和濫用行為。 零售商正大力投資,將AI智能體直接引入線上店鋪。McKinsey & Company的研究印證這一趨勢,指出82%的零售企業(yè)已啟動以重塑客戶服務
    的頭像 發(fā)表于 03-04 16:42 ?1161次閱讀

    開發(fā)智能體調試與預覽---真機測試

    重新啟動小藝,在對話列表中看到“開發(fā)中”標簽的智能體。 4、發(fā)布真機測試后,智能體的開發(fā)態(tài)1
    發(fā)表于 02-09 15:37

    全球首個最大規(guī)??绫倔w視觸覺多模態(tài)數(shù)據(jù)白虎-VTouch發(fā)布

    具身智能走向真實世界規(guī)?;瘧?,離不開可復現(xiàn)、可擴展、可協(xié)同演進的數(shù)據(jù)基礎設施。圍繞真實物理交互能力構建這一核心工程目標,1月26日,國家地方共建人形機器人創(chuàng)新中心聯(lián)合上海緯鈦科技有限公司正式發(fā)布
    的頭像 發(fā)表于 01-29 14:41 ?683次閱讀

    免費獲取 | SimData高保真虛擬數(shù)據(jù)開源發(fā)布,兼容nuScenes,開箱即用!

    的關鍵瓶頸。在此背景下,基于高保真仿真技術構建的SimData自動駕駛虛擬數(shù)據(jù),以“低成本、高保真、場景全”的核心優(yōu)勢,行業(yè)提供高效的
    的頭像 發(fā)表于 12-09 17:32 ?407次閱讀
    免費獲取 | SimData高保真<b class='flag-5'>虛擬</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>集</b>開源<b class='flag-5'>發(fā)布</b>,兼容nuScenes,開箱即用!

    思必馳任務對話算法通過國家備案

    近日,國家網(wǎng)信辦公開發(fā)布第十四批境內深度合成服務算法備案信息,思必馳任務對話算法正式通過備案。這是思必馳第八項通過備案的算法,進一步鞏固
    的頭像 發(fā)表于 11-20 10:33 ?987次閱讀

    SimData:基于aiSim的高保真虛擬數(shù)據(jù)生成方案

    01前言在自動駕駛感知系統(tǒng)的研發(fā)過程中,模型的性能高度依賴于大規(guī)模、高質量的感知數(shù)據(jù)。目前業(yè)界常用的數(shù)據(jù)包括KITTI、nuScenes、WaymoOpenDataset等,它們
    的頭像 發(fā)表于 11-07 17:35 ?5456次閱讀
    SimData:基于aiSim的高保真<b class='flag-5'>虛擬</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>集</b>生成方案

    軟硬件協(xié)同技術分享 - 任務劃分 + 自定義指令

    Level , ESL)得到催生,然而ESL設計依賴于復雜的高層次建模以及龐大的數(shù)據(jù)支持,且工具鏈的發(fā)展仍不是十分完善。 在現(xiàn)階段的開發(fā)氛圍中,軟硬件協(xié)同開發(fā)是一種能夠縮短
    發(fā)表于 10-28 08:03

    【創(chuàng)意征集】鏡面顯示器一個打通“虛擬”與“現(xiàn)實”的家庭終端構想【2025-10-18】

    現(xiàn)實。 一、 產(chǎn)品愿景:它不只是電視,也不是鏡子 我構想的產(chǎn)品,是一臺 “智能鏡電視” 。它常態(tài)下是一面品質卓越的完整鏡面,喚醒后則是一臺虛擬試穿、體感娛樂、社交于一身的4K/8K智能
    發(fā)表于 10-15 20:53

    CPU密集任務開發(fā)指導

    CPU密集任務是指需要占用系統(tǒng)資源處理大量計算能力的任務,需要長時間運行,這段時間會阻塞線程其它事件的處理,不適宜放在主線程進行。例如圖像處理、視頻編碼、數(shù)據(jù)分析等。 基于多線程并發(fā)
    發(fā)表于 06-19 06:05

    微軟研究助手(Researcher)和分析助手(Analyst)全面上市 推理智能體工作搭檔

    我們很高興地宣布研究助手(Researcher)和分析助手(Analyst)全面上市。這是兩款首次問世的推理助手,專為工作場景而設計。自今年四月通過 Frontier 計劃首次亮相以
    的頭像 發(fā)表于 06-11 10:15 ?1489次閱讀
    微軟研究<b class='flag-5'>助手</b>(Researcher)和分析<b class='flag-5'>助手</b>(Analyst)全面上市 推理<b class='flag-5'>型</b><b class='flag-5'>智能</b>體工作搭檔

    鴻蒙5開發(fā)寶藏案例分享---應用接續(xù)提升內容發(fā)布體驗

    \" 遇到同步失敗先檢查:藍牙是否開啟?分布式文件權限給沒? ? 五、你以為這就完了?還有這些騷操作 結合AI能力實現(xiàn)接續(xù)內容智能推薦 利用設備傳感器狀態(tài)判斷最佳接續(xù)時機 多設備接力場景下的數(shù)據(jù)
    發(fā)表于 06-03 18:25

    明遠智睿SSD2351開發(fā)板:語音機器人領域的變革力量

    在人工智能快速發(fā)展的今天,語音機器人逐漸成為人們生活和工作中的得力助手。明遠智睿SSD2351開發(fā)板憑借強大性能與豐富功能,語音機器人的發(fā)展注入新動力,成為該領域的變革力量。 SSD
    發(fā)表于 05-28 11:36

    【「零基礎開發(fā)AI Agent」閱讀體驗】+Agent開發(fā)平臺

    開發(fā)平臺有4大特點 1)技術集成性 Agent開發(fā)平臺集成了大模型調用、提示詞工程、插件、線上編程運行環(huán)境、知識庫、工作流、數(shù)據(jù)庫等多種功能模塊,
    發(fā)表于 05-13 12:24

    【「零基礎開發(fā)AI Agent」閱讀體驗】+初品Agent

    有: 5個典型的Agent使用場景,并詳細介紹11個Agent的開發(fā)過程。 前面一直在提“Agent”這個詞,那么Agent代表啥含義呢? Agent的中文含義是指“代理人”,并有智能體的意思,它是
    發(fā)表于 04-22 11:51

    DevEco Studio AI輔助開發(fā)工具兩大升級功能 鴻蒙應用開發(fā)效率再提升

    隨著搭載HarmonyOS 5的Pura X發(fā)布,鴻蒙生態(tài)進入快車道,各應用正在加速適配開發(fā),越來越多開發(fā)者加入到鴻蒙應用開發(fā)浪潮中。
    發(fā)表于 04-18 14:43