近年來對話系統(tǒng)迅速發(fā)展,同時也出現(xiàn)了一系列豐富的數(shù)據(jù)集。但對于剛剛進入這一領(lǐng)域團隊來說,迅速搭建起對于特定任務(wù)的可用的對話系統(tǒng)依然充滿挑戰(zhàn)。這主要是由于這一領(lǐng)域內(nèi)缺乏結(jié)構(gòu)完善、易于使用的開源系統(tǒng),讓研究人員可以便捷的搭建和測評對話機器人。
眾所周知,基礎(chǔ)性的開源系統(tǒng)為AI研究的突破打下了堅實的基礎(chǔ),在這一領(lǐng)域的Moses、HTK和CoreNLP等項目都被廣泛用于機器翻譯、語音識別和自然語言處理,推動了各層次研究的飛速發(fā)展。
為了促進這一領(lǐng)域的發(fā)展,微軟美國研究院和清華聯(lián)合推出了一款開源的多領(lǐng)域端到端對話系統(tǒng)平臺—ConvLab,使得研究人員可以便捷地搭建對話系統(tǒng)、自動訓練對話模型、構(gòu)建并評測對話機器人的各方面表現(xiàn)。
ConvLab
為了便于用于構(gòu)建不同類型任務(wù)導向的機器人、將更多的自動化引入構(gòu)建、訓練和測評過程中,ConvLab包含了豐富的模型工具和運行引擎、以及端到端的測評平臺。簡單來講臺中包含了基于模塊和端到端兩種架構(gòu)類型的對話系統(tǒng):基于模塊的架構(gòu)系統(tǒng)包含了自然語言理解(NLU)、對話系統(tǒng)追蹤(DST)、對話策略(POL)和自然語言生成(NLG)等模塊;完全端到端神經(jīng)架構(gòu)減少了手工編程的工作量,并減小了誤差在工作流程中的傳播。
與先前工具集集中于系統(tǒng)策略或者受限于固定的預(yù)訓練模型不同,ConvLab基于全標注的數(shù)據(jù)集覆蓋了所有可訓練的統(tǒng)計模型,解決了先前對于系統(tǒng)性能度量的困難。
很多時候用戶需要在多子域之間無縫銜接實現(xiàn)高層用戶目標,多層級的對話系統(tǒng)對數(shù)據(jù)收集、標注以及模型的開發(fā)都提出了復(fù)雜的要求。有研究人員提出了MultiWOZ數(shù)據(jù)集(包含了旅行相關(guān)的多鄰域?qū)υ拑?nèi)容),但目前卻缺乏對應(yīng)的開源平臺來處理多域多意圖對話。為了加速多領(lǐng)域?qū)υ挼难芯緾onvLab研究了MultiWOZ任務(wù)的特征,并提供了一系列完整的參考模型(包含了獨立的模塊和端到端模型)、這些模型在為用戶對話額外標注的MultiWOZ數(shù)據(jù)集上進行了訓練。ConvLab目前還作為DSTC18多領(lǐng)域端到端對話追蹤的標準平臺,得到了更廣泛的應(yīng)用和實際的檢驗。為了更好的支持端到端評價、ConvLab提供了兩個互補模塊、分別集成了亞馬遜Amazon Mechanical Turk平臺用于人類測評、同時也集成了虛擬用戶用于自動測評。針對用戶仿真,平臺同時提供了基于規(guī)則和基于數(shù)據(jù)驅(qū)動的模擬器。ConvLab在開發(fā)模擬用戶的過程中也研發(fā)出了一系列先進的用戶模擬技術(shù)。
架構(gòu)設(shè)計
整個系統(tǒng)基于模塊化的設(shè)計保障了靈活性和適應(yīng)性。為了支持多領(lǐng)域?qū)υ捪到y(tǒng)的搭建,平臺使用了主體-環(huán)境-對話實體的組合設(shè)計(Agents-Environments-Bodies,AEB),除了單環(huán)境和單主體的配置外,系統(tǒng)還包含了一系列先進的研究實驗、包括多任務(wù)學習、多主體學習和角色扮演、無需復(fù)雜的代碼即可導入到實例中使用。

此外,為了系統(tǒng)性地對比不同的主體和環(huán)境,并實現(xiàn)自動超參數(shù)搜索,平臺充分利用了SLM Lab和Ray^2 作為實驗組件。他們提供了多層級的控制,從會話、嘗試和試驗上為每一層次生成評測報告。
其中會話用于初始化主體和環(huán)境、并以預(yù)設(shè)的輪次運行。隨后利用隨機種子來啟動多個會話進行嘗試、并最終在會話上分析并求平均。最后利用實驗來確定不同超參數(shù)的表現(xiàn)。
對話主體和環(huán)境的配置
在系統(tǒng)中每個層代表了構(gòu)建對話系統(tǒng)的不同方式,在下圖中可以看到最上層代表了傳統(tǒng)方式構(gòu)建對話系統(tǒng)的架構(gòu)路線圖,包括了NLU,DST,POL,NLG。研究人員近年來通過引入詞級對話狀態(tài)追蹤、對話策略和端到端模型等典型組件,探索了構(gòu)建對話系統(tǒng)不同可能的組合實現(xiàn)形式。在ConvLab平臺上,研究人員可以聚焦于下圖中的任意組件,并以端到端的簡單方式進行測試。

對于環(huán)境構(gòu)建來說,可以由很可能的組件來進行構(gòu)建。在研究對話策略優(yōu)化的強化學習算法中,典型的方法是利用用戶模擬器在對話行為層級上進行操作。對話主體會盡可能利用端到端的方式嘗試減小對標注數(shù)據(jù)的需求,對于人類評測來說平臺提供了基于Amazon Mechanical Turk來作為最后一層進行環(huán)境構(gòu)建。

參考模型和跨域數(shù)據(jù)實驗
在ConvLab中還涵蓋了針對多重任務(wù)的模型供研究人員進行參考評測,包括了自然語言理解領(lǐng)域的Semantic Tuple Classi-?er (STC)、 OneNet以及作為拓展的Multi-intent LU (MILU);對話狀態(tài)追蹤引入了DSTCs基準模型、詞級對話狀態(tài)追蹤領(lǐng)域集成了MDBT模型將域識別與置信狀態(tài)追蹤進行結(jié)合;在系統(tǒng)策略方面平臺支持DQN,REINFORCE\PPO以及自模仿等;自然語言生成領(lǐng)域則使用了SC-LSTM方法。在詞級策略上使用了Budzianowski等人提出的基準;在用戶策略上ConvLab提供了基于agenda的方法和基于數(shù)據(jù)驅(qū)動(例如HUS等)的方法,模型在對話行為級別進行并可與NLU等模塊協(xié)同構(gòu)架出完整的用戶模擬器;最后再端到端模型上則包含了Mem2Seq,Sequicity,并使得Sequicity實現(xiàn)了對于多域的支持。目前ConvLab主要支持MultiWOZ和Movie兩個不同復(fù)雜度的數(shù)據(jù)域。其中MultiWOZ的主要任務(wù)是幫助旅客,其中引入了包含景點介紹和酒店預(yù)訂等不同方面的內(nèi)容。MultiWOZ中主要包含了7個子領(lǐng)域的問題:景點、醫(yī)院、酒店、警察、餐廳、出租車、火車等方面的內(nèi)容。其中包含了10438個標注對話。對于單領(lǐng)域和多領(lǐng)域的對話輪次平均為8.93和15.93輪。ConvLab對于用戶對話行為進行了額外的標注、并為對話系統(tǒng)元件和用戶模擬器提供了預(yù)訓練基準模型、以及基于此數(shù)據(jù)訓練的端到端的自然對話模型。Movie則來自于微軟對話挑戰(zhàn)賽,主要集中于電影票預(yù)訂場景,包含了2890個標注對話,評論為7.5輪,同時還提供了針對主體和用戶模擬器的一系列完整的參考模型。研究人員表示在未來還會加入Taxi和Restaurant等領(lǐng)域的任務(wù)不斷豐富平臺支持的領(lǐng)域。
-
微軟
+關(guān)注
關(guān)注
4文章
6744瀏覽量
107950 -
開源
+關(guān)注
關(guān)注
3文章
4244瀏覽量
46273 -
模塊化
+關(guān)注
關(guān)注
0文章
359瀏覽量
22731
原文標題:微軟與清華開源多領(lǐng)域端到端對話系統(tǒng)集成平臺ConvLab,幫助研究人員迅速搭建對話系統(tǒng)
文章出處:【微信號:thejiangmen,微信公眾號:將門創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
MediaTek攜手微軟研究院聯(lián)合開發(fā)有源光纜技術(shù)
端到端智駕模擬軟件推薦——為什么選擇Keymotek的aiSim?
福州移動與華為聯(lián)合推出國內(nèi)首個端到端智能化體驗經(jīng)營系統(tǒng)
廣電計量攜手南山研究院打造大健康產(chǎn)業(yè)新生態(tài)
米爾RK3576部署端側(cè)多模態(tài)多輪對話,6TOPS算力驅(qū)動30億參數(shù)LLM
當經(jīng)典IP撞上AI技術(shù):利爾達助力躍然創(chuàng)新推出全球首款端到端AI互動玩具
“端云+多模態(tài)”新范式:《移遠通信AI大模型技術(shù)方案白皮書》正式發(fā)布
慧鼎科技與吉利汽車研究院成立聯(lián)合創(chuàng)新實驗室
蘇州高新區(qū)聯(lián)合領(lǐng)軍企業(yè)研究院到訪智行者科技
導遠科技與清華大學無錫應(yīng)用技術(shù)研究院達成合作
東風汽車推出端到端自動駕駛開源數(shù)據(jù)集
小米汽車端到端智駕技術(shù)介紹
微軟美國研究院和清華聯(lián)合推出了一款開源的多領(lǐng)域端到端對話系統(tǒng)平臺—ConvLab
評論