引言
論辯研究和推理是一個(gè)涉及到邏輯、語(yǔ)言、計(jì)算機(jī)等多學(xué)科領(lǐng)域的過(guò)程,在人工智能興起的時(shí)代,計(jì)算論辯試圖將人類對(duì)于論辯領(lǐng)域的知識(shí)和人工智能結(jié)合起來(lái),用計(jì)算機(jī)深度模型來(lái)挖掘論辯語(yǔ)義、論辯結(jié)構(gòu)等方面,達(dá)到自動(dòng)推理的效果。論辯挖掘是計(jì)算論辯中的一個(gè)重要任務(wù),它的主要任務(wù)有單篇式論辯挖掘,包括提論點(diǎn)分類、論點(diǎn)評(píng)估等;交互式論辯挖掘,包括論點(diǎn)對(duì)抽取等。此次的三篇論文將闡述論辯挖掘在司法領(lǐng)域、論辯領(lǐng)域、同行評(píng)議領(lǐng)域等的證據(jù)鏈支持、反駁證據(jù)評(píng)估、論點(diǎn)對(duì)抽取等方面應(yīng)用。
文章概覽
1.Argumentation-Driven Evidence Association in Criminal Cases
刑事案件中的證據(jù)關(guān)聯(lián)是將一組司法證據(jù)劃分為若干不重疊的子集,提高定罪的可解釋性和合法性??梢杂^察到,分成同一子集的證據(jù)通常支持同一主張。在證據(jù)關(guān)聯(lián)步驟中,此篇文章提出了一種基于論證驅(qū)動(dòng)(argumentation-driven)的監(jiān)督學(xué)習(xí)方法來(lái)計(jì)算證據(jù)對(duì)之間的聯(lián)系。在實(shí)際數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果證明了該方法的有效性。
2. Knowledge-Enhanced Evidence Retrieval for Counterargument Generation
找到對(duì)陳述的反證是許多任務(wù)的關(guān)鍵。此篇文章建立了一個(gè)系統(tǒng),給出一個(gè)陳述,從Web上不同的來(lái)源檢索反證據(jù)。該系統(tǒng)的核心是一個(gè)自然語(yǔ)言推理(natural language inference, NLI)模型,它可以判斷一個(gè)候選句子是否為有效反證。作者提出了一個(gè)知識(shí)增強(qiáng)的NLI模型,旨在通過(guò)整合知識(shí)圖來(lái)處理基于因果關(guān)系和實(shí)例的推理。在實(shí)際數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果證明了該方法的有效性。
3. Argument Pair Extraction with Mutual Guidance and Inter-sentence Relation Graph
此篇文章通過(guò)一個(gè)相互引導(dǎo)的框架來(lái)處理論點(diǎn)對(duì)抽取(APE)任務(wù),利用一個(gè)段落中一個(gè)論點(diǎn)的信息來(lái)指導(dǎo)識(shí)別另一個(gè)段落中可以與之配對(duì)的論點(diǎn)。此外,此篇文章還提出了一個(gè)句間關(guān)系圖來(lái)有效地模擬兩個(gè)句子之間的相互關(guān)系,從而有利于論點(diǎn)對(duì)的提取。實(shí)驗(yàn)結(jié)果表明,我們的方法明顯優(yōu)于目前SOTA的模型。
論文細(xì)節(jié)
1

動(dòng)機(jī)
司法證據(jù)的作用是用來(lái)支持有利于定罪的訴訟請(qǐng)求,證據(jù)描述是刑事判決書(shū)的重要組成部分。然而,在不同的法律文件中,證據(jù)的組織是不同的。證據(jù)關(guān)聯(lián)的形式主要有收集式(collection)和論證驅(qū)動(dòng)式(argumentation-driven)。

在目前大多數(shù)的刑事裁判文書(shū)中,證據(jù)只是以集合的形式羅列出來(lái),沒(méi)有明確的主張,這被認(rèn)為是集合的形式。但僅在5%左右的刑事判決文書(shū)中,依據(jù)相關(guān)主張將證據(jù)收集分為幾個(gè)子集,被認(rèn)為是論證驅(qū)動(dòng)的形式。
由此,此篇文章提出了一項(xiàng)刑事案件中的證據(jù)關(guān)聯(lián)任務(wù),通過(guò)有監(jiān)督的方法學(xué)習(xí)距離度量,無(wú)需額外的人工標(biāo)注即可進(jìn)行后續(xù)證據(jù)的聚類。
任務(wù)定義
給定證據(jù)集合,此篇文章將證據(jù)分為不重疊的個(gè)子集。
模型
(1)聚合方法
每一種情況下的聚類數(shù)量是不同的,所以不能像K-Means方法那樣設(shè)置一個(gè)特定的聚類數(shù)量。作者通過(guò)層次聚類來(lái)聚類證據(jù)(Day and Edelsbrunner, 1984),它可以學(xué)習(xí)停止閾值,該閾值決定何時(shí)停止合并兩個(gè)聚類。
(2)距離度量
本文提出了三種距離度量的概念,分別是Latent Distance、Explicit Distance和Ensemble Distance。
Latent Distance是證據(jù)之間的距離。在不給出明確主張的情況下,只能利用證據(jù)對(duì)的信息來(lái)計(jì)算它們之間的距離。支持同一主張的證據(jù)對(duì)之間的距離被標(biāo)記為0,支持不同主張的證據(jù)對(duì)之間的距離被標(biāo)記為1。
Explicit Distance是證據(jù)與主張之間的距離。證據(jù)和相應(yīng)的主張之間有很強(qiáng)的相關(guān)性,例如,交通事故責(zé)任證明可以支持交通事故的責(zé)任劃分。證據(jù)與相應(yīng)主張的相關(guān)性分值為1,證據(jù)與其他主張的相關(guān)性分值為0。
Latent Distance僅利用證據(jù)之間的語(yǔ)義信息來(lái)計(jì)算相似度。Explicit Distance僅利用證據(jù)與主張之間的推理關(guān)系來(lái)計(jì)算證據(jù)之間的距離。Ensemble Distance將這兩種方法融合在一起,同時(shí)利用證據(jù)之間的語(yǔ)義信息和證據(jù)與主張之間的推理信息,定義為這兩個(gè)距離的加權(quán)和。
數(shù)據(jù)集及實(shí)驗(yàn)
作者以China Judgements Online中已發(fā)表的法律文件構(gòu)建了一個(gè)數(shù)據(jù)集,選擇如下圖所示證據(jù)描述為論證驅(qū)動(dòng)形式的法律文件進(jìn)行實(shí)驗(yàn)。

作者主要采用ESIM和BERT進(jìn)行有監(jiān)督學(xué)習(xí)的距離預(yù)測(cè),結(jié)果如下表所示。

表中的結(jié)果顯示,有監(jiān)督方法的性能較好。同時(shí),BERT模型優(yōu)于ESIM模型??赡艿脑蚴?,支持同一觀點(diǎn)的證據(jù)對(duì)有共現(xiàn)趨勢(shì),這可以在BERT模型的下一個(gè)句子預(yù)測(cè)(next sentence prediction)任務(wù)中學(xué)習(xí)到。
Latent distance算法利用了證據(jù)對(duì)之間的語(yǔ)義信息,其性能優(yōu)于explicit distance。基于ensemble distance的聚類結(jié)果由于整合了證據(jù)對(duì)之間和證據(jù)主張之間的關(guān)系,比單一距離的聚類結(jié)果有很大的提高。

如上圖所示,claim1和claim2分別代表受害人的出生日期和死亡日期。受害者的戶籍證明和死亡證明都能部分支持受害者的身份信息,但由于在使用Latent distance時(shí)只考慮證據(jù)對(duì)之間的關(guān)系,誤將它們聚在一起。Claim4和claim5是相似的,它們都是對(duì)交通事故現(xiàn)場(chǎng)的描述,但由于在使用explicit distance時(shí)幾乎沒(méi)有考慮證據(jù)對(duì)之間的語(yǔ)義關(guān)系,將被告人王某的供述和證人董某的證言誤聚在一起。從而將證據(jù)對(duì)之間的語(yǔ)義關(guān)系與證據(jù)主張之間的信息相結(jié)合,通過(guò)ensemble distance得到的聚類結(jié)果是正確的。
2

動(dòng)機(jī)
先前的研究大多集中于對(duì)長(zhǎng)論點(diǎn)的主要結(jié)論提出反駁。雖然這樣的反駁是有用的,但辯論式的對(duì)話通常是互動(dòng)的,例如,在Change-MyView (CMV)中,挑戰(zhàn)者經(jīng)常引用特定的陳述來(lái)進(jìn)行反駁。因此,本文的目標(biāo)是為論點(diǎn)中的特定陳述找到反證,而不是為一個(gè)完整的論點(diǎn)生成一個(gè)反證。
任務(wù)定義
自然語(yǔ)言推理(natural language inference, NLI)模型是本文的核心,給定一個(gè)要反駁的陳述,系統(tǒng)對(duì)相關(guān)文檔進(jìn)行檢索和排序,然后得到一組反證候選句。對(duì)于每個(gè)候選句,NLI模型決定它和陳述的關(guān)系是否包含、矛盾,或兩者都不是。
模型
在本篇文章中,作者提出了知識(shí)增強(qiáng)NLI模型(KENLI),如下圖所示。

KENLI(圖左)是基于RoBERTa-base ,以一對(duì)前提P和假設(shè)H為輸入,計(jì)算其關(guān)系是蘊(yùn)含、矛盾還是中性的概率。為了連接P和H之間的實(shí)體,知識(shí)增強(qiáng)(Knowledge Enhancement, KE)網(wǎng)被插入到某兩層之間,將RoBERTa分為Encoder1和Encoder2。最后的預(yù)測(cè)是基于【CLS】進(jìn)行的。
KE Net(圖中)利用了知識(shí)圖譜(knowledge graph, KG),其中節(jié)點(diǎn)是實(shí)體,邊是實(shí)體之間的有向關(guān)系。KG目標(biāo)是讓信息通過(guò)KG在P和H的實(shí)體之間流動(dòng)。KE Net是由一堆KE單元組成,每個(gè)KE單元使用兩個(gè)transformer TR1和TR2處理KG上的單跳推理。TR1根據(jù)相鄰實(shí)體更新每個(gè)實(shí)體embedding,TR2根據(jù)實(shí)體embedding更新詞項(xiàng)embedding。本篇文章中使用了兩個(gè)知識(shí)圖譜CauseNet和Wikidata。
數(shù)據(jù)集及實(shí)驗(yàn)
此篇文章的數(shù)據(jù)主要來(lái)自公開(kāi)的NLI數(shù)據(jù)集:MNLI (Williams et al., 2018)、ANLI (Nie et al., 2020b)、SNLI (Bowman et al., 2015)和FEVER-NLI (Nie et al., 2019)。實(shí)驗(yàn)的結(jié)果如下表所示,顯示了每個(gè)模型5次實(shí)驗(yàn)的平均F1得分。

表中可以看出KENLI(6-9行)基本上優(yōu)于Baseline模型(1-5行)。這表明KENLI有效地整合了知識(shí),有利于預(yù)測(cè)陳述之間的關(guān)系。
最后作者建立了反證檢索系統(tǒng),是在DeSePtion (Hidey et al., 2020)的基礎(chǔ)上建立的。如下圖所示。

給定一個(gè)要驗(yàn)證的陳述語(yǔ)句,檢索相關(guān)文檔并對(duì)其進(jìn)行排序,對(duì)候選證據(jù)句進(jìn)行排序,并預(yù)測(cè)該語(yǔ)句是被支持、被反駁還是都不支持。作者通過(guò)提出的知識(shí)增強(qiáng)NLI模型來(lái)強(qiáng)化了最后一個(gè)階段。
3

動(dòng)機(jī)
論點(diǎn)對(duì)抽?。ˋrgument pair extraction, APE)的目的是從討論的兩段中抽取出交互式的論證對(duì)。

以往的研究將該任務(wù)應(yīng)用在同行評(píng)議中,但是缺乏論點(diǎn)對(duì)之間的論點(diǎn)級(jí)別交互的顯式建模。此篇文章通過(guò)一個(gè)相互引導(dǎo)的框架來(lái)處理APE任務(wù),利用一個(gè)段落中一個(gè)論點(diǎn)的信息來(lái)指導(dǎo)識(shí)別另一個(gè)段落中可以與之配對(duì)的論點(diǎn)。此外,此篇文章還提出了一個(gè)句間關(guān)系圖來(lái)有效地模擬兩個(gè)句子之間的相互關(guān)系,從而有利于論點(diǎn)對(duì)的提取。實(shí)驗(yàn)結(jié)果表明,我們的方法明顯優(yōu)于目前SOTA的模型。
模型
此篇文章提出了一個(gè)具有句間關(guān)系圖的APE相互引導(dǎo)框架MGF,如下圖所示。

(1)Inter-sentence Relation Graph
該圖將review和rebuttal中的每一個(gè)句子作為節(jié)點(diǎn),從兩個(gè)角度進(jìn)行構(gòu)建。
In-passage Edge:根據(jù)句子(同一個(gè)段落中)在review/rebuttal段落中的相對(duì)位置,構(gòu)建句子之間的邊。兩個(gè)in-passage句子之間邊的權(quán)重的定義為:
Cross-passage Edge:基于兩句之間的共現(xiàn)詞,構(gòu)建跨段落的句子邊緣。兩個(gè)in-passage句子之間邊的權(quán)重的定義為:
(2)Mutual Guidance Framework
相互引導(dǎo)框架(mutual Guided Framework, MGF)首先使用BERT對(duì)句子進(jìn)行編碼,然后通過(guò)圖卷積得到面向關(guān)系的句子表示法后,使用兩個(gè)相互引導(dǎo)的標(biāo)記器提取論點(diǎn)對(duì)。
數(shù)據(jù)集及實(shí)驗(yàn)
此篇文章使用Cheng等人(2020)提出的Review-Rebuttal (RR)數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),該數(shù)據(jù)集包含從openreview.net收集的4,764篇ICLR的review/rebuttal文本對(duì)。Baseline是Cheng等人(2020)提出的PL-H-LSTM-CRF和MT-H-LSTM-CRF 。實(shí)驗(yàn)的結(jié)果如下表。

從表中可以看出,作者提出的模型MGF在數(shù)據(jù)集上取得了最好的性能。在不使用BERT微調(diào)的情況下,Non-FT-MGF的性能仍然優(yōu)于MT-H-LSTM-CRF,這表明MDF實(shí)現(xiàn)的性能增益不僅僅是由于BERT微調(diào)。通過(guò)對(duì)MGF和Non-FT-MGF的比較,可以發(fā)現(xiàn)BERT微調(diào)可以進(jìn)一步改善模型結(jié)果。
參考文獻(xiàn)
[1] Yefei Teng and WenHan Chao. 2021.Argumentation-Driven Evidence Association in Criminal Cases. InFindings of the Association for Computational Linguistics: EMNLP 2021, pages 2997–3001, Punta Cana, Dominican Republic. Association for Computational Linguistics.
[2] Yohan Jo, Haneul Yoo, JinYeong Bak, Alice Oh, Chris Reed, and Eduard Hovy. 2021.Knowledge-Enhanced Evidence Retrieval for Counterargument Generation. InFindings of the Association for Computational Linguistics: EMNLP 2021, pages 3074–3094, Punta Cana, Dominican Republic. Association for Computational Linguistics.
[3] Jianzhu Bao, Bin Liang, Jingyi Sun, Yice Zhang, Min Yang, and Ruifeng Xu. 2021.Argument Pair Extraction with Mutual Guidance and Inter-sentence Relation Graph. InProceedings of the 2021 Conference on Empirical Methods in Natural Language Processing, pages 3923–3934, Online and Punta Cana, Dominican Republic. Association for Computational Linguistics.
審核編輯 :李倩
-
人工智能
+關(guān)注
關(guān)注
1818文章
50117瀏覽量
265599 -
模型
+關(guān)注
關(guān)注
1文章
3758瀏覽量
52131 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1236瀏覽量
26211
原文標(biāo)題:EMNLP 2021 | 論辯挖掘在不同領(lǐng)域下的應(yīng)用
文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
探索RISC-V在機(jī)器人領(lǐng)域的潛力
Lora技術(shù)應(yīng)用領(lǐng)域
IMU P/N 616-4042在卡特彼勒裝載機(jī)與挖掘機(jī)中的精準(zhǔn)運(yùn)動(dòng)控制與可靠性實(shí)踐
IMU P/N 596-7347在卡特彼勒挖掘機(jī)、裝載機(jī)與物料操作機(jī)中的精準(zhǔn)運(yùn)動(dòng)監(jiān)測(cè)應(yīng)用解析
奧松電子協(xié)辦第二屆智能計(jì)算與數(shù)據(jù)挖掘國(guó)際學(xué)術(shù)會(huì)議
IMU?P/N?470-4959在卡特彼勒挖掘機(jī)和平地機(jī)坡度控制中的應(yīng)用
IMU P/N312-0755在卡特彼勒挖掘機(jī)上的應(yīng)用實(shí)踐
環(huán)氧樹(shù)脂在各領(lǐng)域的應(yīng)用
2025年中國(guó)RFID產(chǎn)業(yè)未挖掘市場(chǎng)深度研究報(bào)告
無(wú)線數(shù)傳模塊助力挖掘機(jī)工廠實(shí)現(xiàn)高效無(wú)線通信系統(tǒng)
用樹(shù)莓派挖掘5種頂級(jí)加密貨幣!
中科曙光與中科星圖在太空計(jì)算領(lǐng)域達(dá)成合作
超聲波換能器:原理與多領(lǐng)域應(yīng)用解析
熱重分析儀在能源領(lǐng)域中的應(yīng)用
論辯挖掘在不同領(lǐng)域下的應(yīng)用
評(píng)論