激情五月AV一区二区三区,JJZZ成人免费

引言

論辯研究和推理是一個(gè)涉及到邏輯、語(yǔ)言、計(jì)算機(jī)等多學(xué)科領(lǐng)域的過(guò)程，在人工智能興起的時(shí)代，計(jì)算論辯試圖將人類對(duì)于論辯領(lǐng)域的知識(shí)和人工智能結(jié)合起來(lái)，用計(jì)算機(jī)深度模型來(lái)挖掘論辯語(yǔ)義、論辯結(jié)構(gòu)等方面，達(dá)到自動(dòng)推理的效果。論辯挖掘是計(jì)算論辯中的一個(gè)重要任務(wù)，它的主要任務(wù)有單篇式論辯挖掘，包括提論點(diǎn)分類、論點(diǎn)評(píng)估等；交互式論辯挖掘，包括論點(diǎn)對(duì)抽取等。此次的三篇論文將闡述論辯挖掘在司法領(lǐng)域、論辯領(lǐng)域、同行評(píng)議領(lǐng)域等的證據(jù)鏈支持、反駁證據(jù)評(píng)估、論點(diǎn)對(duì)抽取等方面應(yīng)用。

文章概覽

1.Argumentation-Driven Evidence Association in Criminal Cases

刑事案件中的證據(jù)關(guān)聯(lián)是將一組司法證據(jù)劃分為若干不重疊的子集，提高定罪的可解釋性和合法性?？梢杂^察到，分成同一子集的證據(jù)通常支持同一主張。在證據(jù)關(guān)聯(lián)步驟中，此篇文章提出了一種基于論證驅(qū)動(dòng)（argumentation-driven）的監(jiān)督學(xué)習(xí)方法來(lái)計(jì)算證據(jù)對(duì)之間的聯(lián)系。在實(shí)際數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果證明了該方法的有效性。

2. Knowledge-Enhanced Evidence Retrieval for Counterargument Generation

找到對(duì)陳述的反證是許多任務(wù)的關(guān)鍵。此篇文章建立了一個(gè)系統(tǒng)，給出一個(gè)陳述，從Web上不同的來(lái)源檢索反證據(jù)。該系統(tǒng)的核心是一個(gè)自然語(yǔ)言推理(natural language inference, NLI)模型，它可以判斷一個(gè)候選句子是否為有效反證。作者提出了一個(gè)知識(shí)增強(qiáng)的NLI模型，旨在通過(guò)整合知識(shí)圖來(lái)處理基于因果關(guān)系和實(shí)例的推理。在實(shí)際數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果證明了該方法的有效性。

3. Argument Pair Extraction with Mutual Guidance and Inter-sentence Relation Graph

此篇文章通過(guò)一個(gè)相互引導(dǎo)的框架來(lái)處理論點(diǎn)對(duì)抽取（APE）任務(wù)，利用一個(gè)段落中一個(gè)論點(diǎn)的信息來(lái)指導(dǎo)識(shí)別另一個(gè)段落中可以與之配對(duì)的論點(diǎn)。此外，此篇文章還提出了一個(gè)句間關(guān)系圖來(lái)有效地模擬兩個(gè)句子之間的相互關(guān)系，從而有利于論點(diǎn)對(duì)的提取。實(shí)驗(yàn)結(jié)果表明，我們的方法明顯優(yōu)于目前SOTA的模型。

論文細(xì)節(jié)

動(dòng)機(jī)

司法證據(jù)的作用是用來(lái)支持有利于定罪的訴訟請(qǐng)求，證據(jù)描述是刑事判決書(shū)的重要組成部分。然而，在不同的法律文件中，證據(jù)的組織是不同的。證據(jù)關(guān)聯(lián)的形式主要有收集式（collection）和論證驅(qū)動(dòng)式（argumentation-driven）。

在目前大多數(shù)的刑事裁判文書(shū)中，證據(jù)只是以集合的形式羅列出來(lái)，沒(méi)有明確的主張，這被認(rèn)為是集合的形式。但僅在5%左右的刑事判決文書(shū)中，依據(jù)相關(guān)主張將證據(jù)收集分為幾個(gè)子集，被認(rèn)為是論證驅(qū)動(dòng)的形式。

由此，此篇文章提出了一項(xiàng)刑事案件中的證據(jù)關(guān)聯(lián)任務(wù)，通過(guò)有監(jiān)督的方法學(xué)習(xí)距離度量，無(wú)需額外的人工標(biāo)注即可進(jìn)行后續(xù)證據(jù)的聚類。

任務(wù)定義

給定證據(jù)集合，此篇文章將證據(jù)分為不重疊的個(gè)子集。

模型

（1）聚合方法

每一種情況下的聚類數(shù)量是不同的，所以不能像K-Means方法那樣設(shè)置一個(gè)特定的聚類數(shù)量。作者通過(guò)層次聚類來(lái)聚類證據(jù)(Day and Edelsbrunner, 1984)，它可以學(xué)習(xí)停止閾值，該閾值決定何時(shí)停止合并兩個(gè)聚類。

（2）距離度量

本文提出了三種距離度量的概念，分別是Latent Distance、Explicit Distance和Ensemble Distance。

Latent Distance是證據(jù)之間的距離。在不給出明確主張的情況下，只能利用證據(jù)對(duì)的信息來(lái)計(jì)算它們之間的距離。支持同一主張的證據(jù)對(duì)之間的距離被標(biāo)記為0，支持不同主張的證據(jù)對(duì)之間的距離被標(biāo)記為1。

Explicit Distance是證據(jù)與主張之間的距離。證據(jù)和相應(yīng)的主張之間有很強(qiáng)的相關(guān)性，例如，交通事故責(zé)任證明可以支持交通事故的責(zé)任劃分。證據(jù)與相應(yīng)主張的相關(guān)性分值為1，證據(jù)與其他主張的相關(guān)性分值為0。

Latent Distance僅利用證據(jù)之間的語(yǔ)義信息來(lái)計(jì)算相似度。Explicit Distance僅利用證據(jù)與主張之間的推理關(guān)系來(lái)計(jì)算證據(jù)之間的距離。Ensemble Distance將這兩種方法融合在一起，同時(shí)利用證據(jù)之間的語(yǔ)義信息和證據(jù)與主張之間的推理信息，定義為這兩個(gè)距離的加權(quán)和。

數(shù)據(jù)集及實(shí)驗(yàn)

作者以China Judgements Online中已發(fā)表的法律文件構(gòu)建了一個(gè)數(shù)據(jù)集，選擇如下圖所示證據(jù)描述為論證驅(qū)動(dòng)形式的法律文件進(jìn)行實(shí)驗(yàn)。

作者主要采用ESIM和BERT進(jìn)行有監(jiān)督學(xué)習(xí)的距離預(yù)測(cè)，結(jié)果如下表所示。

表中的結(jié)果顯示，有監(jiān)督方法的性能較好。同時(shí)，BERT模型優(yōu)于ESIM模型?？赡艿脑蚴?，支持同一觀點(diǎn)的證據(jù)對(duì)有共現(xiàn)趨勢(shì)，這可以在BERT模型的下一個(gè)句子預(yù)測(cè)（next sentence prediction）任務(wù)中學(xué)習(xí)到。

Latent distance算法利用了證據(jù)對(duì)之間的語(yǔ)義信息，其性能優(yōu)于explicit distance。基于ensemble distance的聚類結(jié)果由于整合了證據(jù)對(duì)之間和證據(jù)主張之間的關(guān)系，比單一距離的聚類結(jié)果有很大的提高。

如上圖所示，claim1和claim2分別代表受害人的出生日期和死亡日期。受害者的戶籍證明和死亡證明都能部分支持受害者的身份信息，但由于在使用Latent distance時(shí)只考慮證據(jù)對(duì)之間的關(guān)系，誤將它們聚在一起。Claim4和claim5是相似的，它們都是對(duì)交通事故現(xiàn)場(chǎng)的描述，但由于在使用explicit distance時(shí)幾乎沒(méi)有考慮證據(jù)對(duì)之間的語(yǔ)義關(guān)系，將被告人王某的供述和證人董某的證言誤聚在一起。從而將證據(jù)對(duì)之間的語(yǔ)義關(guān)系與證據(jù)主張之間的信息相結(jié)合，通過(guò)ensemble distance得到的聚類結(jié)果是正確的。

動(dòng)機(jī)

先前的研究大多集中于對(duì)長(zhǎng)論點(diǎn)的主要結(jié)論提出反駁。雖然這樣的反駁是有用的，但辯論式的對(duì)話通常是互動(dòng)的，例如，在Change-MyView (CMV)中，挑戰(zhàn)者經(jīng)常引用特定的陳述來(lái)進(jìn)行反駁。因此，本文的目標(biāo)是為論點(diǎn)中的特定陳述找到反證，而不是為一個(gè)完整的論點(diǎn)生成一個(gè)反證。

任務(wù)定義

自然語(yǔ)言推理(natural language inference, NLI)模型是本文的核心，給定一個(gè)要反駁的陳述，系統(tǒng)對(duì)相關(guān)文檔進(jìn)行檢索和排序，然后得到一組反證候選句。對(duì)于每個(gè)候選句，NLI模型決定它和陳述的關(guān)系是否包含、矛盾，或兩者都不是。

模型

在本篇文章中，作者提出了知識(shí)增強(qiáng)NLI模型（KENLI），如下圖所示。

KENLI（圖左）是基于RoBERTa-base ，以一對(duì)前提P和假設(shè)H為輸入，計(jì)算其關(guān)系是蘊(yùn)含、矛盾還是中性的概率。為了連接P和H之間的實(shí)體，知識(shí)增強(qiáng)（Knowledge Enhancement, KE）網(wǎng)被插入到某兩層之間，將RoBERTa分為Encoder1和Encoder2。最后的預(yù)測(cè)是基于【CLS】進(jìn)行的。

KE Net（圖中）利用了知識(shí)圖譜(knowledge graph, KG)，其中節(jié)點(diǎn)是實(shí)體，邊是實(shí)體之間的有向關(guān)系。KG目標(biāo)是讓信息通過(guò)KG在P和H的實(shí)體之間流動(dòng)。KE Net是由一堆KE單元組成，每個(gè)KE單元使用兩個(gè)transformer TR1和TR2處理KG上的單跳推理。TR1根據(jù)相鄰實(shí)體更新每個(gè)實(shí)體embedding，TR2根據(jù)實(shí)體embedding更新詞項(xiàng)embedding。本篇文章中使用了兩個(gè)知識(shí)圖譜CauseNet和Wikidata。

數(shù)據(jù)集及實(shí)驗(yàn)

此篇文章的數(shù)據(jù)主要來(lái)自公開(kāi)的NLI數(shù)據(jù)集：MNLI (Williams et al.， 2018)、ANLI (Nie et al.， 2020b)、SNLI (Bowman et al.， 2015)和FEVER-NLI (Nie et al.， 2019)。實(shí)驗(yàn)的結(jié)果如下表所示，顯示了每個(gè)模型5次實(shí)驗(yàn)的平均F1得分。

表中可以看出KENLI（6-9行）基本上優(yōu)于Baseline模型（1-5行）。這表明KENLI有效地整合了知識(shí)，有利于預(yù)測(cè)陳述之間的關(guān)系。

最后作者建立了反證檢索系統(tǒng)，是在DeSePtion （Hidey et al.， 2020）的基礎(chǔ)上建立的。如下圖所示。

給定一個(gè)要驗(yàn)證的陳述語(yǔ)句，檢索相關(guān)文檔并對(duì)其進(jìn)行排序，對(duì)候選證據(jù)句進(jìn)行排序，并預(yù)測(cè)該語(yǔ)句是被支持、被反駁還是都不支持。作者通過(guò)提出的知識(shí)增強(qiáng)NLI模型來(lái)強(qiáng)化了最后一個(gè)階段。

動(dòng)機(jī)

論點(diǎn)對(duì)抽?。ˋrgument pair extraction, APE）的目的是從討論的兩段中抽取出交互式的論證對(duì)。

以往的研究將該任務(wù)應(yīng)用在同行評(píng)議中，但是缺乏論點(diǎn)對(duì)之間的論點(diǎn)級(jí)別交互的顯式建模。此篇文章通過(guò)一個(gè)相互引導(dǎo)的框架來(lái)處理APE任務(wù)，利用一個(gè)段落中一個(gè)論點(diǎn)的信息來(lái)指導(dǎo)識(shí)別另一個(gè)段落中可以與之配對(duì)的論點(diǎn)。此外，此篇文章還提出了一個(gè)句間關(guān)系圖來(lái)有效地模擬兩個(gè)句子之間的相互關(guān)系，從而有利于論點(diǎn)對(duì)的提取。實(shí)驗(yàn)結(jié)果表明，我們的方法明顯優(yōu)于目前SOTA的模型。

模型

此篇文章提出了一個(gè)具有句間關(guān)系圖的APE相互引導(dǎo)框架MGF，如下圖所示。

（1）Inter-sentence Relation Graph

該圖將review和rebuttal中的每一個(gè)句子作為節(jié)點(diǎn)，從兩個(gè)角度進(jìn)行構(gòu)建。

In-passage Edge：根據(jù)句子（同一個(gè)段落中）在review/rebuttal段落中的相對(duì)位置，構(gòu)建句子之間的邊。兩個(gè)in-passage句子之間邊的權(quán)重的定義為：

Cross-passage Edge：基于兩句之間的共現(xiàn)詞，構(gòu)建跨段落的句子邊緣。兩個(gè)in-passage句子之間邊的權(quán)重的定義為：

（2）Mutual Guidance Framework

相互引導(dǎo)框架（mutual Guided Framework, MGF）首先使用BERT對(duì)句子進(jìn)行編碼，然后通過(guò)圖卷積得到面向關(guān)系的句子表示法后，使用兩個(gè)相互引導(dǎo)的標(biāo)記器提取論點(diǎn)對(duì)。

數(shù)據(jù)集及實(shí)驗(yàn)

此篇文章使用Cheng等人(2020)提出的Review-Rebuttal （RR）數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)，該數(shù)據(jù)集包含從openreview.net收集的4,764篇ICLR的review/rebuttal文本對(duì)。Baseline是Cheng等人(2020)提出的PL-H-LSTM-CRF和MT-H-LSTM-CRF 。實(shí)驗(yàn)的結(jié)果如下表。

從表中可以看出，作者提出的模型MGF在數(shù)據(jù)集上取得了最好的性能。在不使用BERT微調(diào)的情況下，Non-FT-MGF的性能仍然優(yōu)于MT-H-LSTM-CRF，這表明MDF實(shí)現(xiàn)的性能增益不僅僅是由于BERT微調(diào)。通過(guò)對(duì)MGF和Non-FT-MGF的比較，可以發(fā)現(xiàn)BERT微調(diào)可以進(jìn)一步改善模型結(jié)果。

參考文獻(xiàn)

[1] Yefei Teng and WenHan Chao. 2021.Argumentation-Driven Evidence Association in Criminal Cases. InFindings of the Association for Computational Linguistics: EMNLP 2021, pages 2997–3001, Punta Cana, Dominican Republic. Association for Computational Linguistics.

[2] Yohan Jo, Haneul Yoo, JinYeong Bak, Alice Oh, Chris Reed, and Eduard Hovy. 2021.Knowledge-Enhanced Evidence Retrieval for Counterargument Generation. InFindings of the Association for Computational Linguistics: EMNLP 2021, pages 3074–3094, Punta Cana, Dominican Republic. Association for Computational Linguistics.

[3] Jianzhu Bao, Bin Liang, Jingyi Sun, Yice Zhang, Min Yang, and Ruifeng Xu. 2021.Argument Pair Extraction with Mutual Guidance and Inter-sentence Relation Graph. InProceedings of the 2021 Conference on Empirical Methods in Natural Language Processing, pages 3923–3934, Online and Punta Cana, Dominican Republic. Association for Computational Linguistics.

審核編輯：李倩

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴