LLM在生成摘要方面效果到底如何？

來(lái)源：公眾號(hào) 機(jī)器之心授權(quán)

以后文本摘要總結(jié)任務(wù)，可以放心交給大模型了。

文本摘要，作為自然語(yǔ)言生成（NLG）中的一項(xiàng)任務(wù)，主要用來(lái)將一大段長(zhǎng)文本壓縮為簡(jiǎn)短的摘要，例如新聞文章、源代碼和跨語(yǔ)言文本等多種內(nèi)容都能用到。

隨著大模型（LLM）的出現(xiàn)，傳統(tǒng)的在特定數(shù)據(jù)集上進(jìn)行微調(diào)的方法已經(jīng)不在適用。

我們不禁會(huì)問(wèn)，LLM 在生成摘要方面效果到底如何？

為了回答這一問(wèn)題，來(lái)自北京大學(xué)的研究者在論文《 Summarization is (Almost) Dead 》中進(jìn)行了深入的探討。他們使用人類生成的評(píng)估數(shù)據(jù)集評(píng)估了 LLM 在各種摘要任務(wù)（單條新聞、多條新聞、對(duì)話、源代碼和跨語(yǔ)言摘要）上的表現(xiàn)。

在對(duì) LLM 生成的摘要、人工撰寫的摘要和微調(diào)模型生成的摘要進(jìn)行定量和定性的比較后發(fā)現(xiàn)，由 LLM 生成的摘要明顯受到人類評(píng)估者的青睞。

接著該研究在對(duì)過(guò)去 3 年發(fā)表在 ACL、EMNLP、NAACL 和 COLING 上的 100 篇與摘要方法相關(guān)的論文進(jìn)行抽樣和檢查后，他們發(fā)現(xiàn)大約 70% 的論文的主要貢獻(xiàn)是提出了一種總結(jié)摘要方法并在標(biāo)準(zhǔn)數(shù)據(jù)集上驗(yàn)證了其有效性。因此，本文表示「摘要（幾乎）已死（ Summarization is (Almost) Dead ）」。

盡管如此，研究者表示該領(lǐng)域仍然存在挑戰(zhàn)，例如需要更高質(zhì)量的參考數(shù)據(jù)集、改進(jìn)評(píng)估方法等還需要解決。

方法及結(jié)果

該研究使用最新的數(shù)據(jù)來(lái)構(gòu)建數(shù)據(jù)集，每個(gè)數(shù)據(jù)集由 50 個(gè)樣本組成。

例如在執(zhí)行單條新聞、多條新聞和對(duì)話摘要任務(wù)時(shí)，本文采用的方法模擬了 CNN/DailyMail 、Multi-News 使用的數(shù)據(jù)集構(gòu)建方法。對(duì)于跨語(yǔ)言摘要任務(wù)，其策略與 Zhu 等人提出的方法一致。關(guān)于代碼摘要任務(wù)，本文采用 Bahrami 等人提出的方法。

數(shù)據(jù)集構(gòu)建完成之后，接下來(lái)就是方法了。具體來(lái)說(shuō)，針對(duì)單條新聞任務(wù)本文采用 BART 和 T5 ；多條新聞任務(wù)采用 Pegasus 和 BART；T5 和 BART 用于對(duì)話任務(wù)；跨語(yǔ)言任務(wù)使用 MT5 和 MBART ；源代碼任務(wù)使用 Codet5 。

實(shí)驗(yàn)中，該研究聘請(qǐng)人類評(píng)估員來(lái)比較不同摘要的整體質(zhì)量。結(jié)果如圖 1 所示，LLM 生成的摘要在所有任務(wù)中始終優(yōu)于人工生成的摘要和微調(diào)模型生成的摘要。

這就提出了一個(gè)問(wèn)題：為什么 LLM 能夠勝過(guò)人類撰寫的摘要，而傳統(tǒng)上人們認(rèn)為這些摘要是完美無(wú)缺的。此外，經(jīng)過(guò)初步的觀察表明，LLM 生成的摘要表現(xiàn)出高度的流暢性和連貫性。

本文進(jìn)一步招募注釋者來(lái)識(shí)別人類和 LLM 生成摘要句子中的幻覺(jué)問(wèn)題，結(jié)果如表 1 所示，與 GPT-4 生成的摘要相比，人工書寫的摘要表現(xiàn)出相同或更高數(shù)量的幻覺(jué)。在多條新聞和代碼摘要等特定任務(wù)中，人工編寫的摘要表現(xiàn)出明顯較差的事實(shí)一致性。

人工撰寫的摘要和 GPT-4 生成摘要中出現(xiàn)幻覺(jué)的比例，如表 2 所示：

本文還發(fā)現(xiàn)人工編寫的參考摘要存在這樣一個(gè)問(wèn)題，即缺乏流暢性。如圖 2 (a) 所示，人工編寫的參考摘要有時(shí)存在信息不完整的缺陷。并且在圖 2 (b) 中，一些由人工編寫的參考摘要會(huì)出現(xiàn)幻覺(jué)。

本文還發(fā)現(xiàn)微調(diào)模型生成的摘要往往具有固定且嚴(yán)格的長(zhǎng)度，而 LLM 能夠根據(jù)輸入信息調(diào)整輸出長(zhǎng)度。此外，當(dāng)輸入包含多個(gè)主題時(shí)，微調(diào)模型生成的摘要對(duì)主題的覆蓋率較低，如圖 3 所示，而 LLM 在生成摘要時(shí)能夠捕獲所有主題：

由圖 4 可得，人類對(duì)大模型的偏好分?jǐn)?shù)超過(guò) 50%，表明人們對(duì)其摘要有強(qiáng)烈的偏好，并凸顯了 LLM 在文本摘要方面的能力：

　　審核編輯：湯梓紅

閱讀全文

源代碼(69847) 源代碼(69847)
GPT(16772) GPT(16772)
大模型(5063) 大模型(5063)
LLM(1284) LLM(1284)

評(píng)論

對(duì)比解碼在LLM上的應(yīng)用

為了改進(jìn)LLM的推理能力，University of California聯(lián)合Meta AI實(shí)驗(yàn)室提出將Contrastive Decoding應(yīng)用于多種任務(wù)的LLM方法。實(shí)驗(yàn)表明，所提方法能有效改進(jìn)LLM的推理能力。讓我們走進(jìn)論文一探究竟吧！

2023-09-21 11:37:55

1181

低比特量化技術(shù)如何幫助LLM提升性能

針對(duì)大語(yǔ)言模型 (LLM) 在部署過(guò)程中的性能需求，低比特量化技術(shù)一直是優(yōu)化效果最佳的方案之一，本文將探討低比特量化技術(shù)如何幫助 LLM 提升性能，以及新版 OpenVINO 對(duì)于低比特量化技術(shù)的支持。

2023-12-08 15:26:45

2273

使用NVIDIA Triton和TensorRT-LLM部署TTS應(yīng)用的最佳實(shí)踐

針對(duì)基于 Diffusion 和 LLM 類別的 TTS 模型，NVIDIA Triton 和 TensorRT-LLM 方案能顯著提升推理速度。在單張 NVIDIA Ada Lovelace

2025-06-12 15:37:40

1472

探索無(wú)限可能：生成式推薦的演進(jìn)、前沿與挑戰(zhàn)

TL;DR 過(guò)去一年間，生成式推薦取得了長(zhǎng)足的實(shí)質(zhì)性進(jìn)展，特別是在憑借大型語(yǔ)言模型強(qiáng)大的序列建模與推理能力提升整體推薦性能方面。基于LLM（Large Language Models, LLMs

2025-10-20 16:42:35

4874

LLM3225

LLM3225 - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

LLM3225-R15H

LLM3225-R15H - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

LLM3225-R18H

LLM3225-R18H - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

LLM3225-R33H

LLM3225-R33H - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

LLM3225-R56H

LLM3225-R56H - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

LLM3225-R68H

LLM3225-R68H - Wire Wound Chip Inductors - TOKO, Inc

2022-11-04 17:22:44

在生成EXE后，運(yùn)行出現(xiàn)這個(gè)問(wèn)題，求教大神指點(diǎn)是怎么原因，急急急?。。。?！

在生成EXE后，運(yùn)行出現(xiàn)這個(gè)問(wèn)題，求教大神指點(diǎn)是怎么原因，急急急?。。。。∈裁磫?wèn)題？如何解決？！

2015-06-19 17:21:32

在生成系統(tǒng)時(shí)run simulator時(shí)為什么出現(xiàn)the HDL simulator path is n...

在生成系統(tǒng)時(shí)runsimulator時(shí)為什么出現(xiàn)the HDL simulator path is not set.it can be set in the tools >options dialo怎么改

2014-08-13 17:59:28

CC2541 oad 在生成ImageB.bin超過(guò)256k flash？

CC2541oad在生成ImageB.bin超過(guò)256k flash？那個(gè)大神用過(guò)cc2541的 oad功能嗎？？？在生成ImageB.bin時(shí)，ImageB.bin文件過(guò)大，超過(guò)

2016-03-16 14:56:17

DLP3010EVM在生成新的firmware時(shí)不能取消勾選 “Skip changing user defined looks”怎么解決？

板卡：DLP3010EVM 軟件：DLP3010LC 2.1.0.7 在生成新的firmware 時(shí)不能取消勾選 “Skip changing user defined looks”，如下圖，

2025-03-03 07:04:08

DLP660TE在生成4k畫面時(shí)，抖動(dòng)頻率是否可以自行設(shè)定？

我想咨詢一下DLP660TE在生成4k畫面時(shí)，抖動(dòng)頻率是否可以自行設(shè)定，抖動(dòng)的兩幅圖是否可以客戶指定？

2025-02-17 07:20:34

ESP-07 GPIO0在生成clk_out信號(hào)時(shí)卡住了怎么解決？

我正在使用 ESP-07 模塊，即使在執(zhí)行復(fù)位后，GPIO0 引腳仍卡在生成clk_out信號(hào) （26MHz）。可以修復(fù)嗎？或者，芯片壞了？

2024-07-18 07:07:14

LABview在生成表格的時(shí)候，如何同時(shí)給表格加密

用LABVIEW生成表格是很簡(jiǎn)單的事情，但如果在生成表格的同時(shí)用LABVIEW給表格加密，然后繼續(xù)往這個(gè)表格里面寫數(shù)據(jù)，求問(wèn)大神該怎么實(shí)現(xiàn)

2018-04-10 10:09:57

Reset-Handler所需的.text空間是否在生成鏈接文件時(shí)預(yù)先計(jì)算并保留呢？

的地址可能已更改，并且啟動(dòng)文件可能不正確?！癛eset-Handler”所需的“.text”空間是否在生成鏈接文件時(shí)預(yù)先計(jì)算并保留？或者它是一種迭代過(guò)程？gcc 工具鏈的哪個(gè)實(shí)例生成啟動(dòng)文件？謝謝

2023-01-05 09:06:52

labview中生成報(bào)表，運(yùn)行后，怎么一直在生成，停不下來(lái)

本帖最后由 elecfans跑堂于 2015-8-31 09:24 編輯 labview中生成excel報(bào)表，運(yùn)行后，怎么excel一直在生成，停不下來(lái)，求解

2015-08-31 08:49:00

labview怎么在修改項(xiàng)目子vi的時(shí)候?qū)崟r(shí)預(yù)覽項(xiàng)目生成效果，而不是每次生成EXE出來(lái)再看效果？？

labview怎么在修改項(xiàng)目子vi的時(shí)候?qū)崟r(shí)預(yù)覽項(xiàng)目生成效果，而不是每次生成EXE出來(lái)再看效果？？這樣有點(diǎn)麻煩。望大神告知謝謝??！

2018-12-28 17:30:44

pic24f系列用mcc生成的i2c主機(jī)中斷程序怎么使用

在生成的i2c1.c文件中有幾個(gè)函數(shù)，利用中斷進(jìn)行讀寫從機(jī)，按照i2c1.h中的例子無(wú)論怎么改都不正確，每次都只能發(fā)送從機(jī)地址，既不能讀也不能寫。哪位成功過(guò)的朋友給講一下到底怎么回事

2017-04-20 18:10:01

在8168 DVR-RDK中,現(xiàn)在生成的.out 只可以在開發(fā)板上運(yùn)行的,怎么修改能夠生成可在linux的可調(diào)試程序?

本帖最后由一只耳朵怪于 2018-5-25 17:36 編輯在8168 DVR-RDK中,現(xiàn)在生成的.out 只可以在開發(fā)板上運(yùn)行的,怎么修改能夠生成可在linux的可調(diào)試程序?

2018-05-25 08:12:10

在quartus ii 中編寫一個(gè)程序在生成密封元件時(shí)會(huì)報(bào)錯(cuò)

我有一個(gè)問(wèn)題，在quartus ii 中編寫一個(gè)程序，它的輸出是自定義類型，編譯安全通過(guò)，為什么在生成密封元件時(shí)會(huì)報(bào)錯(cuò)，說(shuō)是不支持的類型。有沒(méi)有解決辦法。

2014-02-21 01:18:11

如何配置RTR位以在生成的CAN_NODE_0中接收遠(yuǎn)程幀?

但我們無(wú)法在代碼中配置 RTR 位，能否請(qǐng)你解釋一下如何配置 RTR 位以在生成的 CAN_NODE_0 中接收遠(yuǎn)程幀。

2024-01-19 06:38:58

微波射頻在生活中的應(yīng)用有哪些方面？

　　微波射頻在生活中的應(yīng)用有哪些方面？　　1.網(wǎng)絡(luò)通信，信號(hào)覆蓋以及信息溝通?！　?.微波射頻能產(chǎn)生均勻的能量，也用于烹飪或者加熱食物　　3.因?yàn)槲⒉ㄉ漕l產(chǎn)生的能量可控，可用于穩(wěn)定照明?！　?.在人體健康方面也有相關(guān)應(yīng)用。

2022-03-30 13:51:57

無(wú)法在OVMS上運(yùn)行來(lái)自Meta的大型語(yǔ)言模型（LLM），為什么?

無(wú)法在 OVMS 上運(yùn)行來(lái)自 Meta 的大型語(yǔ)言模型（LLM），例如 LLaMa2。從 OVMS GitHub* 存儲(chǔ)庫(kù)運(yùn)行 llama_chat Python* Demo 時(shí)遇到錯(cuò)誤。

2025-03-05 08:07:06

請(qǐng)問(wèn)Y電容到底怎么接效果才是最好的？

Y電容，到底怎么接效果才是最好的？

2021-03-17 06:42:17

請(qǐng)問(wèn)labview在生成exe時(shí)怎么讓啟動(dòng)項(xiàng)的vi不運(yùn)行？

labview在生成exe時(shí)怎么讓啟動(dòng)項(xiàng)的vi不運(yùn)行？

2018-12-14 11:16:06

請(qǐng)問(wèn)為什么生成FFT ip 核會(huì)卡在生成這一步？

請(qǐng)問(wèn)為什么生成FFT ip 核會(huì)卡在生成這一步，前兩天還好好的。求大神的解決辦法，網(wǎng)上實(shí)在找不到方法

2016-11-01 13:42:43

基于詞頻統(tǒng)計(jì)的多文檔自動(dòng)摘要生成方案

多文檔自動(dòng)摘要技術(shù)可以向用戶提供一個(gè)簡(jiǎn)潔、全面的摘要信息，因此研究多文檔自動(dòng)摘要技術(shù)具有很重要的意義。本文提出了一種上下文敏感的基于詞頻統(tǒng)計(jì)的多文檔自動(dòng)摘要

2009-12-18 16:58:29

SVD的效果到底如何呢？

機(jī)器學(xué)習(xí)中常用的降維方法是主成分分析(PCA)，而主成分分析常用奇異值分解(SVD)。那么SVD的效果到底如何呢？SVD常用來(lái)進(jìn)行圖像的壓縮，我們就來(lái)實(shí)驗(yàn)一下。

2017-02-11 17:19:13

2112

一種自動(dòng)生成循環(huán)摘要的方法

存放的新值來(lái)描述循環(huán)語(yǔ)句的執(zhí)行效果，并將該執(zhí)行效果定義為循環(huán)摘要，同時(shí)，提出一種自動(dòng)生成循環(huán)摘要的方法，可以為操作常用數(shù)據(jù)結(jié)構(gòu)的循環(huán)自動(dòng)生成循環(huán)摘要，包含嵌套循環(huán)．此外，基于循環(huán)摘要，可以自動(dòng)生成循環(huán)語(yǔ)句

2017-12-29 11:12:57

電力通信模型自動(dòng)生成方法及其優(yōu)化

網(wǎng)絡(luò)中的脆弱節(jié)點(diǎn)進(jìn)行補(bǔ)強(qiáng)。仿真實(shí)驗(yàn)結(jié)果顯示這種結(jié)合K-means和脆弱性分析的拓?fù)?b class="flag-6" style="color: red">生成算法在生成對(duì)意外風(fēng)險(xiǎn)具有較強(qiáng)抗性的電力網(wǎng)絡(luò)拓?fù)?b class="flag-6" style="color: red">方面具有比較好的效果。

2018-02-02 17:05:55

圖像生成領(lǐng)域的一個(gè)巨大進(jìn)展,BigGAN的效果真的有那么好嗎？

因此，如果快速瀏覽BigGAN生成的一系列圖像，我們能從中發(fā)現(xiàn)不少圖具有詭異的美感。比如模型在生成下面幾幅景觀圖時(shí)都遵循了從數(shù)據(jù)集中學(xué)到的構(gòu)圖和光影，但當(dāng)這些來(lái)自不同樣本的素材雜糅到一起后，它們給人的感覺(jué)就成了既熟悉又奇怪。

2018-11-21 09:05:59

7022

關(guān)于如何控制變量在生成代碼里的作用分析和介紹

這樣在生成代碼的時(shí)候，參數(shù)p1就會(huì)定義為int32的數(shù)據(jù)類型，并且聲明為extern。而且它的聲明和定義代碼會(huì)分別寫入myHdr.h以及mySrc.c。

2019-09-17 16:18:40

3548

基于圖集成模型的自動(dòng)摘要生產(chǎn)方法

現(xiàn)有長(zhǎng)文本自動(dòng)摘要生成方法存在句子特征單一化和無(wú)法全面衡量句子相似特征的問(wèn)題，導(dǎo)致摘要生成的準(zhǔn)確率降低。為此，提岀一種基于圖集成模型的自動(dòng)摘要生成方法。在計(jì)算得到文本句子詞頻、語(yǔ)義和句法特征后，利用

2021-03-22 14:40:16

在生成中興概念過(guò)程中進(jìn)行規(guī)則提取的算法

決策信息系統(tǒng)的規(guī)則提取是數(shù)據(jù)分析的硏究?jī)?nèi)容之一。形式概念分析是一種教據(jù)分析與信息處理的方法。從決策形式背景出發(fā)，定義綜合概念以及中心概念，提岀了一種在生成中心概念過(guò)程中進(jìn)行規(guī)則提取的算法。在此過(guò)程中

2021-04-07 09:27:45

融合文本分類和摘要的多任務(wù)學(xué)習(xí)摘要模型

文本摘要應(yīng)包含源文本中所有重要信息，傳統(tǒng)基于編碼器-解碼器架構(gòu)的摘要模型生成的摘要準(zhǔn)確性較低。根據(jù)文本分類和文本摘要的相關(guān)性，提出一種多任務(wù)學(xué)習(xí)摘要模型。從文本分類輔助任務(wù)中學(xué)習(xí)抽象信息改善摘要生成

2021-04-27 16:18:58

基于語(yǔ)義感知的中文短文本摘要生成技術(shù)

文本摘要生成技術(shù)能夠從海量數(shù)據(jù)中概括岀關(guān)鍵信息，有效解決用戶信息過(guò)載的問(wèn)題。目前序列到序列模型被廣泛應(yīng)用于英文文本摘要生成領(lǐng)域，而在中文文本摘要生成領(lǐng)域沒(méi)有對(duì)該模型進(jìn)行深λ硏究。對(duì)于傳統(tǒng)的序列到序列

2021-05-28 15:45:25

基于卷積神經(jīng)網(wǎng)絡(luò)的圖像描述生成方法

short-term memory，LSTM）的組合框架在生成圖像描述方面解決了梯度消失和梯度爆炸問(wèn)題，但是基于LSTM的模型依賴序列化的生成描述，無(wú)法在訓(xùn)練時(shí)并行處理，且容易在生成描述時(shí)遺忘先前的信息。為

2021-06-03 14:45:21

基于Patent-Rank的中文專利摘要生成算法

文本摘要任務(wù)旨在通過(guò)對(duì)原文進(jìn)行壓縮提煉，得出簡(jiǎn)明扼要的內(nèi)容描述。針對(duì)中文專利文本，提出了一種基于 PatentRank算法生成專利摘要的算法。首先，對(duì)候選勺群做冗余處理，以去除候選勺群中相似度較高

2021-06-15 17:03:06

受控文本生成模型的一般架構(gòu)及故事生成任務(wù)等方面的具體應(yīng)用

任務(wù)和常識(shí)生成任務(wù)上的具體應(yīng)用，指出了受控文本生成技術(shù)在具體應(yīng)用場(chǎng)景下的改進(jìn)方向。 0. 什么是受控文本生成文本生成任務(wù)是自然語(yǔ)言處理領(lǐng)域十分重要的一類任務(wù)。文本摘要、語(yǔ)法糾錯(cuò)、人機(jī)對(duì)話等很多自然語(yǔ)言處理任務(wù)都可

2021-10-13 09:46:39

4589

生成式摘要的經(jīng)典模型

以往的標(biāo)題模型產(chǎn)生的都是平實(shí)性標(biāo)題，即簡(jiǎn)單語(yǔ)言描述的事實(shí)性標(biāo)題。但是，實(shí)際上我們可能更需要有記憶點(diǎn)的爆款標(biāo)題來(lái)增加點(diǎn)擊量/曝光率。因此，衍生出了一個(gè)新任務(wù)——帶有風(fēng)格的標(biāo)題生成，即 Stylistic Headline Generation，簡(jiǎn)稱 SHG 。

2022-07-08 17:04:49

3378

邱錫鵬團(tuán)隊(duì)提出具有內(nèi)生跨模態(tài)能力的SpeechGPT，為多模態(tài)LLM指明方向

LLM 與通用人工智能（AGI）之間仍存在顯著差距。首先，大多數(shù)當(dāng)前 LLM 只能感知和理解多模態(tài)內(nèi)容，而不能自然而然地生成多模態(tài)內(nèi)容。其次，像圖像和語(yǔ)音這樣的連續(xù)信號(hào)不能直接適應(yīng)接收離散 token 的 LLM。

2023-05-22 14:38:06

1333

LLM性能的主要因素

現(xiàn)在是2023年5月，截止目前，網(wǎng)絡(luò)上已經(jīng)開源了眾多的LLM，如何用較低的成本，判斷LLM的基礎(chǔ)性能，選到適合自己任務(wù)的LLM，成為一個(gè)關(guān)鍵。本文會(huì)涉及以下幾個(gè)問(wèn)題：影響LLM性能的主要因素

2023-05-22 15:26:20

2652

NVIDIA 攜手微軟，在生成式 AI 的新時(shí)代推動(dòng) Windows PC 創(chuàng)新

模型（LLM）應(yīng)用、Stable Diffusion 和 Adobe Firefly 等圖片生成器，以及 NVIDIA DLSS 3 Frame Generation （DLSS 3 幀生成技術(shù)）等

2023-05-25 09:15:02

1255

LLM在各種情感分析任務(wù)中的表現(xiàn)如何

? 最近幾年，GPT-3、PaLM和GPT-4等LLM刷爆了各種NLP任務(wù)，特別是在zero-shot和few-shot方面表現(xiàn)出它們強(qiáng)大的性能。因此，情感分析(SA)領(lǐng)域也必然少不了LLM的影子

2023-05-29 17:24:41

3393

大型語(yǔ)言模型（LLM）的自定義訓(xùn)練：包含代碼示例的詳細(xì)指南

近年來(lái)，像 GPT-4 這樣的大型語(yǔ)言模型（LLM）因其在自然語(yǔ)言理解和生成方面的驚人能力而受到廣泛關(guān)注。但是，要根據(jù)特定任務(wù)或領(lǐng)域定制LLM，定制培訓(xùn)是必要的。本文提供了有關(guān)自定義訓(xùn)練 LLM 的詳細(xì)分步指南，其中包含代碼示例和示例。

2023-06-12 09:35:43

3709

基于Transformer的大型語(yǔ)言模型（LLM）的內(nèi)部機(jī)制

本文旨在更好地理解基于 Transformer 的大型語(yǔ)言模型（LLM）的內(nèi)部機(jī)制，以提高它們的可靠性和可解釋性。隨著大型語(yǔ)言模型（LLM）在使用和部署方面的不斷增加，打開黑箱并了解它們的內(nèi)部

2023-06-25 15:08:49

2367

LLM的長(zhǎng)度外推淺談

蘇神最早提出的擴(kuò)展LLM的context方法，基于bayes啟發(fā)得到的公式

2023-07-28 17:37:43

2584

YouTube正在測(cè)試用人工智能自動(dòng)生成視頻摘要功能

根據(jù)谷歌支持頁(yè)面7月31日的信息顯示，YouTube正在測(cè)試用人工智能（AI）自動(dòng)生成視頻摘要的功能，這是谷歌在探索生成型 AI 技術(shù)的最新嘗試之一。通過(guò)Android Police

2023-08-15 15:58:02

2845

Stability AI發(fā)布首個(gè)用于編程的生成式LLM AI產(chǎn)品—StableCode

Stability AI 近日宣布了他們首個(gè)用于編程的生成式 LLM AI 產(chǎn)品 ——StableCode。該產(chǎn)品旨在幫助程序員完成日常工作，并為新手開發(fā)者提供實(shí)用的學(xué)習(xí)工具。

2023-08-24 11:27:03

1568

Meta發(fā)布一款可以使用文本提示生成代碼的大型語(yǔ)言模型Code Llama

今天，Meta發(fā)布了Code Llama，一款可以使用文本提示生成代碼的大型語(yǔ)言模型（LLM）。

2023-08-25 09:06:57

2439

從原理到代碼理解語(yǔ)言模型訓(xùn)練和推理，通俗易懂，快速修煉LLM

要理解大語(yǔ)言模型（LLM），首先要理解它的本質(zhì)，無(wú)論預(yù)訓(xùn)練、微調(diào)還是在推理階段，核心都是next token prediction，也就是以自回歸的方式從左到右逐步生成文本。

2023-09-19 16:25:47

4283

Medusa如何加速大型語(yǔ)言模型（LLM）的生成？

面對(duì)推測(cè)性解碼的復(fù)雜性，研究人員推出了Medusa技術(shù)，這個(gè)框架回歸了Transformer模型的本質(zhì)，減少了復(fù)雜度，增強(qiáng)了效率，讓每個(gè)生成階段都能快速產(chǎn)出結(jié)果。當(dāng)將Medusa與基于樹的注意機(jī)制結(jié)合時(shí)，生成速度提高了2到3倍。

2023-09-20 11:23:59

1253

LLM的幻覺(jué)問(wèn)題最新綜述

幻覺(jué)被描述為無(wú)意義或不忠實(shí)于所提供源內(nèi)容的生成內(nèi)容。根據(jù)與源內(nèi)容的矛盾，這些幻覺(jué)又進(jìn)一步分為內(nèi)在幻覺(jué)和外在幻覺(jué)。在LLMs中，幻覺(jué)的范圍包含了一個(gè)更廣泛、更全面的概念，主要集中在事實(shí)錯(cuò)誤上。本文重新定義了幻覺(jué)的分類，為LLM應(yīng)用程序提供了一個(gè)更定制的框架。

2023-11-22 17:40:41

2321

從HumanEval到CoderEval: 你的代碼生成模型真的work嗎？

項(xiàng)目中的選取了代碼生成任務(wù)來(lái)構(gòu)建CoderEval，并根據(jù)對(duì)外部依賴的程度為標(biāo)準(zhǔn)將這些任務(wù)分為6個(gè)等級(jí)、根據(jù)生成的目標(biāo)分為3類生成任務(wù)，以更多維地評(píng)估不同大模型在不同上下文場(chǎng)景中的生成效果。實(shí)驗(yàn)結(jié)果表明，這三個(gè)模型在生成自包含函數(shù)方面的效果明顯優(yōu)于其他任務(wù)，但實(shí)際

2023-11-25 15:55:01

2723

全面解析大語(yǔ)言模型（LLM）

internal feedback：使用LLM去預(yù)測(cè)生成的plan取得成功的概率、Tree of Thought去對(duì)比不同的plan（有點(diǎn)類似AlphaGo的蒙特卡諾搜索的意思）、對(duì)中間結(jié)果進(jìn)行評(píng)估并作為長(zhǎng)期記憶存儲(chǔ)

2023-12-05 14:49:47

4560

安霸發(fā)布N1系列生成式AI芯片支持前端設(shè)備運(yùn)行本地LLM應(yīng)用

單顆 SoC 支持 1 至 340 億參數(shù)的多模態(tài)大模型（Multi-Modal LLM）推理，實(shí)現(xiàn)前端低功耗生成式 AI。

2024-01-09 15:19:33

1702

安霸發(fā)布全新N1系列生成式AI芯片

安霸在CES 2024上發(fā)布了全新的N1系列生成式AI芯片，這是一款專門為前端設(shè)備設(shè)計(jì)的芯片，支持本地運(yùn)行大型語(yǔ)言模型（LLM）應(yīng)用。其單顆SoC能夠支持1至340億參數(shù)的多模態(tài)大模型（Multi-Modal LLM）推理，從而實(shí)現(xiàn)低功耗的生成式AI功能。

2024-01-09 15:32:54

2295

2023年LLM大模型研究進(jìn)展

作為做LLM應(yīng)用的副產(chǎn)品，我們提出了RLCD[11]，通過(guò)同時(shí)使用正例和負(fù)例prompt，自動(dòng)生成帶標(biāo)簽的生成樣本不需人工標(biāo)注，然后可以接大模型微調(diào)，或者用于訓(xùn)練reward models

2024-01-19 13:55:33

1006

LLM推理加速新范式！推測(cè)解碼（Speculative Decoding）最新綜述

這個(gè)問(wèn)題隨著LLM規(guī)模的增大愈發(fā)嚴(yán)重。并且，如下左圖所示，目前LLM常用的自回歸解碼（autoregressive decoding）在每個(gè)解碼步只能生成一個(gè)token。這導(dǎo)致GPU計(jì)算資源利用率

2024-01-29 15:54:24

5984

ServiceNow、Hugging Face 和 NVIDIA 發(fā)布全新開放獲取 LLM，助力開發(fā)者運(yùn)用生成式 AI 構(gòu)建企業(yè)應(yīng)用

2024 年 2 月 28 日 - ServiceNow（NYSE：NOW）、Hugging Face 和 NVIDIA 于今日發(fā)布 StarCoder2，其為一系列用于代碼生成的開放獲取大語(yǔ)言模型（LLM

2024-02-29 11:12:58

523

100%在樹莓派上執(zhí)行的LLM項(xiàng)目

ChatGPT的人性口語(yǔ)化回復(fù)相信許多人已體驗(yàn)過(guò)，也因此掀起一波大型語(yǔ)言模型（Large Language Model, LLM）熱潮，LLM即ChatGPT背后的主運(yùn)作技術(shù)，但LLM運(yùn)作需要龐大運(yùn)算力，因此目前多是在云端（Cloud）上執(zhí)行。

2024-02-29 16:29:59

2411

解鎖LLM新高度—OpenVINO? 2024.1賦能生成式AI高效運(yùn)行

LLM 的發(fā)展仍保持著驚人的速度。盡管現(xiàn)有的 LLM 已經(jīng)具備強(qiáng)大的功能，但通過(guò) OpenVINO? 的優(yōu)化和推理加速，可以對(duì)這些復(fù)雜模型的執(zhí)行進(jìn)行精煉，實(shí)現(xiàn)更快、更高效的處理，減少計(jì)算開銷并最大限度發(fā)揮硬件潛力，這將直接導(dǎo)致 LLM 實(shí)現(xiàn)更高的吞吐量和更低的延遲。

2024-05-10 10:36:50

1229

AI初創(chuàng)公司Alembic攻克LLM虛假信息難題

近日，AI領(lǐng)域的創(chuàng)新者Alembic公司宣布了一項(xiàng)重大突破：其全新AI系統(tǒng)成功解決了LLM（大型語(yǔ)言模型）中的虛假信息生成問(wèn)題。這一成就標(biāo)志著長(zhǎng)久以來(lái)困擾LLM的“幻覺(jué)”問(wèn)題被徹底攻克。

2024-06-18 14:26:23

1034

什么是LLM？LLM的工作原理和結(jié)構(gòu)

隨著人工智能技術(shù)的飛速發(fā)展，大型語(yǔ)言模型（Large Language Model，簡(jiǎn)稱LLM）逐漸成為自然語(yǔ)言處理（NLP）領(lǐng)域的研究熱點(diǎn)。LLM以其強(qiáng)大的文本生成、理解和推理能力，在文本生成

2024-07-02 11:45:26

18413

LLM模型的應(yīng)用領(lǐng)域

在本文中，我們將深入探討LLM（Large Language Model，大型語(yǔ)言模型）的應(yīng)用領(lǐng)域。LLM是一種基于深度學(xué)習(xí)的人工智能技術(shù)，它能夠理解和生成自然語(yǔ)言文本。近年來(lái)，隨著計(jì)算能力的提高

2024-07-09 09:52:17

2024

llm模型和chatGPT的區(qū)別

LLM（Large Language Model）是指大型語(yǔ)言模型，它們是一類使用深度學(xué)習(xí)技術(shù)構(gòu)建的自然語(yǔ)言處理（NLP）模型。LLM模型可以處理各種語(yǔ)言任務(wù)，如文本生成、文本分類、機(jī)器翻譯等。目前

2024-07-09 09:55:49

2494

LLM模型和LMM模型的區(qū)別

LLM（線性混合模型）和LMM（線性混合效應(yīng)模型）之間的區(qū)別如下：定義： LLM（線性混合模型）是一種統(tǒng)計(jì)模型，用于分析具有固定效應(yīng)和隨機(jī)效應(yīng)的線性數(shù)據(jù)。它允許研究者考慮數(shù)據(jù)中的非獨(dú)立性，例如

2024-07-09 09:57:46

3828

llm模型有哪些格式

LLM（Large Language Model，大型語(yǔ)言模型）是一種深度學(xué)習(xí)模型，主要用于處理自然語(yǔ)言處理（NLP）任務(wù)。LLM模型的格式多種多樣，以下是一些常見的LLM模型格式

2024-07-09 09:59:52

2008

llm模型本地部署有用嗎

在當(dāng)今的人工智能領(lǐng)域，LLM（Large Language Model，大型語(yǔ)言模型）已經(jīng)成為了一種非常受歡迎的技術(shù)。它們?cè)谧匀徽Z(yǔ)言處理（NLP）任務(wù)中表現(xiàn)出色，如文本生成、翻譯、摘要、問(wèn)答等。然而

2024-07-09 10:14:49

1722

大模型LLM與ChatGPT的技術(shù)原理

與機(jī)器的交互方式。這些技術(shù)通過(guò)深度學(xué)習(xí)和自然語(yǔ)言生成（Natural Language Generation, NLG）的結(jié)合，實(shí)現(xiàn)了對(duì)復(fù)雜語(yǔ)言任務(wù)的高效處理。本文將深入探討大模型LLM和ChatGPT的技術(shù)原理，并通過(guò)代碼示例展示其應(yīng)用。

2024-07-10 10:38:40

12817

LLM預(yù)訓(xùn)練的基本概念、基本原理和主要優(yōu)勢(shì)

理解和生成自然語(yǔ)言的能力，為各種NLP任務(wù)提供了強(qiáng)大的支持。本文將詳細(xì)介紹LLM預(yù)訓(xùn)練的基本概念、基本原理以及主要優(yōu)勢(shì)，并附上相關(guān)的代碼示例。

2024-07-10 11:03:48

4563

LLM大模型推理加速的關(guān)鍵技術(shù)

LLM（大型語(yǔ)言模型）大模型推理加速是當(dāng)前人工智能領(lǐng)域的一個(gè)研究熱點(diǎn)，旨在提高模型在處理復(fù)雜任務(wù)時(shí)的效率和響應(yīng)速度。以下是對(duì)LLM大模型推理加速關(guān)鍵技術(shù)的詳細(xì)探討，內(nèi)容將涵蓋模型壓縮、解碼方法優(yōu)化、底層優(yōu)化、分布式并行推理以及特定框架和工具的應(yīng)用等方面。

2024-07-24 11:38:19

3037

三行代碼完成生成式AI部署

LLM加載與推理部署能力，實(shí)現(xiàn)了OpenVINO對(duì)CNN網(wǎng)絡(luò)、生成式模型、LLM網(wǎng)絡(luò)主流模型的全面推理支持。

2024-08-30 16:49:58

1273

基于Arm平臺(tái)的服務(wù)器CPU在LLM推理方面的能力

在過(guò)去一年里，生成式人工智能 (AI) 吸引了科技行業(yè)的目光，大家都在想方設(shè)法地將大語(yǔ)言模型 (LLM) 部署到其位于云端和邊緣側(cè)服務(wù)器上的應(yīng)用中。雖然 GPU 和加速器憑借優(yōu)異的性能，一直是這些

2024-09-02 10:39:14

1386

LLM和傳統(tǒng)機(jī)器學(xué)習(xí)的區(qū)別

在人工智能領(lǐng)域，LLM（Large Language Models，大型語(yǔ)言模型）和傳統(tǒng)機(jī)器學(xué)習(xí)是兩種不同的技術(shù)路徑，它們?cè)谔幚頂?shù)據(jù)、模型結(jié)構(gòu)、應(yīng)用場(chǎng)景等方面有著顯著的差異。 1. 模型結(jié)構(gòu)

2024-11-08 09:25:41

2941

使用LLM進(jìn)行自然語(yǔ)言處理的優(yōu)缺點(diǎn)

自然語(yǔ)言處理（NLP）是人工智能和語(yǔ)言學(xué)領(lǐng)域的一個(gè)分支，它致力于使計(jì)算機(jī)能夠理解、解釋和生成人類語(yǔ)言。大型語(yǔ)言模型（LLM）是NLP領(lǐng)域的一項(xiàng)重要技術(shù)，它們通過(guò)深度學(xué)習(xí)和大量的數(shù)據(jù)訓(xùn)練，能夠執(zhí)行各種

2024-11-08 09:27:05

3893

LLM技術(shù)對(duì)人工智能發(fā)展的影響

。一、LLM技術(shù)在人工智能領(lǐng)域的應(yīng)用自然語(yǔ)言處理（NLP） LLM技術(shù)在自然語(yǔ)言處理領(lǐng)域發(fā)揮著重要作用。通過(guò)訓(xùn)練模型識(shí)別和生成語(yǔ)言模式，LLM技術(shù)使得機(jī)器能夠執(zhí)行語(yǔ)言翻譯、情感分析、文本摘要等任務(wù)，極大地提高了語(yǔ)言處理的準(zhǔn)確性和效率。

2024-11-08 09:28:34

2537

如何訓(xùn)練自己的LLM模型

訓(xùn)練自己的大型語(yǔ)言模型（LLM）是一個(gè)復(fù)雜且資源密集的過(guò)程，涉及到大量的數(shù)據(jù)、計(jì)算資源和專業(yè)知識(shí)。以下是訓(xùn)練LLM模型的一般步驟，以及一些關(guān)鍵考慮因素：定義目標(biāo)和需求：確定你的LLM將用

2024-11-08 09:30:00

2053

什么是LLM？LLM在自然語(yǔ)言處理中的應(yīng)用

所未有的精度和效率處理和生成自然語(yǔ)言。 LLM的基本原理 LLM基于深度學(xué)習(xí)技術(shù)，尤其是變換器（Transformer）架構(gòu)。變換器模型因其自注意力（Self-Attention）機(jī)制而聞名，這種機(jī)制使得模型能夠捕捉文本中的長(zhǎng)距離依賴關(guān)系。LLM通過(guò)在大規(guī)模語(yǔ)料庫(kù)上

2024-11-19 15:32:24

4615

恩智浦如何在邊緣設(shè)備上部署LLM

近來(lái)，與AI相關(guān)的周期性熱點(diǎn)幾乎都圍繞著大語(yǔ)言模型 (LLM) 和生成式AI模型，這樣的趨勢(shì)反映出這些話題近年來(lái)日益增強(qiáng)的影響力和普及程度。與大語(yǔ)言模型和生成式AI模型相關(guān)的應(yīng)用涵蓋了廣泛的領(lǐng)域，從

2024-11-29 09:39:17

1429

京東廣告生成式召回基于 NVIDIA TensorRT-LLM 的推理加速實(shí)踐

、個(gè)性化召回、深度召回等），以召回大量候選商品。隨后，系統(tǒng)通過(guò)相對(duì)簡(jiǎn)單的粗排模型對(duì)候選集進(jìn)行初步篩選，縮小候選范圍，最后通過(guò)精排和重排模型，確定最終返回給用戶的推薦結(jié)果。隨著大語(yǔ)言模型（LLM）在推薦系統(tǒng)中的應(yīng)用，生成

2025-01-14 15:17:05

1107

利用OpenVINO GenAI解鎖LLM極速推理

隨著 DeepSeek、 GPT 和 Llama 等大語(yǔ)言模型（LLMs）不斷推動(dòng)人工智能的邊界，它們?cè)诟咝Р渴?b class="flag-6" style="color: red">方面也帶來(lái)了重大挑戰(zhàn)。這些模型在生成類似人類的文本方面具有革命性，但每生成一個(gè)

2025-03-18 14:09:02

992

詳解 LLM 推理模型的現(xiàn)狀

領(lǐng)域的最新研究進(jìn)展，特別是自DeepSeekR1發(fā)布后興起的推理時(shí)間計(jì)算擴(kuò)展相關(guān)內(nèi)容。在LLM中實(shí)施和改進(jìn)推理簡(jiǎn)單來(lái)說(shuō)，基于LLM的推理模型是一種旨在通過(guò)生成中間

2025-04-03 12:09:48

1383

小白學(xué)大模型：從零實(shí)現(xiàn) LLM語(yǔ)言模型

在當(dāng)今人工智能領(lǐng)域，大型語(yǔ)言模型（LLM）的開發(fā)已經(jīng)成為一個(gè)熱門話題。這些模型通過(guò)學(xué)習(xí)大量的文本數(shù)據(jù)，能夠生成自然語(yǔ)言文本，完成各種復(fù)雜的任務(wù)，如寫作、翻譯、問(wèn)答等。https

2025-04-30 18:34:25

1138

LM Studio使用NVIDIA技術(shù)加速LLM性能

隨著 AI 使用場(chǎng)景不斷擴(kuò)展（從文檔摘要到定制化軟件代理），開發(fā)者和技術(shù)愛好者正在尋求以更快、更靈活的方式來(lái)運(yùn)行大語(yǔ)言模型（LLM）。

2025-06-06 15:14:07

920

NVIDIA recsys-examples在生成式推薦系統(tǒng)中的高效實(shí)踐

在生成式 AI 浪潮的推動(dòng)下，推薦系統(tǒng)領(lǐng)域正經(jīng)歷深刻變革。傳統(tǒng)的深度學(xué)習(xí)推薦模型 (DLRMs) 雖已展現(xiàn)出一定效果，但在捕捉用戶興趣偏好和動(dòng)態(tài)行為序列變化時(shí)，常面臨可擴(kuò)展性挑戰(zhàn)。生成式推薦系統(tǒng) (Generative Recommenders, GRs) 的出現(xiàn)，為這一領(lǐng)域帶來(lái)了全新思路與機(jī)遇。

2025-07-04 14:43:07

936

NVIDIA TensorRT LLM 1.0推理框架正式上線

TensorRT LLM 作為 NVIDIA 為大規(guī)模 LLM 推理打造的推理框架，核心目標(biāo)是突破 NVIDIA 平臺(tái)上的推理性能瓶頸。為實(shí)現(xiàn)這一目標(biāo)，其構(gòu)建了多維度的核心實(shí)現(xiàn)路徑：一方面，針對(duì)需

2025-10-21 11:04:24

923

已全部加載完成

91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲日韩欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

搜索歷史

LLM在生成摘要方面效果到底如何？

評(píng)論

搜索歷史

LLM在生成摘要方面效果到底如何？

評(píng)論

LLM在生成摘要方面效果到底如何？