91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

講解霍夫曼編碼提出的思路歷程

LiveVideoStack ? 來源:Reducible ? 作者:Reducible ? 2022-05-18 14:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

該視頻詳細(xì)講解了霍夫曼編碼提出的思路歷程。

目錄

故事背景

思路歷程

通信系統(tǒng)示意

衡量信息量

編碼和熵的關(guān)系

香農(nóng)-馮諾編碼

霍夫曼的改進(jìn)

故事背景1951 年,麻省理工學(xué)院的一名研究生 David Huffman 在 Robert Fano 的信息論課程上名列前茅。Fano 教授讓學(xué)生們?cè)谄谀┛荚嚭蛯W(xué)期論文間做出選擇,年輕的 Huffman 在一開始就選擇了學(xué)期論文。論文的題目如圖 1 所示,給定一組數(shù)字或符號(hào),找到最有效的方法來使用二進(jìn)制碼表示它們。

dc71761e-d63f-11ec-bce3-dac502259ad0.png

圖 1 Huffman 的學(xué)期論文題目

在基礎(chǔ)層面上,這是一個(gè)數(shù)據(jù)壓縮問題。事實(shí)上你在計(jì)算機(jī)上看到的文本和圖像本質(zhì)上都是一組字母、數(shù)字或符號(hào),如果將其歸結(jié)為最簡(jiǎn)單的表示形式,那么它們其實(shí)都是一組 0 和 1 的組合,每個(gè)標(biāo)準(zhǔn)的數(shù)據(jù)類型都有一個(gè)標(biāo)準(zhǔn)的位表示。這個(gè)問題的本質(zhì)是將它們壓縮成盡可能少的位數(shù)。這是一個(gè)自計(jì)算出現(xiàn)以來就存在的問題,但 Fano 沒有告訴學(xué)生的是,這在當(dāng)時(shí)是信息論和數(shù)據(jù)壓縮領(lǐng)域的一個(gè)未解決的問題。Huffman 在研究生時(shí)解決了這個(gè)問題,他的解決方案就是大名鼎鼎的霍夫曼編碼算法。

dc95d27a-d63f-11ec-bce3-dac502259ad0.png

圖 2 數(shù)據(jù)壓縮問題

思路歷程通信系統(tǒng)示意在一個(gè)通信系統(tǒng)中,我們通常有一個(gè)信息發(fā)送方和信息接受方。發(fā)送方想要通過網(wǎng)絡(luò)向接受方發(fā)送一些原始信息,但在網(wǎng)絡(luò)中唯一有意義的信息是二進(jìn)制比特。因此,發(fā)送方必須根據(jù)符號(hào)和二進(jìn)制代碼間的某種映射對(duì)原始信息進(jìn)行編碼。而接收方需要對(duì)二進(jìn)制代碼進(jìn)行解碼以恢復(fù)原始信息。

dcb25e04-d63f-11ec-bce3-dac502259ad0.png

圖 3 通信系統(tǒng)示意圖

編碼方法一般針對(duì)從原始信息到二進(jìn)制碼的映射進(jìn)行優(yōu)化,從原始信息到二進(jìn)制碼的映射有一些內(nèi)在要求。一是每個(gè)符號(hào)必須被映射到唯一的二進(jìn)制碼,二是接收方必須能夠準(zhǔn)確解碼出原始信息?;舴蚵幋a算法完全符合這些要求。

衡量信息量對(duì)數(shù)據(jù)進(jìn)行壓縮時(shí),我們需要考慮一種平衡。如果使用太多的比特表示符號(hào),那么會(huì)導(dǎo)致冗余;如果使用太少的比特表示,則會(huì)導(dǎo)致信息丟失,因此最優(yōu)的無損壓縮算法應(yīng)該在兩者之間找到平衡。那么我們首先需要知道在不丟失原始信息的情況下,最大的壓縮率是多少。對(duì)于這個(gè)問題,我們可以理解為,需要找到在原始信息中包含的真正的信息量是多少。那我們?nèi)绾魏饬啃畔⒘康亩嗌倌?

dcedc78c-d63f-11ec-bce3-dac502259ad0.png

圖 4 如何衡量信息量

一句話中包含的信息量與文字的長(zhǎng)度并沒有直接的關(guān)聯(lián)。如圖 5 所示,對(duì)于這兩句話來說,顯然在沙哈拉沙漠下雪所包含的信息量更大,因?yàn)樵谏衬卵┑母怕蕵O小。因此可以想到,事件相關(guān)的信息量與事件發(fā)生的概率有很大的關(guān)系。

dd3df4aa-d63f-11ec-bce3-dac502259ad0.png

圖 5 信息量例子

香農(nóng)根據(jù)信息的性質(zhì)總結(jié)了四個(gè)定律:

信息量的大小跟事件發(fā)生的概率反相關(guān)

信息量永遠(yuǎn)大于等于 0,因?yàn)槭录陌l(fā)生不會(huì)導(dǎo)致信息損失

如果一件事發(fā)生的概率是 100%,那么它不包含任何信息量

如果兩個(gè)不相關(guān)事件被分別觀察到,那么它包含的信息量應(yīng)該是這兩個(gè)事件單獨(dú)信息量的和

香農(nóng)根據(jù)這四個(gè)定律給出了自信息的定義。當(dāng)信息以 bit 為單位時(shí),log 函數(shù)的底數(shù)取 2。

dd8492e8-d63f-11ec-bce3-dac502259ad0.png

圖 6 自信息定義

但香農(nóng)更偉大的貢獻(xiàn)在于將自信息推廣到了更廣的分布上,給出了信息熵的概念,也就是著名的香農(nóng)定理。香農(nóng)定理作為信息論的基礎(chǔ),給出了衡量信息量的標(biāo)準(zhǔn)公式。

ddb9c4b8-d63f-11ec-bce3-dac502259ad0.png

圖 7 香農(nóng)定理

編碼和熵的關(guān)系當(dāng)衡量不同編碼方式的性能時(shí),我們需要計(jì)算不同編碼方式的平均字符長(zhǎng)度。在信息論中,我們通常將符號(hào)編碼的長(zhǎng)度根據(jù)符號(hào)出現(xiàn)的概率進(jìn)行加權(quán)求和得到平均的符號(hào)長(zhǎng)度。香農(nóng)發(fā)現(xiàn),無論對(duì)符號(hào)進(jìn)行哪種方式的無損壓縮編碼,它的長(zhǎng)度總是大于等于信息熵,這就是香農(nóng)的源編碼定理。

de0c53d6-d63f-11ec-bce3-dac502259ad0.png

圖 8 香農(nóng)源編碼定理

香農(nóng)-馮諾編碼香農(nóng)-馮諾編碼首先對(duì)符號(hào)按照概率進(jìn)行升序排列。然后找到最好的分割方法將符號(hào)分為兩組,使得兩組的符號(hào)概率和盡可能接近。之后對(duì)每個(gè)組進(jìn)行遞歸劃分,直到每個(gè)符號(hào)都被單獨(dú)分為一組。

de29f4ae-d63f-11ec-bce3-dac502259ad0.png

圖 9 香農(nóng)-馮諾編碼分組

分完組之后,編碼就變得很簡(jiǎn)單了。從頭部向下,如果向左,那么對(duì)符號(hào)編碼添加 0,向右走則添加 1,最終可以得到所有符號(hào)的二進(jìn)制編碼。而且對(duì)于這個(gè)樹形圖的表示,在解碼端是不會(huì)存在歧義的。

de44cf90-d63f-11ec-bce3-dac502259ad0.png

圖 10 香農(nóng)-馮諾編碼樹形圖

霍夫曼的改進(jìn)但是香農(nóng)-馮諾編碼并不總是最優(yōu)的,在思考最小化平均符號(hào)長(zhǎng)度時(shí),可以想到,兩個(gè)最不可能出現(xiàn)的符號(hào)應(yīng)該出現(xiàn)在二叉樹的最底部,也就是編碼長(zhǎng)度最長(zhǎng)的地方。這符合我們的直覺,那就是最不常出現(xiàn)的符號(hào)應(yīng)該具有更長(zhǎng)的編碼長(zhǎng)度。因此我們可以想到,先將兩個(gè)最不可能出現(xiàn)的符號(hào)放在最底部去構(gòu)建一個(gè)二叉樹,然后將這個(gè)二叉樹的根節(jié)點(diǎn)視作一個(gè)新的符號(hào)節(jié)點(diǎn),該符號(hào)節(jié)點(diǎn)的概率是兩個(gè)子節(jié)點(diǎn)的和。然后對(duì)剩余的符號(hào)節(jié)點(diǎn)做相同的操作,直到構(gòu)建出一個(gè)完整的二叉樹,這就是霍夫曼編碼。

dea4adca-d63f-11ec-bce3-dac502259ad0.png

圖 11 霍夫曼的改進(jìn)1

deb44410-d63f-11ec-bce3-dac502259ad0.png

圖 12 霍夫曼的改進(jìn)2

原文標(biāo)題:[基礎(chǔ)知識(shí)] 霍夫曼編碼

文章出處:【微信公眾號(hào):LiveVideoStack】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

審核編輯:湯梓紅
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 通信系統(tǒng)
    +關(guān)注

    關(guān)注

    6

    文章

    1263

    瀏覽量

    55151
  • 編碼
    +關(guān)注

    關(guān)注

    6

    文章

    1039

    瀏覽量

    56981

原文標(biāo)題:[基礎(chǔ)知識(shí)] 霍夫曼編碼

文章出處:【微信號(hào):livevideostack,微信公眾號(hào):LiveVideoStack】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    hcs301 編碼跳變編碼器應(yīng)用手冊(cè)

    電子發(fā)燒友網(wǎng)站提供《hcs301 編碼跳變編碼器應(yīng)用手冊(cè).pdf》資料免費(fèi)下載
    發(fā)表于 02-09 16:35 ?0次下載

    數(shù)字音頻放大器新思路:MAX98360全方位解析

    數(shù)字脈沖編碼調(diào)制(PCM)輸入D類放大器。它就像一顆新星,在音頻放大領(lǐng)域散發(fā)出獨(dú)特的魅力,為我們帶來了新的設(shè)計(jì)思路和解決方案。 文件下載: MAX98360B.pdf 一、產(chǎn)品概述:性能卓越的數(shù)字音頻利器 MAX98360A/B/C/D可謂是音頻界的“多面手”,它不僅實(shí)現(xiàn)
    的頭像 發(fā)表于 01-16 14:15 ?168次閱讀

    E203在基于wallace樹+booth編碼的乘法器優(yōu)化后的跑分結(jié)果

    優(yōu)化思路 E203為了實(shí)現(xiàn)低功耗的要求,乘法器為基于booth編碼和移位加法器結(jié)合的思路,優(yōu)點(diǎn)是只需要一個(gè)加法器,而且該加法器還和除法器復(fù)用,可以說是將面積縮小到了極致。缺點(diǎn)也很明顯,即使通過
    發(fā)表于 10-27 07:54

    Booth編碼的原理及選擇

    Booth提出該算法的初衷是基于當(dāng)時(shí)計(jì)算機(jī)中的移位運(yùn)算比加法運(yùn)算要快這個(gè)硬件環(huán)境,其目的是通過移位運(yùn)算代替部分加法運(yùn)算來提高乘法運(yùn)算速度。然而,Booth算法更大的優(yōu)勢(shì)在于,它對(duì)有符號(hào)數(shù)和無符號(hào)
    發(fā)表于 10-22 07:53

    絕對(duì)值編碼器與增量式編碼器相比有哪些優(yōu)勢(shì)?

    絕對(duì)值編碼器與增量式編碼器相比有哪些優(yōu)勢(shì)?核心功能:斷電后位置信息不丟失,絕對(duì)值編碼器:通過機(jī)械結(jié)構(gòu)或電子存儲(chǔ)(如電池備份),能實(shí)時(shí)輸出當(dāng)前位置的唯一絕對(duì)值編碼(如二進(jìn)制、格雷碼)。無
    的頭像 發(fā)表于 08-11 13:57 ?1654次閱讀
    絕對(duì)值<b class='flag-5'>編碼</b>器與增量式<b class='flag-5'>編碼</b>器相比有哪些優(yōu)勢(shì)?

    絕對(duì)值編碼器避坑指南:常見選型誤區(qū)之混淆“分辨率”與“精度”,盲目追求高分辨率

    絕對(duì)值編碼器作為精準(zhǔn)定位與運(yùn)動(dòng)控制的核心部件,其選型直接影響設(shè)備的精度、穩(wěn)定性和壽命。但在實(shí)際選型中,由于對(duì)技術(shù)參數(shù)、應(yīng)用場(chǎng)景和產(chǎn)品特性的理解偏差,很容易陷入誤區(qū)。本文針對(duì)絕對(duì)值編碼器選型的常見誤區(qū)之一:混淆“分辨率”與“精度”,盲目追求高分辨率,并提供對(duì)應(yīng)的避坑
    的頭像 發(fā)表于 08-04 11:24 ?1177次閱讀
    絕對(duì)值<b class='flag-5'>編碼</b>器避坑指南:常見選型誤區(qū)之混淆“分辨率”與“精度”,盲目追求高分辨率

    開關(guān)電源維修思路及常見故障

    開關(guān)電源的維修思路及常見故障處理是電子技術(shù)人員需要掌握的重要技能。以下是對(duì)開關(guān)電源維修思路及常見故障的詳細(xì)分析。 ? 一、開關(guān)電源維修思路 1. 斷電檢查: ? ? ● ?外觀檢查:打開電源的外殼
    的頭像 發(fā)表于 08-03 07:38 ?2486次閱讀

    求一份CS32A011K8V7的RS485通訊歷程

    求一份CS32A011K8V7的RS485通訊歷程,郵箱:15317208748@163.com
    發(fā)表于 07-17 08:41

    艾畢勝電子:磁性編碼器突破機(jī)械制造高溫高濕環(huán)境精度衰減難題

    mt6701 在機(jī)械制造領(lǐng)域,高溫高濕環(huán)境一直是制約設(shè)備精度和穩(wěn)定性的重要因素。傳統(tǒng)的光電編碼器在極端環(huán)境下容易出現(xiàn)信號(hào)衰減、元件老化等問題,導(dǎo)致測(cè)量精度大幅下降。然而,近年來磁性編碼器技術(shù)的突破性進(jìn)展,為解決這一難題提供了全新的思路
    的頭像 發(fā)表于 04-30 16:40 ?716次閱讀
    艾畢勝電子:磁性<b class='flag-5'>編碼</b>器突破機(jī)械制造高溫高濕環(huán)境精度衰減難題

    計(jì)算機(jī)網(wǎng)絡(luò)排錯(cuò)思路總結(jié)

    明人不說暗話,這篇文章我們來聊一個(gè)非常有用,同時(shí)也是程序員必備的技能,那就是網(wǎng)絡(luò)排錯(cuò)思路大總結(jié)。
    的頭像 發(fā)表于 04-01 17:32 ?893次閱讀
    計(jì)算機(jī)網(wǎng)絡(luò)排錯(cuò)<b class='flag-5'>思路</b>總結(jié)

    優(yōu)先編碼器:高效數(shù)據(jù)選擇與編碼的解決方案

    在現(xiàn)代數(shù)字電路設(shè)計(jì)中,數(shù)據(jù)的選擇與編碼是不可或缺的重要環(huán)節(jié)。面對(duì)眾多輸入信號(hào),如何高效地選擇并編碼所需數(shù)據(jù),成為設(shè)計(jì)師們面臨的一大挑戰(zhàn)。優(yōu)先編碼器,作為一種獨(dú)特的數(shù)字電路組件,憑借其高效、靈活的特點(diǎn)
    的頭像 發(fā)表于 03-25 08:33 ?1172次閱讀

    csu34f20的歷程

    請(qǐng)問csu34f20的歷程哪里有,請(qǐng)發(fā)到2209453423@qq.com謝謝
    發(fā)表于 03-17 16:07

    集成電路和光子集成技術(shù)的發(fā)展歷程

    本文介紹了集成電路和光子集成技術(shù)的發(fā)展歷程,并詳細(xì)介紹了鈮酸鋰光子集成技術(shù)和硅和鈮酸鋰復(fù)合薄膜技術(shù)。
    的頭像 發(fā)表于 03-12 15:21 ?1969次閱讀
    集成電路和光子集成技術(shù)的發(fā)展<b class='flag-5'>歷程</b>

    編碼器與無軸承編碼器,到底如何選擇?

    在選擇軸編碼器與無軸承編碼器時(shí),需要根據(jù)具體的應(yīng)用場(chǎng)景、性能需求、環(huán)境條件和成本預(yù)算等因素進(jìn)行綜合考慮。以下是對(duì)兩者的詳細(xì)對(duì)比,以幫助做出合適的選擇: 一、工作原理與結(jié)構(gòu) 1. 軸編碼
    的頭像 發(fā)表于 03-11 15:33 ?1325次閱讀
    軸<b class='flag-5'>編碼</b>器與無軸承<b class='flag-5'>編碼</b>器,到底如何選擇?

    伺服電機(jī)編碼器怎么選型

    伺服電機(jī)編碼器的選型是一個(gè)綜合性的過程,需要考慮多個(gè)因素以確保所選編碼器能夠滿足系統(tǒng)的性能要求。以下是一些關(guān)鍵的選型步驟和考慮因素: 一、明確應(yīng)用需求 首先,需要明確伺服電機(jī)編碼器的應(yīng)用需求,包括
    的頭像 發(fā)表于 03-11 12:01 ?2063次閱讀
    伺服電機(jī)<b class='flag-5'>編碼</b>器怎么選型