91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

為何我們不把機器學(xué)習(xí)更廣泛地應(yīng)用在文件壓縮方面呢?

MqC7_CAAI_1981 ? 來源:未知 ? 作者:李倩 ? 2018-11-09 15:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

移動互聯(lián)網(wǎng)時代,人類生產(chǎn)的新數(shù)據(jù)正以指數(shù)級別增長,數(shù)據(jù)中心越來越大,并消耗著地球上難以想象的巨大能耗,但人類依然可能面臨著“數(shù)據(jù)無處存放”的境地。

因此,讓文件變小一點,這絕對是個值得投資的點子。

神劇《硅谷》劇組就選中了這個點子。在劇中,幾個主角的得以創(chuàng)業(yè)成功的核心算法——“魔笛”即是選中了“壓縮”這一多數(shù)人都能理解但對技術(shù)要求頗高的領(lǐng)域:允許用戶在線將圖片壓縮至一半的大小,并依然保持其清晰度。

“魔笛算法”也一度引發(fā)了不少跟風(fēng)打造屬于自己的“魔笛手”,此外,包括谷歌等人工智能巨頭公司近年來也在這個領(lǐng)域頻頻發(fā)力。

2016年,谷歌相關(guān)團隊推出了一款叫RAISR(Rapid and Accurate Image Super-ResoluTIon)的圖像壓縮技術(shù)。希望以人工智能技術(shù)作為壓縮路徑,將圖片大小壓縮到源文件的1/4, 但基本不會改變圖片的清晰度。

盡管引來如此高的關(guān)注,但很多人還是不認可它會在未來的發(fā)展中取得壓倒性的優(yōu)勢。谷歌的RAISR算法也被不好業(yè)內(nèi)認識吐槽說“壓縮一張圖片耗時久”、“壓縮后圖片清晰度沒有那么高”等等。

谷歌機器學(xué)習(xí)工程師、Jetpac創(chuàng)始人Pete Warden近期發(fā)布了一篇文章,認為在短期內(nèi)壓縮算法可能會成為機器學(xué)習(xí)應(yīng)用最可能出現(xiàn)的殺手級應(yīng)用的領(lǐng)域,他從“壓縮”這一技術(shù)的起源開始,希望告訴大家問什么壓縮技術(shù)的前景是如此的廣闊。

大數(shù)據(jù)文摘對這篇文章進行了編譯。

OSDI上的一篇文章“神經(jīng)自適應(yīng)型內(nèi)容感知互聯(lián)網(wǎng)視頻傳輸”激發(fā)了我對這一領(lǐng)域的興趣。

這篇文章告訴我們:通過神經(jīng)網(wǎng)絡(luò),在帶寬相同的條件下,用戶體驗將能提高43%,或者在帶寬縮減17%的條件下可以保持體驗的質(zhì)量基本不變。還有其他同類的論文將類似方法運用在了生成壓縮或自適應(yīng)圖像壓縮等方面。他們都展示出了驚人的成果。那么,為何我們不把機器學(xué)習(xí)更廣泛地應(yīng)用在文件壓縮方面呢?

我們尚未擁有性能配套的計算設(shè)備

上文所提到的所有方法都需要相對較大的神經(jīng)網(wǎng)絡(luò),并且所需的計算量與像素數(shù)量成正比。這意味著大型圖片文件或每秒幀數(shù)較高的視頻文件可能需要比當前廣泛使用的移動設(shè)備更強的計算能力。

現(xiàn)行的大多數(shù)CPU每秒僅能處理百億級的運算,而在高清視頻上用機器學(xué)習(xí)進行壓縮很輕易便能達到十倍于此的計算量。

當然,好消息是目前我們已經(jīng)有了一些硬件解決方案,比如Edge TPU等,可以讓我們看到未來達到更多計算量的可能性。我期待這種壓縮方法能夠運用到各種類型文件的壓縮轉(zhuǎn)換上,從視頻到圖像,到音頻,乃至更多充滿想象力的方式。

自然語言是終極壓縮目標

近來機器學(xué)習(xí)在自然語言處理中取得了大量有趣的成果。這是另一個讓我覺得機器學(xué)習(xí)是較為優(yōu)越的壓縮轉(zhuǎn)換途徑的原因。

如果你稍稍觀察,便會發(fā)現(xiàn)字幕其實是將聲音壓縮為圖像的一種形式。我一直想做一個項目,試圖創(chuàng)造出一種相機,每秒生成一幀字幕,并將所有字幕逐一按行輸出至一個日志文件中。由此便可簡單記錄下基于相機的拍攝內(nèi)容隨時間的推移而發(fā)生的故事,這可以被定義為一個敘事類的傳感器。

我將這一技術(shù)歸類到壓縮方法中的原因是你可以通過生成性的神經(jīng)網(wǎng)絡(luò)將字幕還原為圖像。盡管重新生成的圖像不會跟原圖像完全一致,但也能夠從原圖像繼承一些信息。如果你希望結(jié)果與原圖像盡可能接近,你也可以從風(fēng)格化方面考慮,例如為每個場景生成簡圖。這些技術(shù)的共同特征在于他們提取出了輸入文件中對于我們?nèi)祟愔匾牟糠?,并省略了余下的部分?/p>

不僅僅是圖像

語言世界也有類似的趨勢。語音識別正在迅速改進,合成語音的能力也在迅速提高。識別可以看作是將音頻壓縮為自然語言文本的過程,而合成則恰好相反。你可以想象將對話高度壓縮為自然語言文字而非音頻。誠然,我們不需要達到那種要求,但似乎通過擴展我們對于表達的認知類型,我們可以實現(xiàn)在低帶寬情況下的更好的結(jié)果。

我甚至還發(fā)現(xiàn)一些有趣的將機器學(xué)習(xí)應(yīng)用在文本本身上的可能性。Andrej Karpathy的CHAR-RNN(遞歸神經(jīng)網(wǎng)絡(luò))展示了神經(jīng)網(wǎng)絡(luò)對某些模板進行模仿的優(yōu)越性,而對于壓縮技術(shù)來說,預(yù)測也是相同的道理??紤]到普通的HTML頁面有不少冗余,這一情況下GZIP壓縮方法似乎有很大機率能被機器學(xué)習(xí)改進,盡管我認為這沒有機器學(xué)習(xí)對文本的處理那么容易。

對于壓縮的研究已立項撥款

在我創(chuàng)業(yè)期間,營銷失敗的經(jīng)歷讓我學(xué)到了一件事:如果已經(jīng)有一筆預(yù)算要購買你所推銷的產(chǎn)品,該產(chǎn)品的銷售會容易得多。預(yù)算的存在意味著公司在是否應(yīng)該花錢購買解決方案上已經(jīng)贏得了艱難的斗爭,現(xiàn)在唯一的問題是購買哪種解決方案。

這也是我認為機器學(xué)習(xí)可以在這個領(lǐng)域取得巨大突破的原因之一,因為制造商已經(jīng)擁有專門用于視頻和音頻壓縮的工程師、資金和芯片。如果我們能夠證明將機器學(xué)習(xí)添加到現(xiàn)有解決方案中能夠以一些可度量的方式(例如質(zhì)量、速度或功耗)改進它們,那么它們將被快速采用。

帶寬將會花費用戶和運營商的大量的成本,質(zhì)量和電池壽命將會成為產(chǎn)品的賣點,因此采用機器學(xué)習(xí)改進壓縮的優(yōu)勢將比其他運用更為顯而易見。

許多激動人心的研究表明這種方式將會非常高效,而且我樂觀地認為還有許多應(yīng)用尚未被發(fā)掘。我希望機器學(xué)習(xí)在壓縮中的應(yīng)用將發(fā)展成為一門核心技術(shù)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6254

    瀏覽量

    111448
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4838

    瀏覽量

    107834
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    66

    文章

    8554

    瀏覽量

    136980

原文標題:被《硅谷》選中的“壓縮算法”,為什么說下一個機器學(xué)習(xí)殺手應(yīng)用將由此誕生

文章出處:【微信號:CAAI-1981,微信公眾號:中國人工智能學(xué)會】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    當CW32F030應(yīng)用在1.65V左右的工作電壓時,會出現(xiàn)不穩(wěn)定情況嗎?

    當F030應(yīng)用在1.65V左右的工作電壓時,會出現(xiàn)不穩(wěn)定情況么?
    發(fā)表于 01-15 07:09

    請問CW32低功耗32位微控制器可以應(yīng)用在哪些領(lǐng)域了?

    CW32低功耗32位微控制器可以應(yīng)用在哪些領(lǐng)域了?
    發(fā)表于 01-14 06:30

    CW32F系列MCU主要應(yīng)用在哪些領(lǐng)域了?

    CW32F系列MCU主要應(yīng)用在哪些領(lǐng)域了?有具體的應(yīng)用案例嗎?
    發(fā)表于 01-12 08:06

    機器學(xué)習(xí)和深度學(xué)習(xí)中需避免的 7 個常見錯誤與局限性

    無論你是剛?cè)腴T還是已經(jīng)從事人工智能模型相關(guān)工作一段時間,機器學(xué)習(xí)和深度學(xué)習(xí)中都存在一些我們需要時刻關(guān)注并銘記的常見錯誤。如果對這些錯誤置之不理,日后可能會引發(fā)諸多麻煩!只要
    的頭像 發(fā)表于 01-07 15:37 ?203次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>中需避免的 7 個常見錯誤與局限性

    linux的壓縮和解壓操作

    對于重要的文件我們不會考慮這樣的方式。無損壓縮不會影響文件,所以對于壓縮我們最先考慮的是使用無損
    發(fā)表于 12-23 06:56

    MCUCW32A030C8T7都應(yīng)用在哪些場景?

    車規(guī)級MCUCW32A030C8T7都應(yīng)用在哪些場景?汽車主電機驅(qū)動上面?性能如何?
    發(fā)表于 11-14 06:02

    國產(chǎn)芯硬核實力!D2000飛騰主板賦能更廣泛

    國產(chǎn)主板時至今日,已落地應(yīng)用在多個場景上,比如:政務(wù)服務(wù)大廳,市民輕點自助終端就能完成社保查詢;智能工廠,生產(chǎn)線數(shù)據(jù)實時流轉(zhuǎn)無延遲;銀行網(wǎng)點的自助柜員機24小時精準處理交易。
    的頭像 發(fā)表于 11-10 13:58 ?223次閱讀

    如何促進AI工藝優(yōu)化與協(xié)同應(yīng)用在不同行業(yè)的發(fā)展?

    促進 AI 工藝優(yōu)化與協(xié)同應(yīng)用在不同行業(yè)的發(fā)展,需要從政策支持、技術(shù)研發(fā)、人才培養(yǎng)、場景應(yīng)用等多個方面入手。
    的頭像 發(fā)表于 08-29 10:38 ?945次閱讀
    如何促進AI工藝優(yōu)化與協(xié)同<b class='flag-5'>應(yīng)用在</b>不同行業(yè)的發(fā)展?

    利用NVIDIA推理模型構(gòu)建AI智能體

    開放式推理模型能夠更快、更廣泛地進行思考,為客戶服務(wù)、網(wǎng)絡(luò)安全、制造、物流和機器人等領(lǐng)域的 AI 智能體生成更明智的結(jié)果。
    的頭像 發(fā)表于 08-13 14:32 ?1601次閱讀
    利用NVIDIA推理模型構(gòu)建AI智能體

    FPGA在機器學(xué)習(xí)中的具體應(yīng)用

    ,越來越多地被應(yīng)用于機器學(xué)習(xí)任務(wù)中。本文將探討 FPGA 在機器學(xué)習(xí)中的應(yīng)用,特別是在加速神經(jīng)網(wǎng)絡(luò)推理、優(yōu)化算法和提升處理效率方面的優(yōu)勢。
    的頭像 發(fā)表于 07-16 15:34 ?2903次閱讀

    大模型在半導(dǎo)體行業(yè)的應(yīng)用可行性分析

    的應(yīng)用,比如使用機器學(xué)習(xí)分析數(shù)據(jù),提升良率。 這一些大模型是否真的有幫助 能夠在解決工程師的知識斷層問題 本人純小白,不知道如何涉足這方面 應(yīng)該問什么大模型比較好,或者是看什么視頻能夠涉足這個行業(yè)
    發(fā)表于 06-24 15:10

    CMOS的邏輯門如何應(yīng)用在電路中

    CMOS的邏輯門如何應(yīng)用在電路中 前言 在如今的電子電路中,CMOS邏輯門有著接近零靜態(tài)功耗和超高集成度的特點,是數(shù)字電路不可或缺的存在。其獨特之處在于PMOS與NMOS晶體管的互補設(shè)計:當輸入
    的頭像 發(fā)表于 06-19 16:07 ?1779次閱讀
    CMOS的邏輯門如何<b class='flag-5'>應(yīng)用在</b>電路中

    工業(yè)一體機應(yīng)用在機器視覺領(lǐng)域上都有哪些常見性能優(yōu)勢?

    隨著工業(yè)化的進程和技術(shù)的不斷發(fā)展,工業(yè)機器視覺成為現(xiàn)代工業(yè)生產(chǎn)中不可或缺的一部分。作為工業(yè)機器視覺技術(shù)的核心組件之一,工業(yè)一體機因其便攜、集成度高和易于操作的特點,在工業(yè)機器視覺應(yīng)用中得到廣泛
    的頭像 發(fā)表于 05-06 11:50 ?585次閱讀

    人臉識別終端應(yīng)用在不同領(lǐng)域,有什么優(yōu)勢和注意事項?

    人臉識別技術(shù)已廣泛應(yīng)用在我們日常生活中的方方面面,有著便捷、高效、安全的特點。而且人臉識別可以擺脫一切截止需求,出門就算不帶手機、證件或鑰匙,都能暢通無阻。例如消費支付,以前可能要帶錢包、銀行卡或者
    的頭像 發(fā)表于 04-15 10:24 ?901次閱讀
    人臉識別終端<b class='flag-5'>應(yīng)用在</b>不同領(lǐng)域,有什么優(yōu)勢和注意事項?

    EV12AQ605模數(shù)轉(zhuǎn)換器應(yīng)用在哪些領(lǐng)域?

    EV12AQ605模數(shù)轉(zhuǎn)換器應(yīng)用在哪些領(lǐng)域? EV12AQ605是Teledyne e2v推出的一款12位四通道模數(shù)轉(zhuǎn)換器(ADC),其高采樣率、低延遲、可編程性和廣泛的應(yīng)用領(lǐng)域使其成為多個領(lǐng)域
    發(fā)表于 03-18 10:22