91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

M1芯片如此之快 蘋果是否采用了一些非同尋常的技術(shù)

ss ? 來源:OFweek物聯(lián)網(wǎng) ? 作者:OFweek物聯(lián)網(wǎng) ? 2020-12-18 10:20 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在現(xiàn)實(shí)世界一次又一次的測試中,M1 Macs 不僅超越了頂配的英特爾 Mac,而且還徹底擊垮了這些電腦。很多人都覺得不可思議,他們開始探究這到底是怎么回事?

從技術(shù)的角度來看,為什么 M1 芯片會如此之快?

蘋果是否采用了一些非同尋常的技術(shù)?

對于英特爾和 AMD 等競爭對手來說,采用相同的技術(shù)是否也很容易?

當(dāng)然,你可以在網(wǎng)上搜索這些問題的答案,但如果你想深入了解蘋果所做出的努力,那么可能很快就會被高度專業(yè)的技術(shù)術(shù)語淹沒。例如 M1 使用了非常寬的指令解碼器、巨大的重排序緩沖區(qū)(ROB)等等。除非你非常了解 CPU 硬件,否則大多數(shù)文章對你來說都是天書。

為了方便理解,下面我來簡要介紹一下有關(guān) M1 芯片的基礎(chǔ)知識。

什么是微處理器(CPU)?

通常,我們談?wù)摰挠⑻貭柵c AMD 芯片指的都是中央處理器(CPU),或稱微處理器。這些芯片從內(nèi)存獲取指令,然后按照順序執(zhí)行每條指令。

圖:一個非?;镜?RISC CPU(不是 M1)

指令從存儲器(memory)沿藍(lán)色箭頭移動到指令寄存器(register),然后由解碼器(decoder)解析指令,并通過紅色控制線啟動CPU的不同部分,最后由運(yùn)算器(ALU)將寄存器中的數(shù)字相加或相減。

最基本的CPU包含一系列寄存器(register)和若干運(yùn)算器(ALU),其中寄存器是命名的存儲單元,而運(yùn)算器則是計算單元。ALU 可以執(zhí)行加法、減法以及其他基本數(shù)學(xué)運(yùn)算之類的操作。但是,ALU 只連接到 CPU 寄存器。如果要想執(zhí)行兩個數(shù)字相加的運(yùn)算,則必須從內(nèi)存中獲取這兩個數(shù)字并放入 CPU 的兩個寄存器中。

以下是 M1 上的 RISC CPU 執(zhí)行的一些常見的指令示例:

上述 r1 和 r2 就是我們所說的寄存器?,F(xiàn)代 RISC CPU 無法針對位于寄存器之外的數(shù)字進(jìn)行這樣的操作。例如,它不能將內(nèi)存中兩個不同位置的數(shù)字相加。相反,它必須將這兩個數(shù)字放入單獨(dú)的寄存器中。這就是上述示例中的前兩條指令。我們從內(nèi)存地址 150 中提取數(shù)字,并將其放入 CPU 的寄存器 r1 中。接下來,我們將地址 200 中的數(shù)字放入寄存器 r2 中。只有這樣,兩個數(shù)字才能通過指令 add r1,r2 相加。

擁有兩個寄存器、累加器和輸入寄存器?,F(xiàn)代 CPU 通常擁有十幾個寄存器,而且是電子的。

寄存器的概念很早以前就有了。例如,在上圖的舊式機(jī)械計算器中,寄存器是保存兩個加數(shù)的地方。寄存器就是存放數(shù)字的地方。

M1 不是 CPU!

了解 M1 的時候,需要注意一點(diǎn):

M1 不是 CPU,它是一個集成了多個芯片的整體系統(tǒng)。而 CPU 只是其中一個芯片。

簡單來說,M1 就是將一臺完整的計算機(jī)集成到了一個芯片上。M1 包含 CPU、圖形處理單元(GPU)、內(nèi)存、輸入和輸出控制器以及構(gòu)成一臺整體計算機(jī)的許多其他組件。這就是我們所說的單片系統(tǒng)(System on a Chip,即SoC)。

如今,購買英特爾或 AMD 的芯片時,實(shí)際上你得到的是一個封裝了多個微處理器的芯片。過去,計算機(jī)的諸多芯片會分散加載到主板上。

內(nèi)存、CPU、顯卡、IO 控制器、網(wǎng)卡以及許多其他組件都連接到了主板上,可以相互通信。

然而,由于如今我們能夠在一塊硅片上放置非常多的晶體管,因此英特爾和AMD等公司紛紛開始將多個微處理器集成到一個芯片上。我們稱這些芯片為CPU核心。一個核心基本上就是一個完全獨(dú)立的芯片,可以從內(nèi)存中讀取指令并執(zhí)行計算。

圖:擁有多個CPU核心的微芯片

長期以來,要想提高性能,只需添加更多通用 CPU 核心即可。然而,如今情況發(fā)生了變化,CPU 市場的一位商家開始偏離這種趨勢。

蘋果的異構(gòu)計算策略并沒有那么神秘

蘋果并沒有選擇增加通用 CPU 核心,他們采取了另一種策略:添加越來越多專用芯片來完成一些專門的任務(wù)。這樣做的好處是,與通用 CPU 核心相比,專用芯片能夠更快地完成任務(wù),而且耗電量更少。

這不是一個全新的做法。多年來,英偉達(dá)和 AMD 的顯卡中都搭載了圖形處理單元(GPU)等專用芯片,這些芯片執(zhí)行與圖形相關(guān)的操作要比通用 CPU 快許多。

蘋果所做的只是更大膽地朝這個方向轉(zhuǎn)變。M1 不僅具有通用核心和存儲器,而且還包含各種專用芯片:

中央處理單元(CPU):單片系統(tǒng)的大腦。負(fù)責(zé)運(yùn)行操作系統(tǒng)和應(yīng)用程序的大多數(shù)代碼。

圖形處理單元(GPU):處理與圖形相關(guān)的任務(wù)。例如顯示應(yīng)用程序的用戶界面,以及 2D/3D 游戲等。

圖像處理單元(ISP):可用于加速圖像處理應(yīng)用程序的常見任務(wù)。

數(shù)字信號處理器(DSP):能夠比 CPU 更好地處理需要大量數(shù)學(xué)運(yùn)算的任務(wù)。包括解壓縮音樂文件等。

神經(jīng)處理單元(NPU):用于高端智能手機(jī),可加速機(jī)器學(xué)習(xí)AI)任務(wù)。包括語音識別和相機(jī)處理。

視頻編碼器/解碼器:處理視頻文件和格式的轉(zhuǎn)換,且耗能更低。

安全領(lǐng)域:加密、身份認(rèn)證以及安全性。

統(tǒng)一內(nèi)存:允許 CPU、GPU 和其他核心快速交換信息。

這就是為什么許多人在使用 M1 Mac 進(jìn)行圖像和視頻編輯時,都能看到速度提升的部分原因。他們執(zhí)行的許多任務(wù)可以直接在專用硬件上運(yùn)行。因此,價格低廉的 M1 Mac Mini 輕而易舉就能夠編碼大型視頻文件,而昂貴的 iMac 即便所有風(fēng)扇都全力運(yùn)轉(zhuǎn)也趕不上。

在藍(lán)色區(qū)域內(nèi),你可以看到多個 CPU 核心可以同時訪問內(nèi)存,而在綠色框內(nèi),大量 GPU 核心在訪問內(nèi)存。

你可能不太理解統(tǒng)一內(nèi)存。共享內(nèi)存與統(tǒng)一內(nèi)存有何不同?過去,人們不是不贊成視頻內(nèi)存與主內(nèi)存共享嗎?因為這會導(dǎo)致性能降低。的確,共享內(nèi)存確實(shí)不好。原因是 CPU 和 GPU 必須輪流訪問內(nèi)存。共享意味著二者要爭用數(shù)據(jù)總線。簡單來說,GPU 和 CPU 必須輪流使用狹窄的管道來存儲或提取數(shù)據(jù)。

但統(tǒng)一內(nèi)存的情況不一樣。在統(tǒng)一內(nèi)存中,GPU 核心和 CPU 核心可以同時訪問內(nèi)存。因此,共享內(nèi)存沒有額外開銷。另外,CPU 和 GPU 可以互相通知數(shù)據(jù)在內(nèi)存中的位置。以前,CPU 必須將數(shù)據(jù)從主內(nèi)存區(qū)域復(fù)制到 GPU 使用的區(qū)域。但在統(tǒng)一內(nèi)存中,CPU 會告知 GPU:“我從內(nèi)存地址 2430 開始放置了30MB 的多邊形數(shù)據(jù)?!倍?GPU 無需復(fù)制就可以使用這段內(nèi)存。

這意味著,由于 M1 上各種特殊的處理器都可以使用相同的內(nèi)存池,并快速交換信息,因此可以大幅提升性能。

在統(tǒng)一內(nèi)存出現(xiàn)之前,Mac 使用 GPU 的方式。你甚至可以選用計算機(jī)外部安裝的顯卡(通過 Thunderbolt 3 線安裝)。有人猜測未來這種情況仍有可能出現(xiàn)。

為什么英特爾和 AMD 不使用相同的戰(zhàn)略?

既然蘋果的做法如此聰明,為何大家不照搬呢?從某種程度上來說,有些人確實(shí)在照抄蘋果。有些 ARM 芯片制造商在專用硬件上的投資越來越多。

AMD還嘗試在某些芯片上安裝功能更強(qiáng)大的GPU,并逐步采用加速處理單元(APU),向著單片系統(tǒng)邁進(jìn),這些處理器的CPU核心和GPU核心基本上都位于同一個芯片之上。

AMD Ryzen 加速處理單元(APU)在一塊芯片上集成了 CPU 和 GPU(Radeon Vega)。但是不包含其他協(xié)同處理器、IO 控制器或統(tǒng)一內(nèi)存。

然而,還有一些重要的原因致使他們無法完全貫徹蘋果的做法。單片系統(tǒng)本質(zhì)上是在一塊芯片上構(gòu)建整個計算機(jī)。因此,這種做法更適合于真正的計算機(jī)制造商,比如惠普和戴爾等。我用汽車來做一個簡單的類比:如果你的業(yè)務(wù)模型是制造和銷售汽車發(fā)動機(jī),那么對你來說,制造和銷售整車將是一次不尋常的飛躍。

相比之下,這對于 ARM 來說并不是大問題。戴爾或惠普等計算機(jī)制造商只需要購買 ARM 和其他廠商芯片的授權(quán),就可以利用各種專用硬件制作自己的單片系統(tǒng)。接下來,他們將完成的設(shè)計移交給 GlobalFoundries 或臺積電等半導(dǎo)體代工廠,這些工廠如今就在為 AMD 和蘋果生產(chǎn)芯片。

在英特爾和 AMD 的商業(yè)模式下,我們遇到了一個很大的問題。他們的商業(yè)模式的基礎(chǔ)是銷售通用 CPU,人們只需將其插入大型 PC 主板即可。因此,計算機(jī)制造商只需從其他供應(yīng)商那里購買主板、內(nèi)存、CPU 和顯卡,并將這些芯片集成到一個解決方案中。

但是,如今的發(fā)展趨勢正在迅速遠(yuǎn)離這種模式。在新的單片系統(tǒng)世界中,你無需組裝來自不同供應(yīng)商的物理組件。相反,你需要組裝不同供應(yīng)商的知識產(chǎn)權(quán)。首先,你需要從各個供應(yīng)商那里購買顯卡、CPU、調(diào)制解調(diào)器、IO 控制器和其他產(chǎn)品的設(shè)計,并將其用于內(nèi)部的單片系統(tǒng)設(shè)計。然后,再通過某家代工廠來生產(chǎn)。

那么,問題來了:因為英特爾、AMD 或英偉達(dá)都不會向戴爾或惠普發(fā)放知識產(chǎn)權(quán)許可,不會給他們機(jī)會制造自己的單片系統(tǒng)。

當(dāng)然,英特爾和 AMD 可能也會銷售完整的單片系統(tǒng)。但是其中包含什么呢?每個 PC 制造商對單片系統(tǒng)所包含的內(nèi)容可能都有各自的看法。英特爾、AMD、微軟和 PC 制造商之間可能會出現(xiàn)沖突,因為這些芯片需要軟件支持。

對于蘋果來說,這并不是什么難事,因為他們控制著所有環(huán)節(jié)。例如,他們?yōu)殚_發(fā)人員提供了 Core ML 庫,方便他們編寫機(jī)器學(xué)習(xí)代碼。至于 Core ML 是在蘋果的 CPU 上運(yùn)行還是在 Neural Engine 上運(yùn)行,并不是開發(fā)人員所關(guān)心的實(shí)現(xiàn)細(xì)節(jié)。

加快 CPU 運(yùn)行的根本難題

因此,異構(gòu)計算是 M1 芯片實(shí)現(xiàn)高性能的部分原因,但不是唯一的原因。M1 芯片上的通用 CPU 核心 Firestorm 確實(shí)非??臁_@是 Firestorm 與過去的ARM CPU 的一個重大差異,過去的 ARM CPU 核心與 AMD 和英特爾的核心相比非常弱。

然而,F(xiàn)irestorm 擊敗了大多數(shù)英特爾核心,而且?guī)缀鯌?zhàn)勝了最快的 AMD Ryzen 核心。按照傳統(tǒng)經(jīng)驗來看,這種情況并不會發(fā)生。

在討論 Firestorm 運(yùn)行速度如此之快的原因之前,我們先來了解一下哪些核心理念可以真正加快 CPU 的速度。

原則上,你可以結(jié)合以下兩種策略來加快 CPU 的速度:

快速執(zhí)行更多指令。

并行執(zhí)行大量指令。

在上個世紀(jì) 80 年代,快速執(zhí)行更多指令很容易。只要增加時鐘頻率,指令就會加速完成。一個時鐘周期是計算機(jī)執(zhí)行某項操作的時間。但是一個時鐘周期可能不夠用,因此,有時一條指令可能需要多個時鐘周期才能完成,因為它由幾個較小的任務(wù)組成。

但是,如今我們幾乎不可能再提高時鐘頻率了。經(jīng)過人們十多年堅持不懈的努力,如今摩爾定律已經(jīng)失效了。

因此,我們所能做的只能是并行執(zhí)行盡可能多的指令。

多核與亂序處理器

并行執(zhí)行大量指令的方法有兩種。一種是添加更多 CPU 核心。從軟件開發(fā)人員的角度來看,這就如同添加線程。每個 CPU 核心就是一個硬件線程。如果你不知道線程是什么,則可以將其視為執(zhí)行任務(wù)的進(jìn)程。一個擁有兩個核心的 CPU可以同時執(zhí)行兩個單獨(dú)的任務(wù),即兩個線程。而任務(wù)可以理解為存儲在內(nèi)存中的兩個單獨(dú)的程序,或者是同一個程序執(zhí)行兩次。每個線程都需要一些記錄,例如該線程在程序指令序列中的當(dāng)前位置。每個線程可以存儲臨時的結(jié)果,而且應(yīng)該分開保存。

原則上來說,處理器即便只擁有一個核心也可以運(yùn)行多個線程。在這種情況下,處理器需要暫停一個線程,將當(dāng)前進(jìn)程保存下來,然后再切換到另一個線程。稍后再切換回去。這種做法無法帶來太多性能上的提升,而且只能在某個線程需要頻繁停下來等待用戶輸入,或網(wǎng)絡(luò)連接速度太慢的情況才能使用。以上這些可以稱為軟件線程。硬件線程則意味著需要使用額外的物理硬件(例如額外的核心)來加快處理速度。

然而,問題在于,開發(fā)人員需要編寫代碼才能利用這一點(diǎn)。有一些任務(wù)(例如服務(wù)器軟件)很容易做到這一點(diǎn)。例如單獨(dú)處理每個用戶,這些任務(wù)之間彼此獨(dú)立,因此擁有大量核心是服務(wù)器(尤其是基于云的服務(wù))的絕佳選擇。

這就是為什么 Ampere 等 ARM CPU 制造商生產(chǎn)出的 Altra Max 等 CPU 擁有 128 個核心的原因。該芯片是專門為云計算而設(shè)計的。單個核心不需要擁有瘋狂的性能,因為在云中利用好每一瓦特的功耗,處理盡可能多的并發(fā)用戶才是重中之重。

相比之下,蘋果的情況則完全不同。蘋果的產(chǎn)品都是單用戶的設(shè)備。大量線程并不是他們的優(yōu)勢。他們的設(shè)備可用于玩游戲、編輯視頻、開發(fā)等。他們希望臺式機(jī)擁有精美的、響應(yīng)速度超快的圖像和動畫。

桌面軟件通常不會利用很多核心。例如 8 個核心對電腦游戲來說就足夠了,128 個核心完全是浪費(fèi)。相反,這些軟件需要少量更強(qiáng)大的核心。

接下來我們要講的內(nèi)容很有意思。亂序執(zhí)行是一種能夠并行執(zhí)行更多指令、但不需要多線程的方式。開發(fā)人員無需專門編寫軟件即可享受亂序執(zhí)行的優(yōu)勢。從開發(fā)人員的角度來看,似乎每個核心的運(yùn)行速度都加快了。

為了理解其中的工作原理,我們先來了解一些內(nèi)存方面的知識。請求位于某個特定內(nèi)存位置中的數(shù)據(jù)會很慢。但是,獲取 1 個字節(jié)的延遲與獲取 128 個字節(jié)的延遲并沒有區(qū)別。數(shù)據(jù)是通過數(shù)據(jù)總線發(fā)送的。你可以將數(shù)據(jù)總線視為連接內(nèi)存與 CPU 各個部分的一條通道或管道,數(shù)據(jù)正是通過這條管道傳輸?shù)?。?shí)際上,數(shù)據(jù)總線就是一些可以導(dǎo)電的銅線。如果數(shù)據(jù)總線足夠?qū)?,則可以同時獲取多個字節(jié)。

因此,CPU 一次可以獲取整塊指令,但是這些指令必須逐條執(zhí)行?,F(xiàn)代微處理器采用了亂序執(zhí)行。

這意味著,這些處理器能夠快速分析指令緩沖區(qū),并檢查哪些指令之間有相互依賴關(guān)系。我們舉一個簡單的例子:

乘法是相對較慢的操作,假設(shè)它需要多個時鐘周期才能執(zhí)行完成。這時,第二條指令就需要等待,因為它需要知道放入 r1 寄存器的結(jié)果。

然而,第三條指令(03 行)并不依賴于前面的計算結(jié)果。因此,亂序處理器可以開始并行計算這條指令。

但實(shí)際情況是,處理器每時每刻都需要處理成百上千的指令,而 CPU 能夠找出這些指令之間的所有依賴關(guān)系。

它會分析指令,檢查每條指令的輸入,看一看這些輸入是否依賴于其他一個或多個指令的輸出。這里的輸入和輸出指的是包含先前計算結(jié)果的寄存器。

例如,指令 add r4, r1, 5 的輸入 r1 依賴于前一個指令 mul r1, r2, r3 的結(jié)果。這些依賴關(guān)系鏈接在一起就可以形成關(guān)系圖,而CPU可以使用這個圖進(jìn)行處理。圖中的節(jié)點(diǎn)就是指令,而邊就是連接這些指令的寄存器。

CPU 可以分析這樣的節(jié)點(diǎn)圖,并確定它可以并行執(zhí)行哪些指令,以及在執(zhí)行哪個指令之前需要等待多個相關(guān)的計算結(jié)果。

盡管許多指令都可以提前完成,但我們不能將它們作為最終的結(jié)果。我們不能提交這些指令的執(zhí)行結(jié)果,因為它們的執(zhí)行順序不正確。而在用戶看來,這些指令都是按照發(fā)行的順序執(zhí)行的。

就像棧一樣,CPU 將從頂部彈出完成的指令,直到遇到一條未完成的指令。

雖然上述說明不夠充分,但希望能讓你有大致的了解?;旧?,你可以選擇讓程序員實(shí)現(xiàn)并行,或者讓 CPU 假裝一切都是單線程執(zhí)行,但幕后采用亂序執(zhí)行。

M1 芯片上的 Firestorm 核心正是借助了出色的亂序執(zhí)行功能才變得如此強(qiáng)大。事實(shí)上,它比英特爾或 AMD 的任何產(chǎn)品都要強(qiáng)大,甚至可能超過了主流市場上的任何其他產(chǎn)品。

為什么 AMD 和英特爾的亂序執(zhí)行不如 M1?

前面在解釋亂序執(zhí)行的時候,我略過了一些重要的細(xì)節(jié),這里需要再說明一下,否則就很難理解為什么蘋果能領(lǐng)先,而且英特爾和 AMD 很難超越。

前面說的“?!钡恼嬲Q叫做“重排序緩沖”(Re-Order Buffer,ROB),它并不包括普通的機(jī)器代碼指令。其中的內(nèi)容并不是 CPU 從內(nèi)存中獲取并執(zhí)行的指令,后者屬于 CPU 指令架構(gòu)(ISA),是那些我們稱為 x86、ARM、PowerPC 等的指令。

但是在內(nèi)部,CPU 執(zhí)行的是一系列完全不同的指令集,這些指令對于程序員是不可見的。我們稱之為微指令(簡稱 μops)。ROB 中包含的都是微指令。

由于 CPU 盡一切努力并行執(zhí)行指令,所以 ROB 的這種做法更實(shí)際一些。原因是,微指令非常寬(包含更多比特),可能包含各種元信息。而 ARM 或 x86指令集中無法添加這么多信息,因為:

這樣做會導(dǎo)致程序的可執(zhí)行文件體積膨脹;

會暴露 CPU 的內(nèi)部工作原理,是否有亂序執(zhí)行單元,是否有寄存器重命名等各種細(xì)節(jié)

許多元信息僅在當(dāng)前執(zhí)行上下文中有意義。

你可以將這個過程理解成寫程序。你有一個公開的 API,需要保持穩(wěn)定,供所有人使用。這就是 ARM、x86、PowerPC、MIPS等指令集。而微指令是那些用來實(shí)現(xiàn)公開 API 的私有 API。

而且,微指令通常更容易被 CPU 處理。為什么?因為每條指令只做一件非常容易的任務(wù)。正常的 ISA 指令可以非常復(fù)雜,可能會引發(fā)一系列操作,因此需要翻譯成多條微指令。

CISCCPU 通常別無選擇,只能使用微指令,否則復(fù)雜的 CISC 指令會讓流水線和亂序執(zhí)行幾乎無法實(shí)現(xiàn)。

而 RISC CPU 還有別的選擇。例如,小型的 ARM CPU 完全不使用微指令。但這也意味著它們沒辦法實(shí)現(xiàn)亂序執(zhí)行之類的操作。

但你可能會問,你說這些有什么關(guān)系嗎?為什么需要知道這些細(xì)節(jié),才能理解為何蘋果超越了 AMD 和英特爾呢?

這是因為,芯片的運(yùn)行速度取決于填充 ROB 的速度以及使用的微指令數(shù)量。填充得越快、越多,并行獲取指令的可能性就越大,因此能夠提高性能。

機(jī)器指令由指令解碼器拆分成微指令。如果有多個解碼器,就能并行地拆分更多指令,從而更快地填充 ROB。

這里就是蘋果和其他廠商出現(xiàn)重大差別的地方。最次的英特爾和和 AMD 的微處理器核心只有四個解碼器,意味著它們可以同時解碼四條指令。

但蘋果有 8 個解碼器。不僅如此,蘋果的 ROB 是英特爾和 AMD 的三倍大小,可以容納三倍的指令。沒有任何主流芯片制造商的 CPU 中有這么多解碼器。

為什么英特爾和 AMD 不能添加更多的指令解碼器?

下面,我們來看一看 RISC 的優(yōu)勢,以及 M1 Firestorm 核心采用的 ARM RISC 架構(gòu)有哪些出色表現(xiàn)。

你知道,在 x86 中,指令長度約為 1~15 字節(jié)。而在 RISC 上指令是固定長度。這有什么關(guān)系?

如果每條指令的長度都一樣,那么將一個字節(jié)流分割,并行發(fā)送給 8 個不同的解碼器就非常容易。

但是在 x86 CPU 上,解碼器并不知道下一條指令從什么地方開始。它必須按順序分析每一條指令才能得知具體的長度。

英特爾和 AMD 采取暴力的方式來解決這個問題,即在每個可能的開始位置嘗試解碼。也就是說,許多錯誤的猜測就只能拋棄。這就導(dǎo)致解碼器變得非常復(fù)雜,因此很難添加更多的解碼器。但這對于蘋果不是問題,他們可以很容易地添加更多解碼器。

實(shí)際上,添加更多解碼器會帶來更多問題,因此對于 AMD 而言,4 個解碼器就是上限了。

所以,M1 Firestorm 核心能在同一時鐘頻率下產(chǎn)生比 AMD 和英特爾 CPU 多一倍的指令。

有人會說,可以將 CISC 拆分成多條微指令,增加指令的密度,這樣解碼一條x86 指令就可以達(dá)到解碼兩條 ARM 指令的效果。

但實(shí)際情況并非如此。高度優(yōu)化的x86代碼很少使用復(fù)雜的 CISC 指令,甚至看上去更像 RISC。

但這對英特爾和 AMD 并沒有什么用,因為即使 15 字節(jié)的指令非常罕見,解碼器也必須處理它們。這種復(fù)雜性成為了 AMD 和英特爾添加更多解碼器的阻礙。

但 AMD 的 Zen3 核心更快吧?

據(jù)我所知,從性能的角度來看,最新的 AMD CPU 核心 Zen3 比 Firestorm 核心稍稍快一些。但這只是因為 Zen3 核心的時鐘是 5GHz,而 Firestorm 核心的時鐘是 3.2GHz。盡管 Zen3 的時鐘頻率超出了 60%,但性能只不過比Firestorm 快了一點(diǎn)點(diǎn)。

那么為什么蘋果不提高時鐘頻率呢?因為更高的時鐘頻率會增加芯片發(fā)熱。這是蘋果的主要賣點(diǎn)。與英特爾和 AMD 不同,他們的電腦很少需要散熱。

所以本質(zhì)上可以說,F(xiàn)irestorm 核心確實(shí)優(yōu)于 Zen3 核心。 Zen3 雖然性能優(yōu)秀,但代價是高能耗與較大的發(fā)熱量。而蘋果并不選擇這條路。

如果蘋果需要更高的性能,那么他們會添加更多的核心。這樣就能在保持低功率的條件下提高性能。

未來的發(fā)展

似乎AMD和英特爾已經(jīng)陷入了困境:

他們的商業(yè)模式很難設(shè)計異構(gòu)計算和單片系統(tǒng);

由于舊的x86 CISC指令集的負(fù)擔(dān),很難提高亂序執(zhí)行性能。

但這并不意味著窮途末路。他們?nèi)匀豢梢酝ㄟ^提高時鐘頻率、使用更好的散熱、添加更多核心、提高CPU緩存等方式。但每一項都有缺點(diǎn)。英特爾的處境最糟糕,因為他們的核心數(shù)已經(jīng)不及 Firestorm,而且他們的單片系統(tǒng)解決方案中的 GPU 也更弱。

添加更多核心的問題在于,對于一般的桌面負(fù)載而言,過多核心帶來的收益很低。當(dāng)然對于服務(wù)器而言,核心數(shù)多多益善。

但是,亞馬遜、Ampere 等公司都在研究 128 核心的 CPU。這就意味著英特爾和 AMD 即將面臨雙重夾擊。

但對于 AMD 和英特爾來說,幸運(yùn)的是,蘋果并沒有在市場上銷售芯片。所以PC 用戶別無選擇。PC 用戶可能會轉(zhuǎn)而使用蘋果,但畢竟這是一個緩慢的過程。切換日常使用的平臺并不是一蹴而就的事情。

但對于口袋里有錢、沒有太多平臺依賴的年輕人來說,以后會越來越多地選擇蘋果,從而提高蘋果在高端市場的占有率,最終會提高蘋果在整個PC市場的占有率。

責(zé)任編輯:xj

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    463

    文章

    54054

    瀏覽量

    466815
  • 蘋果
    +關(guān)注

    關(guān)注

    61

    文章

    24601

    瀏覽量

    208444
  • 微處理器
    +關(guān)注

    關(guān)注

    11

    文章

    2431

    瀏覽量

    85932
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    神眸再發(fā)新品!M1智能親情可視通搭起遠(yuǎn)程陪伴橋梁

    2月13日,杭州研極微電子有限公司旗下品牌神眸繼發(fā)布DC1停車記錄儀后,緊接再推新品,聚焦老年陪伴市場,正式發(fā)布M1智能親情可視通,搭建子女與年邁父母遠(yuǎn)程溝通的橋梁。該產(chǎn)品支持4G免流量、通話永久
    的頭像 發(fā)表于 02-13 11:37 ?478次閱讀
    神眸再發(fā)新品!<b class='flag-5'>M1</b>智能親情可視通搭起遠(yuǎn)程陪伴橋梁

    Microchip擴(kuò)展maXTouch? M1觸摸屏控制器系列,實(shí)現(xiàn)更廣泛的屏幕尺寸覆蓋

    支持有機(jī)發(fā)光二極管(OLED)和微型發(fā)光二極管(microLED)等新興技術(shù)。 ? ? M1控制器采用Microchip專有的智能互容
    的頭像 發(fā)表于 01-29 10:41 ?6.4w次閱讀
    Microchip擴(kuò)展maXTouch? <b class='flag-5'>M1</b>觸摸屏控制器系列,實(shí)現(xiàn)更廣泛的屏幕尺寸覆蓋

    中興微電子撼域M1芯片與ETAS AUTOSAR軟件完成適配

    近日,中興通訊控股子公司深圳市中興微電子技術(shù)有限公司(下文簡稱“中興微電子”)與全球領(lǐng)先的汽車軟件與服務(wù)提供商ETAS共同宣布,中興微電子車規(guī)級中央計算平臺SOC芯片“撼域”M1與ETAS
    的頭像 發(fā)表于 12-22 14:23 ?669次閱讀

    EVAL - M1 - 101T評估板:電機(jī)控制應(yīng)用的理想選擇

    EVAL - M1 - 101T評估板:電機(jī)控制應(yīng)用的理想選擇 在電機(jī)控制應(yīng)用領(lǐng)域,款性能出色、功能豐富的評估板能為電子工程師的設(shè)計工作帶來極大便利。今天,我們就來深入探討英飛凌(Infineon
    的頭像 發(fā)表于 12-21 14:45 ?1356次閱讀

    探索Eval - M1 - CM610N3評估板:電機(jī)驅(qū)動應(yīng)用的理想

    探索Eval - M1 - CM610N3評估板:電機(jī)驅(qū)動應(yīng)用的理想選 在電機(jī)驅(qū)動應(yīng)用的設(shè)計領(lǐng)域,擁有款性能出色且易于評估的開發(fā)板至關(guān)重要。今天,我們就來詳細(xì)探討下英飛凌(Inf
    的頭像 發(fā)表于 12-21 09:40 ?701次閱讀

    EVAL - M1 - IM523評估板:助力電機(jī)驅(qū)動應(yīng)用設(shè)計

    EVAL - M1 - IM523評估板:助力電機(jī)驅(qū)動應(yīng)用設(shè)計 在電機(jī)驅(qū)動應(yīng)用設(shè)計領(lǐng)域,款性能優(yōu)良且易于使用的評估板能為工程師們節(jié)省大量時間和精力。今天,我們就來詳細(xì)探討下英飛凌
    的頭像 發(fā)表于 12-19 15:50 ?602次閱讀

    EVAL-M1-IM241評估板:電機(jī)驅(qū)動應(yīng)用的理想

    EVAL-M1-IM241評估板:電機(jī)驅(qū)動應(yīng)用的理想選 在電機(jī)驅(qū)動應(yīng)用領(lǐng)域,款性能出色、功能豐富的評估板對于工程師們進(jìn)行產(chǎn)品開發(fā)和測試至關(guān)重要。今天,我們就來詳細(xì)了解下英飛凌(I
    的頭像 發(fā)表于 12-19 15:50 ?552次閱讀

    芯源半導(dǎo)體安全芯片技術(shù)原理

    物理攻擊,如通過拆解設(shè)備獲取存儲的敏感信息、篡改硬件電路等。一些部署在戶外的物聯(lián)網(wǎng)設(shè)備,如智能電表、交通信號燈等,更容易成為物理攻擊的目標(biāo)。 芯源半導(dǎo)體的安全芯片采用了多種先進(jìn)的安全技術(shù)
    發(fā)表于 11-13 07:29

    IP5356M至為芯支持雙向PD充協(xié)議的22.5W移動電源方案芯片

    英集芯IP5356M款用于充電寶、移動電源等充電方案的雙向充移動電源管理SOC芯片,集成了QC2.0/3.0、PD2.0/3.0等大部分主流
    的頭像 發(fā)表于 11-07 11:53 ?901次閱讀
    IP5356<b class='flag-5'>M</b>至為芯支持雙向PD<b class='flag-5'>快</b>充協(xié)議的22.5W移動電源方案<b class='flag-5'>芯片</b>

    M1 SMA整流二極管規(guī)格書

    M1 SMA/DO-214AC整流二極管,電流:1A 50V
    發(fā)表于 10-29 17:02 ?0次下載

    蘋果AI革命:M5芯片10核GPU、AI處理速度翻倍,Apple Glass在路上

    三款核心設(shè)備。這蘋果圍繞M5芯片AI硬件的革新,也成為蘋果邁進(jìn)AI時代以端側(cè)大模型和空間計算的又
    的頭像 發(fā)表于 10-19 01:13 ?1.1w次閱讀
    <b class='flag-5'>蘋果</b>AI革命:<b class='flag-5'>M</b>5<b class='flag-5'>芯片</b>10核GPU、AI處理速度翻倍,Apple Glass在路上

    關(guān)于芯片設(shè)計的一些基本知識

    芯片的設(shè)計理念眾所周知,芯片擁有極為復(fù)雜的結(jié)構(gòu)。以英偉達(dá)的B200芯片為例,在巴掌大的面積上,塞入了2080億個晶體管。里面的布局,堪稱個異次元空間級的迷宮。英偉達(dá)B200
    的頭像 發(fā)表于 06-11 12:16 ?1270次閱讀
    關(guān)于<b class='flag-5'>芯片</b>設(shè)計的<b class='flag-5'>一些</b>基本知識

    用于 Cat M1/1/NTN 和 WCDMA HSDPA/HSUPA/HSPA(頻段 1、2、4、5、8)和 CDMA(頻段類別 0、1、6、15)的多模式、多頻段功率放大器模塊 skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()用于 Cat M1/1/NTN 和 WCDMA HSDPA/HSUPA/HSPA(頻段 1、2、4、5、8)和 CDMA(頻段類別 0、1、6、15)的多模式、
    發(fā)表于 05-13 18:35
    用于 Cat <b class='flag-5'>M1</b>/<b class='flag-5'>1</b>/NTN 和 WCDMA HSDPA/HSUPA/HSPA(頻段 <b class='flag-5'>1</b>、2、4、5、8)和 CDMA(頻段類別 0、<b class='flag-5'>1</b>、6、15)的多模式、多頻段功率放大器模塊 skyworksinc

    Debian和Ubuntu哪個好一些?

    兼容性對比Debian和Ubuntu哪個好一些,并為您揭示如何通過RAKsmart服務(wù)器釋放Linux系統(tǒng)的最大潛能。
    的頭像 發(fā)表于 05-07 10:58 ?1190次閱讀

    請問在NXP板的BSP QA過程中采用了哪些具體的測試方法?

    在 QA 過程中采用了哪些特定的測試方法? 什么是 QA 流程,以及 yocto/linux BSP 在整個 QA 生命周期中如何跟蹤和管理缺陷? RSB 3720 板的 QA 流程中使用了
    發(fā)表于 03-17 08:04