大家好,我是雄雄,歡迎關(guān)注微信公眾號:雄雄的小課堂
@TOC
寫在前面
華為云 828,領(lǐng) 8280 元上云禮券,買高性能服務(wù)器!??!
這不,手里就拿到了一臺 4 核 12G,10M 的 Flexus X 實例云服務(wù)器,拿到后,就想著測測它的性能,看看有沒有官網(wǎng)說的那么神奇?。。?/p>
官網(wǎng)的活動地址在這里,領(lǐng) 8280 元券:點我查看
服務(wù)器配置情況
下面,簡單的給大家看看我手里的這臺服務(wù)器的配置,做個鋪墊,待會兒給大家上大招?。?!
cpu 的情況

內(nèi)存情況

硬盤情況

拿到服務(wù)器后,我不想再裝環(huán)境上浪費時間,所以就安裝了個寶塔,這個面板在服務(wù)器中,占不了多少內(nèi)存,但是方便了裝環(huán)境,不用執(zhí)行裝環(huán)境的命令,只需要在軟件商店中,找到需要安裝的軟件,點擊后面的安裝即可。
評測之前環(huán)境準(zhǔn)備
在正式評測之前,我們需要準(zhǔn)備以下環(huán)境:
1.docker,不會安裝的可以自行百度
2.ollama,這個也很簡單,執(zhí)行個命令就完事兒了
假使我們這兩個環(huán)境現(xiàn)在在云服務(wù)器上都安裝成功啦。


那么,現(xiàn)在我們開始正式評測?。?!
華為云 Flexus X 實例大模型評測
下面,我們開始基于華為云的 Flexus X 實例云服務(wù)器評測一下大模型,因為我們現(xiàn)在還不知道這款服務(wù)器能跑多大的模型,所以我們就先從小模型開始跑。
先來個小模型,下面我們可以直接使用 ollama 開始跑模型,大家進(jìn)入 ollama 的官網(wǎng),點擊右上角的 model 菜單:

然后就能看到下面所有 ollama 支持的大模型啦。
找到 qwen2,我們可以看到下面的 tag 里面分別有:0.5B,1.5B,7B,72B,這幾種。

千問 0.5B 大模型
下面,我們先以最小的為例,試試看看:(注意,模型的質(zhì)量我們暫且不管,我們只評測響應(yīng)速度以及 CPU 和內(nèi)存的占用情況)
占用情況以寶塔面板上的統(tǒng)計圖為例,待會兒給大家截圖。
執(zhí)行下面的命令,開始跑 0.5B 的大模型:
ollama run qwen2:0.5b
運行情況如下:

占用情況如下:

結(jié)論:0.5B 的大模型,可以看到,這個速度快的驚人,沒說的,繼續(xù)測下個大模型。
千問 1.5B 大模型
這次我們測 1.5B 的大模型,比 0.5B 的多 1,看看這款 Flexus X 實例云服務(wù)器的表現(xiàn)怎么樣。
同樣,執(zhí)行下面的命令:
ollama run qwen2:1.5b

這里需要等待半天,讓下載。
下載過程中,我們可以看看寶塔上的內(nèi)存和 CPU 的占比情況。

基本上毫無壓力,繼續(xù)等待?。?!
等待的過程有點漫長.....

開測!??!

看看占用情況:

結(jié)論:比較完美,感覺和 0.5B 的區(qū)別不是很大,就是下載的時候慢了點,整體表現(xiàn)很棒。
gemma2 的 2b 大模型
0.5B 和 1.5B 的我們都測試過了,大家也可以從上圖中看的出來,一點壓力都沒有,響應(yīng)速度也很快,嗖嗖的就回答完畢了,質(zhì)量也還行,而且最主要的是服務(wù)器的性能完全是過剩的,沒跑滿,所以,我們接著加大力度測試。
現(xiàn)在我們測測 gemma2 的 2b 大模型,運行如下命令:
ollama run gemma2:2b
又到了等待的過程中了,總是這么漫長~

在下載模型的過程中,我們可以看看占用情況:

一點問題都沒有,幾乎沒有占多少,現(xiàn)在我們繼續(xù)等待。

等待完畢,開始問個問題測試一下:
效果展示情況:

資源占用情況:

結(jié)論:通過效果圖 gif 中可以看的出來,響應(yīng)要比 1.5B 的稍微慢了點兒,但是這個速度還是可以接受,不過內(nèi)存占用稍微偏高了,由原來的 27 增加到了 34,倒是也能接受,畢竟模型的大小由原來的 900 多 M 到現(xiàn)在的 1.4G 了。
千問 7B 大模型
現(xiàn)在,我們繼續(xù)增大模型,看看表現(xiàn)效果怎么樣。
這次我們測一下千問的 7B 大模型,這是 2B 的 3 倍多,看看這款 Flexus X 實例云服務(wù)器跑 7B 的模型是個什么情況。
同樣,執(zhí)行下面的命令:
ollama run qwen2:7b
繼續(xù)等待:

7B 的模型,已經(jīng)到了 4G 多了,期待他能有個很好的表現(xiàn)。
現(xiàn)在是:2024 年 9 月 6 日 00:02:43,我的 7B 大模型還在下載中,已經(jīng)困的不行了....

再等等....

終于等它下載完啦,一共 4.4G,等的我都快做夢啦。切記,如果有大文件上下傳的場景,買服務(wù)器的時候一定要選擇個大帶寬的,我的這個是 10M 的帶寬,感覺遇到大文件了,還是有點不足。
下面我們開始進(jìn)行評測,首先還是老規(guī)矩,先運行看看效果:

資源占用情況:

結(jié)論:大家可以看看效果圖中,可以發(fā)現(xiàn),很明顯,相比起 2B 1.5B 的這種小模型來比,7B 的模型,在響應(yīng)方面確實是稍微慢了點兒,但是也沒有慢到一個字一個字的往出蹦,還是可以接受的。資源占用情況的話,CPU 占用上升到了 50.4% ,內(nèi)存在原來的 34 增加到了 49。也沒有跑滿服務(wù)器。
總結(jié)
先放一張各個大小的模型之間的對比吧,從 0.5B,到 1.5B,再到 7B,以及 72B。

大家可以從上圖中看的出來,模型越大,params 就越大,本文我們通過對 0.5b,1.5b,2b,7b 這幾個模型進(jìn)行評測對比,總體來說,比我預(yù)想的要好很多,我以為 7b 的會卡的很,結(jié)果表現(xiàn)的很棒,這么看來,跑 8B 以內(nèi)的模型是沒有問題的。
在往上的大模型,可能會吃力,不過 8B 以內(nèi),其實小微企業(yè)足矣?。?!
審核編輯 黃宇
-
云服務(wù)器
+關(guān)注
關(guān)注
0文章
839瀏覽量
14735 -
大模型
+關(guān)注
關(guān)注
2文章
3710瀏覽量
5229
發(fā)布評論請先 登錄
硬件通脹下的生存戰(zhàn)!華為云Flexus X服務(wù)器,讓中小企業(yè)不做“接盤俠”
DRAM 暴漲 171%! 171% 下的企業(yè)突圍:華為云 Flexus X 云服務(wù)器成 IT 成本管控利器
什么是企業(yè)云服務(wù)器-云計算
云知聲山海醫(yī)療大模型問鼎MedBench4.0三項榜首
云服務(wù)器端口怎么開放?
DeepSeek模型如何在云服務(wù)器上部署?
輕量云服務(wù)器和云服務(wù)器區(qū)別:2025年終極選擇指南
硅谷GPU云服務(wù)器是什么意思?使用指南詳解
云服務(wù)器和獨立服務(wù)器的區(qū)別在哪?一文讀懂如何選擇
云存儲服務(wù)器租用的好處有哪些?
高防服務(wù)器哪家好?RAKsmart高防服務(wù)器全方位解析
深蘭科技醫(yī)療大模型榮獲MedBench評測第一
PTP服務(wù)器與NTP服務(wù)器的對比分析
基于 Flexus X 實例云服務(wù)器的評測 - 大模型對比評測
評論