OpenClaw(俗稱“龍蝦”)已成為2026年現(xiàn)象級(jí)的AI應(yīng)用,其強(qiáng)大的工具調(diào)用和任務(wù)執(zhí)行能力吸引了無(wú)數(shù)開發(fā)者和企業(yè)。然而,將龍蝦動(dòng)不動(dòng)上百萬(wàn)的token消耗,使得很多想嘗試的用戶望而卻步,把龍蝦“養(yǎng)”在本地,不僅可以大幅度節(jié)省token消耗量,而且可以實(shí)現(xiàn)數(shù)據(jù)隱私、低延遲等諸多優(yōu)勢(shì)。登臨KS20 GPU 憑借其強(qiáng)大的端側(cè)算力和CUDA兼容優(yōu)勢(shì),成為解鎖本地OpenClaw全新玩法的理想硬件選擇。
本教程將基于內(nèi)部測(cè)試報(bào)告和應(yīng)用指南,為您提供一份從環(huán)境準(zhǔn)備到任務(wù)發(fā)布的完整“養(yǎng)龍蝦”指南,助您快速搭建屬于自己的24小時(shí)AI管家。
核心優(yōu)勢(shì)|KS20如何賦能本地OpenClaw?
在動(dòng)手之前,我們先明確KS20為OpenClaw帶來(lái)的核心價(jià)值:
強(qiáng)大的端側(cè)算力 :KS20支持高達(dá)70TOPS的AI算力和60路1080P@30fps視頻解碼,足以驅(qū)動(dòng)復(fù)雜的多模態(tài)應(yīng)用(MCP),如家庭安全管家、智能翻譯等。
超長(zhǎng)上下文支持 :測(cè)試表明,KS20-32GB可流暢運(yùn)行Qwen3-Coder模型,并支持高達(dá) 140K上下文長(zhǎng)度 ,遠(yuǎn)超OpenClaw官方最低要求的64K,這意味著龍蝦能處理更長(zhǎng)的對(duì)話和更復(fù)雜的指令。
極致的推理性能 :面對(duì)超過(guò)20K輸入長(zhǎng)度的單次請(qǐng)求,KS20的prefill速度可達(dá) 1750 token/s ,解碼速度仍能保持在 10 tps以上 ,確保了流暢的交互體驗(yàn)。
顯著降低Token消耗 :通過(guò)在本地部署大模型,將對(duì)本地?cái)?shù)據(jù)的查詢、修改等操作本地化處理,可大幅降低對(duì)云端API的Token消耗,真正解決“養(yǎng)不起龍蝦”的痛點(diǎn)。
廣泛的軟硬件兼容性:KS20支持X86、ARM等多種主流CPU架構(gòu),以及麒麟、統(tǒng)信等國(guó)產(chǎn)操作系統(tǒng),為不同場(chǎng)景提供了靈活選擇。
KS20適配OpenClaw核心參數(shù)一覽
| 參數(shù)項(xiàng) | 具體配置/性能 | 說(shuō)明與優(yōu)勢(shì) | |||
| 測(cè)試卡型號(hào) | KS20-32GB | 提供充足顯存,滿足大模型部署需求。 | |||
| 運(yùn)行模型 | Qwen3-Coder | 支持開源生態(tài),具備強(qiáng)大的代碼生成與通用任務(wù)能力。 | |||
| 模型大小 | 17GB | 適配KS20-32GB顯存,部署無(wú)壓力。 | |||
| 上下文長(zhǎng)度 | 140K | 遠(yuǎn)超官方最低要求(64K),能處理極長(zhǎng)對(duì)話和文檔。 | |||
| Prefill速度 |
1750 token/s (20K+輸入) |
首屏響應(yīng)速度快,用戶體驗(yàn)佳。 | |||
| Decoding速度 | >10 tps | 生成流暢,無(wú)明顯卡頓。 | |||
| 工具調(diào)用 | 正常響應(yīng) | 成功接入并使用外部工具(如Tavily Search),驗(yàn)證了完整功能。 |
手把手部署|四步搭建您的本地龍蝦
01硬件與環(huán)境準(zhǔn)備
硬件 :確保您擁有一臺(tái)安裝了登臨KS20-32GB 加速卡的主機(jī),支持信創(chuàng)及市場(chǎng)主流CPU架構(gòu)。
軟件 :安裝linux或國(guó)產(chǎn)主流操作系統(tǒng),獲取驅(qū)動(dòng)及一鍵部署腳本,快速完成環(huán)境搭建。
02啟動(dòng)模型服務(wù)
下載模型 :從開源社區(qū)下載Qwen3-Coder模型。測(cè)試中使用的模型地址為:https://modelscope.cn/models/tclf90/Qwen3-Coder-30B-A3B-Instruct-AWQ/files。
配置啟動(dòng)命令 :在KS20上配置啟動(dòng)Qwen3-Coder模型的命令。關(guān)鍵參數(shù)是必須啟用tool-use功能,這是OpenClaw調(diào)用外部工具的基礎(chǔ),執(zhí)行命令如下;部署過(guò)程中可以看到上下文支持140K。
DLEOL_USE_CU_MQA_TILEKV=1vllm serve /LocalRun/model_zoo/Qwen3-Coder-30B-A3B-Instruct-AWQ/ -tp1--served-model-name qwen3-coder --enable-auto-tool-choice --tool-call-parser qwen3_coder --dtype=half --compilation-config '{"cudagraph_capture_sizes":[64,128,192,256],"cudagraph_capture_decode_sizes":[1]}' --max-num-batched-tokens256--scheduler-cls vllm.v1.core.sched.scheduler.Scheduler --max-model-len140000

03配置OpenClaw客戶端
完成OpenClaw安裝 :Openclaw 的安裝教程非常多,可以參考官方文檔https://docs.openclaw.ai/zh-CN,命令一鍵安裝。
npm install -gopenclaw@latest
安裝完成后,使用openclaw配置命令進(jìn)行,配置關(guān)鍵在配置參數(shù)部分使用vLLM本地服務(wù):
openclawonboard


連接本地模型服務(wù):在OpenClaw的設(shè)置中,配置“本地OpenAI-completions服務(wù)”。將服務(wù)地址指向您在第二步中啟動(dòng)的模型服務(wù)地址(默認(rèn)是http://0.0.0.0:8000/v1 )

啟動(dòng)客戶端:?jiǎn)?dòng)OpenClaw客戶端,此時(shí)它將連接到您本地的KS20模型了??梢允褂镁W(wǎng)頁(yè)訪問或TUI界面,快速測(cè)試推薦使用TUI界面
#啟動(dòng)openclaw服務(wù) openclaw gateway restart #進(jìn)入tui界面 openclaw tui #在openclaw中啟動(dòng)新session /new

04
發(fā)布任務(wù)與測(cè)試驗(yàn)證
準(zhǔn)備工具技能(SKILLS):為OpenClaw添加所需的工具技能。測(cè)試中使用了Tavily Search技能,并配置了對(duì)應(yīng)的API Key(通常注冊(cè)即可獲得免費(fèi)額度)。具體方法參考:https://clawhub.ai/

發(fā)布測(cè)試任務(wù):向OpenClaw發(fā)布一個(gè)需要調(diào)用外部工具的任務(wù),例如:“請(qǐng)使用Tavily搜索最新的AI大模型動(dòng)態(tài),并總結(jié)給我?!?/p>

驗(yàn)證功能:觀察OpenClaw是否能正確調(diào)用Tavily API,并將搜索結(jié)果整理后返回。同時(shí),您可以從模型服務(wù)的后臺(tái)日志中,確認(rèn)工具使用需求已被正常響應(yīng)。

通過(guò)本教程,您已掌握使用登臨KS20在本地部署和運(yùn)行OpenClaw的完整流程。KS20憑借其 強(qiáng)大算力、超長(zhǎng)上下文、卓越性能和廣泛兼容性 ,為本地“養(yǎng)龍蝦”提供了堅(jiān)實(shí)的硬件基礎(chǔ)。這不僅是一次技術(shù)實(shí)踐,更是開啟個(gè)人AI助理、家庭智能中樞或企業(yè)邊緣計(jì)算新可能的起點(diǎn)。
隨著開源模型和OpenClaw生態(tài)的持續(xù)發(fā)展,登臨GPU將持續(xù)進(jìn)化,為您解鎖更多AI賦能的全新玩法?,F(xiàn)在,就動(dòng)手部署,體驗(yàn)屬于您的24小時(shí)AI管家吧!
關(guān)于登臨
蘇州登臨科技股份有限公司是一家專注于高性能通用 GPU 設(shè)計(jì)與研發(fā)的創(chuàng)新型企業(yè),致力于為 AI 計(jì)算、圖形渲染、高性能計(jì)算等領(lǐng)域提供自主可控、高效能的算力解決方案。公司以“技術(shù)賦能行業(yè)革新”為理念,通過(guò)自主研發(fā)的GPU+架構(gòu),在多個(gè)行業(yè)實(shí)現(xiàn)了規(guī)模化商業(yè)落地,成為推動(dòng)國(guó)產(chǎn)算力發(fā)展的關(guān)鍵力量。
-
gpu
+關(guān)注
關(guān)注
28文章
5209瀏覽量
135602 -
AI
+關(guān)注
關(guān)注
91文章
40086瀏覽量
301719 -
開源
+關(guān)注
關(guān)注
3文章
4234瀏覽量
46234 -
登臨科技
+關(guān)注
關(guān)注
0文章
22瀏覽量
836
原文標(biāo)題:安全“養(yǎng)龍蝦” — 登臨GPU本地部署OpenClaw全攻略
文章出處:【微信號(hào):gh_313558c425fe,微信公眾號(hào):登臨科技 DenglinAI】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
登臨科技GPU本地部署OpenClaw全攻略
評(píng)論