91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

云服務(wù)器 Flexus X 實(shí)例:one-api 部署,支持眾多大模型

jf_94205927 ? 來(lái)源:jf_94205927 ? 作者:jf_94205927 ? 2025-02-06 17:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文通過(guò) Flexus 云服務(wù)器 X 實(shí)例 部署 one-api。Flexus 云服務(wù)器 X 實(shí)例是新一代面向中小企業(yè)和開(kāi)發(fā)者打造的柔性算力云服務(wù)器,可智能感知業(yè)務(wù)負(fù)載,適用于電商直播、企業(yè)建站、開(kāi)發(fā)測(cè)試環(huán)境、游戲服務(wù)器、音視頻服務(wù)等中低負(fù)載場(chǎng)景。相較于 Flexus 應(yīng)用服務(wù)器 L 實(shí)例,F(xiàn)lexus 云服務(wù)器 X 實(shí)例的優(yōu)勢(shì)包含:提供豐富的公共鏡像、可靈活自定義 vCPU 內(nèi)存配比、智能感知業(yè)務(wù)動(dòng)態(tài)升降配,負(fù)載范圍更高等。

Flexus 云服務(wù)器 X 實(shí)例 能夠支持電商直播、企業(yè)建站、個(gè)人開(kāi)發(fā)測(cè)試、游戲服務(wù)器等。

wKgZO2dtK_eAc7kIAACbHKe18ok616.png

一、one-api 介紹

one-api 是一個(gè) OpenAI 接口管理 &分發(fā)系統(tǒng),目前支持 Azure、Anthropic Claude、Google PaLM 2 & Gemini、智譜 ChatGLM、百度文心一言、訊飛星火認(rèn)知、阿里通義千問(wèn)、360 智腦以及騰訊混元,可用于二次分發(fā)管理 key,僅單可執(zhí)行文件,已打包好 Docker 鏡像,一鍵部署,開(kāi)箱即用。

wKgZPGdtK_iAc3ayAACrqFqjHuo018.png

one-api 特性:

(1)支持多種大模型;

(2)支持配置鏡像以及眾多第三方代理服務(wù);

(3)支持通過(guò)負(fù)載均衡的方式訪問(wèn)多個(gè)渠道;

(4)支持 stream 模式,可以通過(guò)流式傳輸實(shí)現(xiàn)打字機(jī)效果;

(5)支持多機(jī)部署,支持令牌管理,設(shè)置令牌的過(guò)期時(shí)間、額度、允許的 IP 范圍以及允許的模型訪問(wèn);

(6) 支持兌換碼管理,支持批量生成和導(dǎo)出兌換碼,可使用兌換碼為賬戶(hù)進(jìn)行充值;

(7)支持渠道管理,批量創(chuàng)建渠道。 支持用戶(hù)分組以及渠道分組,支持為不同分組設(shè)置不同的倍率;

(8) 支持渠道設(shè)置模型列表,支持查看額度明細(xì)。 支持用戶(hù)邀請(qǐng)獎(jiǎng)勵(lì)。 支持以美元為單位顯示額度等。

二、部署 one-api

2.1 拉取鏡像

首先,先從遠(yuǎn)程鏡像倉(cāng)庫(kù)中拉取 one-api 鏡像,執(zhí)行如下命令拉取。

root@flexusx-7305:~#dockerpull swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/justsong/one-api:v0.6.0

v0.6.0: Pulling from ddn-k8s/docker.io/justsong/one-api

4abcf2066143: Pull complete

c2f30ece0032: Pull complete

213fae9f6ab5: Pull complete

f2605c032589: Pull complete

Digest: sha256:416dc625c8c5a905e70db79b40bed5325fa0bc26aecf9cf9181e89b653595e14

Status: Downloaded newer image for swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/justsong/one-api:v0.6.0

swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/justsong/one-api:v0.6.0

one-api 鏡像拉取成功。

2.2 部署 one-api

拉取完 one-api 鏡像后,one-api 鏡像會(huì)存儲(chǔ)到本地,如下所示。

root@flexusx-7305:~# docker images

REPOSITORY TAG IMAGE ID CREATED SIZE

swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/gitea/gitea 1.22.1 b3de72970178 2 months ago 167MB

swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/justsong/one-api v0.6.0 36bd98ce5a7c 6 months ago 48.4MB

daocloud.io/library/mysql 8 26d0ac143221 3 years ago 546MB

daocloud.io/library/mysql latest 8457e9155715 3 years ago 546MB

root@flexusx-7305:~#

復(fù)制鏡像名稱(chēng),通過(guò) docker 部署 one-api,執(zhí)行如下命令。

root@flexusx-7305:~# docker run --name one-api -d --restart always -p 3002:3000 -e TZ=Asia/Shanghai -v /root/data/one-api:/data swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/justsong/one-api:v0.6.0

89bb9f7a3dd119008c678243464bdf10df377dc4d482b123be3c077d7a675ac8

root@flexusx-7305:~# docker ps

CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES

89bb9f7a3dd1 swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/justsong/one-api:v0.6.0 "/one-api" 2 seconds ago Up 2 seconds 0.0.0.0:3002->3000/tcp, [::]:3002->3000/tcp one-api

ef512af0c1c5 swr.cn-north-4.myhuaweicloud.com/ddn-k8s/docker.io/gitea/gitea:1.22.1 "/usr/bin/entrypoint…" 2 days ago Up 2 days 0.0.0.0:3000->3000/tcp, :::3000->3000/tcp, 0.0.0.0:222->22/tcp, [::]:222->22/tcp gitea

65fe1c102df6 daocloud.io/library/mysql:8 "docker-entrypoint.s…" 2 days ago Up 2 days 3306/tcp, 33060/tcp root_db_1

root@flexusx-7305:~#

通過(guò) docker ps 可以查看正在運(yùn)行的容器,可以看到 one-api 已運(yùn)行,端口是 3002,對(duì)應(yīng)容器內(nèi)部端口 3000。

三、運(yùn)行 one-api

通過(guò)上面的步驟,one-api 已經(jīng)部署成功,下面就來(lái)詳細(xì)看下 one-api 的功能。

3.1 添加規(guī)則

one-api 對(duì)應(yīng)的端口是 3002,需要將 3002 端口加入到準(zhǔn)入規(guī)則中。

首先,在基本信息中,找到安全組,點(diǎn)擊進(jìn)入安全組,如下所示。

wKgZO2dtK_iAcX22AABSMFpa2To274.png

然后,點(diǎn)擊配置規(guī)則配置 3002 端口,如下所示。

wKgZPGdtK_iAITNsAAClNKC6DOw774.png

設(shè)置優(yōu)先級(jí),然后在協(xié)議端口中添加端口,點(diǎn)擊確定,如下所示。

wKgZO2dtK_iAKGaCAACdB5kY2u0367.png

可以看到 3002 端口已經(jīng)被加入到安全規(guī)則中,如下所示。

wKgZPGdtK_qAUTpaAADrNel8ql4859.png

3.2 運(yùn)行 one-api

在瀏覽器中,訪問(wèn) http://服務(wù)器 IP 地址:3002,one-api 界面如下所示。

wKgZO2dtK_qAPhgaAACntc2Mgmo121.png

然后,點(diǎn)擊右上角登錄按鈕,默認(rèn)用戶(hù)名為 root,默認(rèn)密碼為 123456,登錄后可以修改密碼,如下所示。

wKgZPGdtK_qAPzkYAACG8_k-8V8559.png

wKgZO2dtK_uAWzNWAADTXB9fS2Y701.png

四、添加大模型 API

4.1 添加大模型 API

添加大模型 API 是在渠道里面,如下所示。

wKgZPGdtK_uACRr2AACqHBrn_lg032.png

點(diǎn)擊添加新渠道,如下所示。

wKgZO2dtK_uAAeSxAAEftk5zhCg828.png

加完成后可以點(diǎn)擊測(cè)試按鈕測(cè)試添加是否成功。

4.2 添加令牌

添加完大模型后,點(diǎn)擊令牌生成密鑰。

wKgZPGdtK_uAaCf8AACB9QU3uvs670.png

點(diǎn)擊添加新的令牌,輸入令牌名稱(chēng),過(guò)期時(shí)間可以默認(rèn),表示永不過(guò)期,如下所示。

wKgZO2dtK_yAFO_1AACusGn_DCQ642.png

添加完成后,點(diǎn)擊復(fù)制即可復(fù)制密鑰,用于通過(guò) one-api 連接大模型時(shí)填寫(xiě)密鑰。

wKgZPGdtK_yAAoyxAACgcEJwHWU782.png

五、總結(jié)

通過(guò) Flexus 云服務(wù)器 X 實(shí)例 上部署 one-api,能夠流暢支持多種大模型接入,方便了大模型的開(kāi)發(fā)工作。而且,F(xiàn)lexus 云服務(wù)器 X 實(shí)例提供了豐富的公共鏡像,可靈活自定義鏡像版本,支持智能感知業(yè)務(wù)動(dòng)態(tài)升降配,負(fù)載范圍更高,支持靈活自定義 vCPU、內(nèi)存實(shí)例規(guī)格,支持按需計(jì)費(fèi)更精細(xì)和靈活的定價(jià)模式,可基于實(shí)際負(fù)載畫(huà)像智能推薦規(guī)格。趕緊用起來(lái)吧!

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 云服務(wù)器
    +關(guān)注

    關(guān)注

    0

    文章

    837

    瀏覽量

    14690
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3650

    瀏覽量

    5189
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    硬件通脹下的生存戰(zhàn)!華為Flexus X服務(wù)器,讓中小企業(yè)不做“接盤(pán)俠”

    通知”成了企業(yè)IT采購(gòu)的常態(tài)。 DRAM合同價(jià)同比暴漲171.8%,NAND Flash價(jià)格累計(jì)飆升246%,服務(wù)器整機(jī)采購(gòu)成本上升15%-20%。硬件市場(chǎng)的瘋狂漲價(jià),正讓無(wú)數(shù)中小企業(yè)面臨“買(mǎi)得起用不起、想買(mǎi)卻沒(méi)貨”的絕境。而__華為
    的頭像 發(fā)表于 12-31 13:05 ?295次閱讀

    DRAM 暴漲 171%! 171% 下的企業(yè)突圍:華為 Flexus X 服務(wù)器成 IT 成本管控利器

    Flexus X 服務(wù)器憑借獨(dú)有的柔性算力黑科技與智能調(diào)度能力,助力企業(yè)實(shí)現(xiàn)核心應(yīng)用性能最高達(dá)友商 6 倍、綜合成本降低 30% 的雙
    的頭像 發(fā)表于 12-31 13:00 ?255次閱讀

    什么是企業(yè)服務(wù)器-計(jì)算

    地?cái)U(kuò)展和管理其IT基礎(chǔ)設(shè)施。華納的企業(yè)服務(wù)器基于虛擬化技術(shù),在環(huán)境中運(yùn)行多個(gè)虛擬服務(wù)器實(shí)例
    的頭像 發(fā)表于 12-29 17:57 ?798次閱讀

    香港服務(wù)器支持Docker和Kubernetes嗎?

    在云原生技術(shù)成為主流的今天,Docker和Kubernetes(K8s)已成為現(xiàn)代化應(yīng)用開(kāi)發(fā)和部署的事實(shí)標(biāo)準(zhǔn)。對(duì)于選擇香港服務(wù)器的開(kāi)發(fā)者與企業(yè)而言,一個(gè)核心問(wèn)題是:香港服務(wù)器能否完美支持
    的頭像 發(fā)表于 10-21 15:47 ?687次閱讀

    如何快速在服務(wù)器部署Web環(huán)境?

    如何快速在服務(wù)器部署Web環(huán)境
    的頭像 發(fā)表于 10-14 14:16 ?665次閱讀

    DeepSeek模型如何在服務(wù)器部署?

    隨著大型語(yǔ)言模型(LLM)的應(yīng)用日益普及,許多開(kāi)發(fā)者和企業(yè)希望將像DeepSeek這樣的優(yōu)秀模型部署到自己的服務(wù)器上,以實(shí)現(xiàn)私有化、定制化
    的頭像 發(fā)表于 10-13 16:52 ?949次閱讀

    Jtti服務(wù)器上怎么部署網(wǎng)站嗎

    在互聯(lián)網(wǎng)快速發(fā)展的今天,網(wǎng)站已經(jīng)成為公司和個(gè)人溝通和展示自我的重要渠道。無(wú)論是一個(gè)簡(jiǎn)單的個(gè)人博客,還是一個(gè)復(fù)雜的電子商務(wù)平臺(tái),部署網(wǎng)站的過(guò)程都是相似的。服務(wù)器因其高可用性、靈活性和經(jīng)濟(jì)性,成為
    的頭像 發(fā)表于 09-26 17:16 ?1186次閱讀

    輕量服務(wù)器服務(wù)器區(qū)別:2025年終極選擇指南

    資源、穩(wěn)定計(jì)算性能及完整管理權(quán)限,支持垂直與水平擴(kuò)展,適合企業(yè)級(jí)應(yīng)用和高并發(fā)場(chǎng)景。選擇取決于業(yè)務(wù)需求:輕量服務(wù)器適用于成本敏感型場(chǎng)景,標(biāo)準(zhǔn)服務(wù)器則為高性能、高穩(wěn)定性要求的業(yè)務(wù)提供保障
    的頭像 發(fā)表于 09-01 13:58 ?1268次閱讀
    輕量<b class='flag-5'>云</b><b class='flag-5'>服務(wù)器</b>和<b class='flag-5'>云</b><b class='flag-5'>服務(wù)器</b>區(qū)別:2025年終極選擇指南

    HarmonyOS5服務(wù)技術(shù)分享--ArkTS開(kāi)發(fā)Node環(huán)境

    氣的方式探索這個(gè)功能,結(jié)尾還有實(shí)用總結(jié)和鼓勵(lì)彩蛋哦~? ? 一、HarmonyOS函數(shù)開(kāi)發(fā):核心能力與價(jià)值 HarmonyOS的函數(shù)(Serverless)為開(kāi)發(fā)者提供了??無(wú)服務(wù)器架構(gòu)??的便捷
    發(fā)表于 05-22 17:21

    電競(jìng)服務(wù)器 工作原理

    電競(jìng)服務(wù)器工作原理詳解 一、核心架構(gòu)原理 虛擬化資源池? 通過(guò) ?KVM/VMware? 等虛擬化技術(shù)將物理服務(wù)器(含NVIDIA GPU集群)抽象為可動(dòng)態(tài)分配的算力資源池,每個(gè)用戶(hù)獨(dú)享獨(dú)立虛擬機(jī)
    的頭像 發(fā)表于 05-14 07:44 ?609次閱讀
    <b class='flag-5'>云</b>電競(jìng)<b class='flag-5'>服務(wù)器</b> 工作原理

    基于RAKsmart服務(wù)器的AI大模型實(shí)時(shí)推理方案設(shè)計(jì)

    面對(duì)高并發(fā)請(qǐng)求、嚴(yán)格的響應(yīng)延遲要求及波動(dòng)的業(yè)務(wù)負(fù)載,傳統(tǒng)本地化部署的算力瓶頸愈發(fā)顯著。RAKsmart服務(wù)器憑借其彈性計(jì)算資源池、分布式網(wǎng)絡(luò)架構(gòu)與全棧AI加速能力,為AI大模型實(shí)時(shí)推
    的頭像 發(fā)表于 05-13 10:33 ?612次閱讀

    如何在RAKsmart服務(wù)器上實(shí)現(xiàn)企業(yè)AI模型部署

    AI模型的訓(xùn)練與部署需要強(qiáng)大的算力支持、穩(wěn)定的網(wǎng)絡(luò)環(huán)境和專(zhuān)業(yè)的技術(shù)管理。RAKsmart作為全球領(lǐng)先的服務(wù)器托管與計(jì)算
    的頭像 發(fā)表于 03-27 09:46 ?942次閱讀

    DeepSeek企業(yè)級(jí)部署服務(wù)器資源計(jì)算 以raksmart裸機(jī)服務(wù)器為例

    以RakSmart裸機(jī)服務(wù)器為例,針對(duì)DeepSeek企業(yè)級(jí)部署服務(wù)器資源計(jì)算指南,涵蓋GPU/CPU/內(nèi)存/存儲(chǔ)/網(wǎng)絡(luò)等核心維度的詳細(xì)計(jì)算方法與配置推薦,主機(jī)推薦小編為您整理發(fā)布
    的頭像 發(fā)表于 03-21 10:17 ?1082次閱讀

    RAKsmart美國(guó)裸機(jī)服務(wù)器DeepSeek的高級(jí)定制化部署方案

    在RAKsmart美國(guó)裸機(jī)服務(wù)器上進(jìn)行DeepSeek的高級(jí)定制化部署,需結(jié)合高性能硬件與靈活的軟件配置,以實(shí)現(xiàn)模型優(yōu)化、多任務(wù)并行及安全性提升。以下是針對(duì)企業(yè)級(jí)需求的詳細(xì)方案,主機(jī)
    的頭像 發(fā)表于 03-13 11:55 ?906次閱讀

    Raksmart服務(wù)器如何支持AIGC創(chuàng)作

    為了支持AIGC創(chuàng)作的高效運(yùn)行,高性能的服務(wù)器成為不可或缺的基礎(chǔ)設(shè)施。Raksmart作為一家領(lǐng)先的服務(wù)提供商,憑借其強(qiáng)大的計(jì)算能力、靈
    的頭像 發(fā)表于 03-12 11:32 ?716次閱讀