91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何為Orca-2-13B創(chuàng)建一個(gè)與OpenAI兼容的API服務(wù)呢?

jf_wN0SrCdH ? 來(lái)源:Second State ? 2023-11-27 10:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Orca-2-13B[1] 是微軟最新發(fā)布的 Orca 2 系列中的一款模型,Orca 2 另外還提供 7B 版本。Orca 2系列模型是由 LLAMA 2 基礎(chǔ)模型中微調(diào)而來(lái)。Orca 2系列模型擅長(zhǎng)推理、文本總結(jié)、數(shù)學(xué)問(wèn)題解決和理解任務(wù),是在原始 13B Orca 模型的基礎(chǔ)上進(jìn)一步發(fā)展而來(lái),模仿更強(qiáng)大的 AI 系統(tǒng)推理過(guò)程從而提高小型模型在復(fù)雜任務(wù)中的能力。

本文將以 Orca-2-13B 為例,將介紹:

如何在你自己的設(shè)備上運(yùn)行 Orca-2-13B

如何為 Orca-2-13B 創(chuàng)建一個(gè)與 OpenAI 兼容的 API 服務(wù)

你也可以使用同樣的方式運(yùn)行 Orca-2-7B 模型,只需要替換 Orca-2-7B模型的 GGUF 格式的下載鏈接。

我們將用 Rust + Wasm 技術(shù)棧來(lái)開(kāi)發(fā)和部署這個(gè)模型的應(yīng)用程序。無(wú)需安裝復(fù)雜的 Python 包或 C++ 工具鏈!了解我們?yōu)槭裁催x擇 Rust+Wasm 技術(shù)棧[2]。

在自己的設(shè)備上運(yùn)行 Orca-2-13B

步驟 1:通過(guò)以下命令行安裝 WasmEdge[3]。

curl-sSfhttps://raw.githubusercontent.com/WasmEdge/WasmEdge/master/utils/install.sh|bash-s----pluginwasi_nn-ggml

步驟 2:下載模型 GGUF 文件[4]。由于模型文件有幾 GB,所以可能需要很長(zhǎng)時(shí)間。

curl-LOhttps://huggingface.co/second-state/Orca-2-13B-GGUF/resolve/main/Orca-2-13b-ggml-model-q4_0.gguf

步驟 3:下載一個(gè)跨平臺(tái)的可移植 Wasm 文件,用于聊天應(yīng)用。該應(yīng)用能讓你用命令行與模型進(jìn)行交流。戳這里[5]查看該應(yīng)用的 Rust 源代碼。

curl-LOhttps://github.com/second-state/llama-utils/raw/main/chat/llama-chat.wasm

就這樣。接下來(lái),可以通過(guò)輸入以下命令在終端與模型進(jìn)行聊天。

wasmedge--dir.:.--nn-preloaddefaultAUTO:Orca-2-13b-ggml-model-q4_0.ggufllama-chat.wasm-pchatml-s'YouareOrca,anAIlanguagemodelcreatedbyMicrosoft.Youareacautiousassistant.Youcarefullyfollowinstructions.Youarehelpfulandharmlessandyoufollowethicalguidelinesandpromotepositivebehavior.'--stream-stdout

這個(gè)可移植的 Wasm 應(yīng)用會(huì)自動(dòng)利用你設(shè)備上的硬件加速器(如 GPU)。

在我的 Mac M1 32G 內(nèi)存設(shè)備上,它的速度約為每秒 9.15 個(gè)token。

[USER]:What isanOrca?

[ASSISTANT]:
Anorca,orkillerwhale,isalargetoothedpredatorbelongingtotheoceanicdolphinfamily.Theyarehighlyintelligentandsocialanimals,knownfortheircuriosityandplayfulness.

[USER]:

為 Orca-2-13B 創(chuàng)建一個(gè)與 OpenAI 兼容的 API 服務(wù)

一個(gè)與 OpenAI 兼容的網(wǎng)絡(luò) API 能讓 Orca-2-13B 與大量的 LLM 工具和代理框架(如 flows.network、LangChain 和 LlamaIndex)一起工作。

首先,先下載一個(gè) API 服務(wù)器應(yīng)用。它也是一個(gè)可以在許多 CPU 和 GPU 設(shè)備上運(yùn)行的跨平臺(tái)可移植 Wasm 應(yīng)用。

curl-LOhttps://github.com/second-state/llama-utils/raw/main/api-server/llama-api-server.wasm

然后,使用以下命令行啟動(dòng)模型的 API 服務(wù)器。

wasmedge--dir.:.--nn-preloaddefaultAUTO:Orca-2-13B.Q5_K_M.ggufllama-api-server.wasm-pchatml

從另一個(gè)終端,你可以使用 curl 與 API 服務(wù)器進(jìn)行交互。

curl-XPOSThttp://0.0.0.0:8080/v1/chat/completions-H'accept:application/json'-H'Content-Type:application/json'-d'{"messages":[{"role":"system","content":"YouareahelpfulAIassistant"},{"role":"user","content":"WhatisthecapitalofFrance?"}],"model":"Orca-2-13B"}'

就這樣。WasmEdge 是運(yùn)行 Orca-2-13B 大模型應(yīng)用程序最簡(jiǎn)單、最快、最安全的方式[6]。試試看吧!





審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • C++語(yǔ)言
    +關(guān)注

    關(guān)注

    0

    文章

    147

    瀏覽量

    7692
  • python
    +關(guān)注

    關(guān)注

    57

    文章

    4877

    瀏覽量

    90099
  • 硬件加速器
    +關(guān)注

    關(guān)注

    0

    文章

    43

    瀏覽量

    13490
  • Rust
    +關(guān)注

    關(guān)注

    1

    文章

    240

    瀏覽量

    7595
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1245

    瀏覽量

    10121

原文標(biāo)題:跨設(shè)備運(yùn)行微軟最新大語(yǔ)言模型 Orca-2-13B,只需4個(gè)命令行

文章出處:【微信號(hào):Rust語(yǔ)言中文社區(qū),微信公眾號(hào):Rust語(yǔ)言中文社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    調(diào)用樂(lè)天平臺(tái)API獲取商品詳情數(shù)據(jù)

    。 1. 準(zhǔn)備工作 在開(kāi)始調(diào)用API之前,你需要完成以下準(zhǔn)備工作: 注冊(cè)開(kāi)發(fā)者賬號(hào) :訪問(wèn)樂(lè)天開(kāi)發(fā)者門戶,注冊(cè)并創(chuàng)建開(kāi)發(fā)者賬號(hào)。 創(chuàng)建應(yīng)用 :在開(kāi)發(fā)者門戶中創(chuàng)建
    的頭像 發(fā)表于 02-02 16:25 ?220次閱讀
    調(diào)用樂(lè)天平臺(tái)<b class='flag-5'>API</b>獲取商品詳情數(shù)據(jù)

    1688交易APIB2B訂單自動(dòng)化,加速成交!

    ? 在B2B電商領(lǐng)域,訂單處理效率直接影響供應(yīng)鏈響應(yīng)速度。1688開(kāi)放平臺(tái)的交易API為商家提供了自動(dòng)化訂單管理能力,可顯著縮短交易周期。本文將從技術(shù)實(shí)現(xiàn)角度解析核心功能與應(yīng)用場(chǎng)景。 AP
    的頭像 發(fā)表于 01-04 15:46 ?300次閱讀
    1688交易<b class='flag-5'>API</b>:<b class='flag-5'>B2B</b>訂單自動(dòng)化,加速成交!

    1688商品詳情API指南

    、摘要 1688平臺(tái)為開(kāi)發(fā)者提供了完整的商品詳情API接口,支持獲取商品的詳細(xì)信息、規(guī)格參數(shù)、價(jià)格庫(kù)存等核心數(shù)據(jù)?;谀傲私獾墓S數(shù)據(jù)API,商品詳情API進(jìn)
    的頭像 發(fā)表于 12-11 11:09 ?791次閱讀

    系統(tǒng)調(diào)用和API有什么區(qū)別

    個(gè)很棒的功能模塊,恰好我也想使用這個(gè)模塊,但我又懶的去看你的代碼,我只想使用你的代碼,不像去關(guān)心實(shí)現(xiàn)細(xì)節(jié),你想了想把所有的功能封裝在了幾個(gè)函數(shù)上,這幾個(gè)函數(shù)就是這個(gè)功能模塊對(duì)外提供的API。 現(xiàn)在
    發(fā)表于 12-03 06:52

    如何評(píng)價(jià)OpenRouter這樣的大模型API聚合平臺(tái)?

    我個(gè)人認(rèn)為OpenRouter的商業(yè)模式特別優(yōu)雅,大模型時(shí)代的輕資產(chǎn) “賣水人”。 open router自己不訓(xùn)練模型,也不買顯卡推理,他做的就是調(diào)用別家的API,聚合了各家的API成為個(gè)
    的頭像 發(fā)表于 10-28 10:04 ?499次閱讀

    淘寶天貓上貨API接口技術(shù)指南

    。 1. 什么是淘寶天貓上貨API接口? 淘寶天貓上貨API接口是平臺(tái)提供的RESTful服務(wù),允許商家通過(guò)程序化方式上傳商品信息到店鋪。它基于HTTP協(xié)議,支持商品創(chuàng)建、編輯和發(fā)布等
    的頭像 發(fā)表于 10-21 15:22 ?505次閱讀
    淘寶天貓上貨<b class='flag-5'>API</b>接口技術(shù)指南

    RESTful API設(shè)計(jì)原則: 構(gòu)建易用、可擴(kuò)展的API接口

    (Representational State Transfer)架構(gòu)原則,構(gòu)建易用、可擴(kuò)展的API接口,幫助開(kāi)發(fā)者創(chuàng)建經(jīng)得起時(shí)間考驗(yàn)的服務(wù)。 、理解REST架構(gòu)的核心約束 1.1
    的頭像 發(fā)表于 10-20 13:45 ?824次閱讀

    什么是 API接口?

    API接口的工作原理理解 API接口最簡(jiǎn)單的方式,是從“請(qǐng)求-響應(yīng)”模型入手: 1.客戶端發(fā)起請(qǐng)求:比如在電商網(wǎng)站點(diǎn)擊“使用支付寶付款”,此時(shí)系統(tǒng)會(huì)通過(guò)
    的頭像 發(fā)表于 10-08 08:57 ?1032次閱讀

    別再搜了!國(guó)內(nèi)用戶搞定OpenAI API Key的兩種最佳實(shí)踐(保姆級(jí)教程)

    需要國(guó)際卡? 拿到Key了,卻不知道怎么在代碼里安全地使用? 別慌,你遇到的坑,我都踩過(guò)。這篇教程就是你的避坑指南,我將以“技術(shù)學(xué)長(zhǎng)”的身份,帶你走通兩條獲取OpenAI API Key的路徑,從注冊(cè)到代碼調(diào)用,幫你搞定! 、
    的頭像 發(fā)表于 08-24 19:02 ?1.2w次閱讀

    OpenAI發(fā)布2款開(kāi)源模型

    OpenAI開(kāi)源了兩款高性能權(quán)重語(yǔ)言模型gpt-oss-120b和gpt-oss-20b,OpenAI CEO Sam Altman表示:「gpt-oss 發(fā)布了!我們做了
    的頭像 發(fā)表于 08-06 14:25 ?1036次閱讀

    電商API的微服務(wù)架構(gòu)優(yōu)化策略

    ,電商API在高并發(fā)、低延遲和數(shù)據(jù)致性方面面臨嚴(yán)峻挑戰(zhàn)。本文將從基礎(chǔ)概念出發(fā),逐步分析優(yōu)化策略,幫助開(kāi)發(fā)者構(gòu)建高性能、可靠的電商API系統(tǒng)。 1. 微服務(wù)架構(gòu)在電商中的應(yīng)用 微
    的頭像 發(fā)表于 07-23 14:30 ?636次閱讀
    電商<b class='flag-5'>API</b>的微<b class='flag-5'>服務(wù)</b>架構(gòu)優(yōu)化策略

    具有載波聚合的 RX 分集 FEM(B26、B8、B12/13B2/25、B4 和 B7) skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()具有載波聚合的 RX 分集 FEM(B26、B8、B12/13B2/25、B
    發(fā)表于 06-19 18:35
    具有載波聚合的 RX 分集 FEM(<b class='flag-5'>B</b>26、<b class='flag-5'>B</b>8、<b class='flag-5'>B</b>12/<b class='flag-5'>13</b>、<b class='flag-5'>B2</b>/25、<b class='flag-5'>B</b>4 和 <b class='flag-5'>B</b>7) skyworksinc

    安卓原生兼容服務(wù)

    安卓原生兼容服務(wù)器的定義 安卓原生兼容服務(wù)器?指基于Android系統(tǒng)內(nèi)核和服務(wù)框架構(gòu)建的服務(wù)
    的頭像 發(fā)表于 06-19 17:32 ?592次閱讀

    如何獲取 OpenAI API Key?API 獲取與代碼調(diào)用示例 (詳解教程)

    OpenAI API Key 獲取與使用詳解:從入門到精通 OpenAI 正以其 GPT 和 DALL-E 等先進(jìn)模型引領(lǐng)全球人工智能創(chuàng)新。其 API 為開(kāi)發(fā)者和企業(yè)提供了強(qiáng)大的 AI
    的頭像 發(fā)表于 05-04 11:42 ?1.6w次閱讀
    如何獲取 <b class='flag-5'>OpenAI</b> <b class='flag-5'>API</b> Key?<b class='flag-5'>API</b> 獲取與代碼調(diào)用示例 (詳解教程)

    濱松光子的相機(jī)研發(fā)史:ORCA系列與qCMOS的誕生(下)

    往前走。從ORCA?系列的誕生,到C7190-20的突破,再到ImagEM?和ORCA?-Flash的升級(jí),以及最新的qCMOS? ORCA? -QUEST2 C15550-22UP,
    的頭像 發(fā)表于 03-17 06:23 ?826次閱讀
    濱松光子的相機(jī)研發(fā)史:<b class='flag-5'>ORCA</b>系列與qCMOS的誕生(下)