91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用NVIDIA Nemotron RAG和Microsoft SQL Server 2025構(gòu)建高性能AI應(yīng)用

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 2025-12-01 09:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在 Microsoft Ignite 2025 大會上,隨著Microsoft SQL Server 2025 的發(fā)布,AI 就緒型企業(yè)數(shù)據(jù)庫愿景成為現(xiàn)實,為開發(fā)者提供強大的新工具,例如內(nèi)置向量搜索和調(diào)用外部 AI 模型的 SQL 原生 API。NVIDIA 與微軟共同將SQL Server 2025與NVIDIA Nemotron RAG開放模型集合無縫連接,這使您能夠在云端或本地環(huán)境中基于自己的數(shù)據(jù)構(gòu)建高性能、安全的 AI 應(yīng)用。

檢索增強生成 (RAG)是企業(yè)利用數(shù)據(jù)的最有效方法。RAG 使 AI 能夠基于實時的、專有的數(shù)據(jù)進行工作,無需從零開始重新訓練模型,從而避免了巨大的成本和復雜性。然而,RAG 的有效性依賴于計算密集型的步驟,其中之一是向量嵌入生成。這在傳統(tǒng)的 CPU 基礎(chǔ)設(shè)施上造成了巨大的性能瓶頸。

大規(guī)模部署的復雜性和對模型靈活性的需求加劇了這一挑戰(zhàn)。企業(yè)需要一系列嵌入式模型來平衡不同任務(wù)的準確性、速度和成本。

本篇詳細介紹了為解決這個問題的 NVIDIA 新參考架構(gòu)。該架構(gòu)建立在 SQL Server 2025 和Llama Nemotron Embed 1B v2上,后者屬于 Nemotron RAG 系列。文中解釋了這種集成如何允許您直接從 SQL Server 數(shù)據(jù)庫調(diào)用 Nemotron RAG 模型,并將其轉(zhuǎn)變?yōu)楦咝阅艿?AI 應(yīng)用引擎。實施方案基于 Azure Cloud 和 Azure Local,涵蓋了 SQL Server 在云端或本地的主要使用場景。

使用 Nemotron RAG 和 SQL Server 2025 解決企業(yè) AI RAG 挑戰(zhàn)

通過 Nemotron RAG 將 SQL Server 2025 連接到靈活、加速的 NVIDIA AI 引擎,解決了企業(yè) AI RAG 的核心挑戰(zhàn):性能、部署以及靈活性和安全性。

提升 RAG 性能瓶頸

該架構(gòu)通過使用 Llama Nemotron Embed 1B v2,將嵌入生成任務(wù)從 CPU 卸載到 NVIDIA GPU,解決了 RAG 核心的性能瓶頸。Llama Nemotron Embed 1B v2 是一款先進的開放模型,能夠生成準確度高的專為檢索任務(wù)優(yōu)化的嵌入。它支持多語言及跨語言的文本問答檢索,具備長上下文支持能力并優(yōu)化數(shù)據(jù)存儲。

Llama Nemotron Embed 1B v2 屬于 Nemotron RAG 系列,它包含提取、嵌入、重新排序模型,并通過 Nemotron RAG 數(shù)據(jù)集和腳本進行微調(diào),以實現(xiàn)最佳準確性。

在數(shù)據(jù)庫方面,SQL Server 2025 在本機矢量距離函數(shù)的支持下,通過矢量搜索提供無縫、高性能的數(shù)據(jù)檢索。當嵌入式模型本地托管時,能夠消除網(wǎng)絡(luò)開銷、降低延遲,這兩大因素顯著提升了整體性能。

將 AI 模型部署為簡易的容器化端點

部署環(huán)節(jié)是NVIDIA NIM的用武之地。NIM 是預構(gòu)建的、生產(chǎn)就緒的容器,旨在簡化最新優(yōu)化的 AI 模型 (如 NVIDIA Nemotron RAG) 在任何 NVIDIA 加速基礎(chǔ)設(shè)施上的部署,無論是在云端還是本地。借助 NIM,您可以將 AI 模型部署為簡易的容器化端點,無需管理復雜的庫或環(huán)境。

此外,通過使用由 NIM 支持的本地托管模型,可以有效滿足數(shù)據(jù)駐留與合規(guī)性要求。易于使用是另一個關(guān)鍵優(yōu)勢。NIM 的預構(gòu)建性質(zhì)與原生 SQL REST API 相結(jié)合,顯著縮短了學習曲線,使企業(yè)能夠更輕松地讓 AI 貼近其客戶已有的數(shù)據(jù)。

保持安全性和靈活性

該架構(gòu)提供了一系列先進的 Nemotron RAG 模型,同時確保專有數(shù)據(jù)在 SQL Server 數(shù)據(jù)庫中的安全。NIM 專為企業(yè)級安全性而設(shè)計,并由 NVIDIA 企業(yè)支持提供保障。NIM 和 SQL Server 之間的所有通信均通過端到端 HTTPS 加密得到進一步保護。

Nemotron RAG 和 Microsoft SQL Server 2025 參考架構(gòu)

Nemotron RAG 和 SQL Server 2025 參考架構(gòu)詳細描述了使用 Llama Nemotron Embed 1B v2 嵌入模型(作為 NIM 提供)以實現(xiàn)解決方案的過程。該方案支持直接基于 Azure Cloud 或 Azure Local 部署的 SQL Server 實現(xiàn)企業(yè)級、安全、GPU 加速的 RAG 工作流。

有關(guān)此解決方案的完整代碼、部署腳本和詳細操作指南,請參閱NVIDIA NIM with SQL Server 2025 AI on Azure Cloud and Azure Local。

核心架構(gòu)組件

圖 1 展示了三個核心架構(gòu)組件和流程基礎(chǔ),下面也將對其進行詳解。

wKgZPGks8C-AUYExAABqtzSs6fw174.jpg

圖1. 該架構(gòu)由三個協(xié)同工作的核心組件組成

SQL Server 2025:AI 就緒數(shù)據(jù)庫

該解決方案基于 SQL Server 2025 引入的兩項變革性功能,充當數(shù)據(jù)庫內(nèi) AI 的引擎:

原生矢量數(shù)據(jù)類型:此功能使您能夠直接將矢量嵌入安全地與結(jié)構(gòu)化數(shù)據(jù)存儲在一起,免除了對單獨矢量數(shù)據(jù)庫的需求,簡化了架構(gòu),減少了數(shù)據(jù)移動,并支持混合搜索,例如查找既是“跑鞋”(矢量搜索)又是“庫存中”(結(jié)構(gòu)化過濾器)的產(chǎn)品。

矢量距離搜索:您現(xiàn)在可以使用內(nèi)置函數(shù)直接在 SQL Server 2025 中執(zhí)行相似性搜索。您可以根據(jù)嵌入空間的緊密程度對結(jié)果進行排名,支持語義搜索、推薦系統(tǒng)和個性化等用例,所有這些都無需離開數(shù)據(jù)庫。

創(chuàng)建外部模型:在 SQL Server 2025 中將外部 AI 模型(例如 NIM)注冊和管理為一流實體。這提供了一種無縫的方式來編排推理工作流,同時保持集中化治理和安全性。

生成嵌入:使用AI_GENERATE_EMBEDDINGS函數(shù)直接從 T-SQL 創(chuàng)建文本或其他數(shù)據(jù)的嵌入。該函數(shù)在底層利用外部 REST API 調(diào)用,無需復雜的集成步驟即可實現(xiàn)實時嵌入生成。

NVIDIA NIM:加速的 AI 引擎

Nemotron RAG系列開放模型,包括本參考架構(gòu)中使用的 Llama Nemotron Embed 1B v2 模型,作為生產(chǎn)就緒型NVIDIA NIM提供,可在標準 Docker 容器中運行。

這種方法簡化了部署,并確保云和本地 Windows 或 Linux 環(huán)境與 NVIDIA GPU 的兼容性。這些模型可以部署在 Azure Container App 上或使用 Azure Local 進行本地部署。這種容器化交付支持自動和手動擴縮容的策略,并為 SQL Server 2025 提供了理想的“本地到云端”的靈活性。

云規(guī)模:您可以使用無服務(wù)器 NVIDIA GPU將 NIM 部署到 ACA。這種方法屏蔽了所有的基礎(chǔ)設(shè)施管理工作。您將獲得支持自動縮容至零、按秒計費的按需 GPU 加速推理服務(wù),在優(yōu)化成本的同時簡化運維。

本地部署:為了實現(xiàn)更強的數(shù)據(jù)主權(quán)和低延遲,您可以使用帶有 NVIDIA GPU 的 Azure Local 在本地運行相同的 NIM 容器。Azure Local 將 Azure 的管理平面擴展到您自己的硬件,能夠直接在本地數(shù)據(jù)上運行 AI,同時滿足嚴格的合規(guī)性或性能需求。

SQL Server和NIM 之間的鏈接

SQL Server 和 NIM 之間的通信橋梁簡單而穩(wěn)固,基于標準、安全的 Web 協(xié)議構(gòu)建。

兼容 OpenAI 的 API:NVIDIA NIM 提供兼容 OpenAI 的 API 端點。SQL Server 2025 可以使用其原生函數(shù)來調(diào)用 NIM 服務(wù),就像調(diào)用 OpenAI 服務(wù)一樣,從而確保無縫、開箱即用的集成。

標準 POST 請求:SQL Server 2025 通過標準的 HTTPS POST 請求來檢索諸如嵌入等結(jié)果。

安全且靈活的通信:該設(shè)計使用 TLS 證書進行端到端加密,建立雙向信任并確保所有響應(yīng)對于云和本地部署都是安全、高性能且符合標準的。這相比僅限遠程模型具有顯著優(yōu)勢,因為您保有完全控制,并且專有數(shù)據(jù)永遠不會離開安全環(huán)境。

此參考架構(gòu)采用先進的 Nemotron RAG 模型,它也可以進行擴展,使 SQL Server 2025 能夠調(diào)用任何 NIM 以支持廣泛的 AI 應(yīng)用程序,例如文本摘要、內(nèi)容分類或預測分析,所有這些都可以直接在 SQL Server 2025 中的數(shù)據(jù)上執(zhí)行。

兩種部署方式

本文介紹此解決方案的兩種主要部署模式:本地部署 (使用 Azure Local) 和云部署 (使用 Azure Container App)。這兩種模式都基于相同的核心機制:SQL Server 2025 使用標準的 OpenAI 兼容協(xié)議調(diào)用 NVIDIA NIM 端點。

使用 Azure Local 進行本地部署

本地部署方案可提供更強的靈活性,支持在搭載 NVIDIA GPU 的服務(wù)器上運行多種 Windows 和 Linux 的系統(tǒng)組合,例如:

同時運行 SQL Server 和 NVIDIA NIM 的 Windows/Ubuntu Server 或 Windows/Ubuntu 本地虛擬機

運行 SQL Server 的 Windows 系統(tǒng)和運行 NVIDIA NIM 的 Ubuntu 系統(tǒng),反之亦可

如進行部署,使用微軟新推出的 Azure Local 方案,可將 Azure Cloud 平臺直接擴展到本地環(huán)境。有關(guān)建立安全通信的完整安裝說明(包括 NIM 部署的詳細信息),請訪問 GitHub 上的NVIDIA/GenerativeAIExamples。注意此解決方案已通過 SQL Server 2025 (RC 17.0.950.3) 驗證。

云部署

云部署方案采用托管在 Azure Container App (ACA) 上的 NVIDIALlama Nemotron Embedding NIM。ACA 是微軟 Azure 提供的全托管無服務(wù)器容器平臺,不僅全面支持該架構(gòu),還進一步放大了架構(gòu)優(yōu)勢。如需了解更多信息,請參閱 NVIDIA/GenerativeAIExamples GitHub 存儲庫中的NVIDIA NIM with Microsoft SQL Server 2025 AI on Azure Cloud and Azure Local。

這種無服務(wù)器的方式為部署基于 SQL Server 2025 數(shù)據(jù)的 AI 應(yīng)用程序提供了若干關(guān)鍵優(yōu)勢。

為加速 NIM 副本啟動,建議使用由 Azure File Share 或臨時存儲支持的 ACA 卷,以保留本地 NIM 緩存。副本數(shù)量通過 ACA HTTP 擴展功能自動管理,可支持縮容至零。

ACA 應(yīng)用程序能夠并行托管多個版本和類型的 NIM,每個 NIM 都可通過在 SQL Server 中配置的獨立 URL 進行訪問。

解決方案演示

要獲取運行完整端到端工作流的全套說明,可查閱SQL Server 2025 AI functionality with NVIDIA Retrieval QA using E5 Embedding v5。

該演示 SQL 腳本將引導您完成以下步驟:

創(chuàng)建 AdventureWorks 示例數(shù)據(jù)庫

創(chuàng)建 ProductDescriptionEmbeddings 演示表

執(zhí)行演示腳本,通過 NVIDIA NIM 集成填充嵌入

使用 Select_Embeddings.sql 驗證并可視化存儲的嵌入

此工作流演示了 SQL Server 2025 AI 的新功能,其中運用了內(nèi)置的 T-SQL AI 功能,包括:VECTOR_DISTANC、AI_GENERATE_EMBEDDINGS和CREATE EXTERNAL MODEL,這些功能共同構(gòu)成了 SQL Server 2025 中新 AI 集成的基礎(chǔ)。

開始使用 SQL Serve 2025 和 NVIDIA Nemotron RAG

Microsoft SQL Server 2025與以生產(chǎn)級 NVIDIA NIM 形式交付的 NVIDIA Nemotron RAG 相集成,為構(gòu)建高性能 AI 應(yīng)用提供了一條無縫的“本地到云端”實現(xiàn)路徑。通過結(jié)合 SQL Server 2025 內(nèi)置的 AI 功能與 NVIDIA GPU 優(yōu)化推理堆棧,能夠有效解決 RAG 核心性能瓶頸,將 AI 安全、高效地引入到數(shù)據(jù)中,并且無需額外管理復雜的數(shù)據(jù)管道。

此聯(lián)合參考架構(gòu)演示了如何在 SQL Server 2025 中構(gòu)建 RAG 應(yīng)用,使其能夠直接生成嵌入、執(zhí)行語義搜索并調(diào)用推理服務(wù)。這種方法可以在保留完整的數(shù)據(jù)主權(quán)的情況下,靈活地在數(shù)據(jù)所在的任何位置(如 Azure Cloud 或使用 Azure Local 進行本地部署)部署 NVIDIA Nemotron 等先進模型。

準備好開始了嗎?通過 NVIDIA/GenerativeAIExamples GitHub 存儲庫中的NVIDIA NIM with Microsoft SQL Server 2025 AI on Azure Cloud and Azure Local查閱所有部署腳本、代碼示例和云端及本地部署的詳細操作步驟。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5588

    瀏覽量

    109700
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39683

    瀏覽量

    301287
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3749

    瀏覽量

    52089
  • Microsoft
    +關(guān)注

    關(guān)注

    0

    文章

    237

    瀏覽量

    7957

原文標題:使用 NVIDIA Nemotron RAG 和Microsoft SQL Server 2025在企業(yè)數(shù)據(jù)上構(gòu)建可擴展的 AI

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    利用NVIDIA Nemotron開放模型構(gòu)建智能文檔處理系統(tǒng)

    基于 NVIDIA Nemotron 開放模型的 AI 驅(qū)動文檔智能,增強科學研究、金融和法律等領(lǐng)域工作流。
    的頭像 發(fā)表于 02-25 11:21 ?377次閱讀

    RAG(檢索增強生成)原理與實踐

    持續(xù)迭代 :基于用戶反饋和評估結(jié)果不斷改進 選擇合適的工具棧 :根據(jù)實際需求選擇Embedding模型、向量數(shù)據(jù)庫和LLM RAG技術(shù)正在快速發(fā)展,掌握其原理與實踐,將幫助你構(gòu)建更智能、更可靠的AI應(yīng)用。
    發(fā)表于 02-11 12:46

    如何在NVIDIA CUDA Tile中編寫高性能矩陣乘法

    本博文是系列課程的一部分,旨在幫助開發(fā)者學習 NVIDIA CUDA Tile 編程,掌握構(gòu)建高性能 GPU 內(nèi)核的方法,并以矩陣乘法作為核心示例。
    的頭像 發(fā)表于 01-22 16:43 ?4797次閱讀
    如何在<b class='flag-5'>NVIDIA</b> CUDA Tile中編寫<b class='flag-5'>高性能</b>矩陣乘法

    使用NVIDIA Nemotron模型構(gòu)建語音驅(qū)動RAG智能體

    構(gòu)建智能體不僅僅是“調(diào)用 API”,而是需要將檢索、語音、安全和推理組件整合在一起,使其像一個統(tǒng)一并互相協(xié)同的系統(tǒng)一樣運行。每一層都有自己的接口、延遲限制和集成挑戰(zhàn),一旦跨過簡單的原型就會開始感受到這些挑戰(zhàn)。
    的頭像 發(fā)表于 01-14 09:28 ?400次閱讀
    使用<b class='flag-5'>NVIDIA</b> <b class='flag-5'>Nemotron</b>模型<b class='flag-5'>構(gòu)建</b>語音驅(qū)動<b class='flag-5'>RAG</b>智能體

    NVIDIA 推出 Nemotron 3 系列開放模型

    新聞?wù)?● Nemotron 3 系列開放模型包含 Nano、Super 和 Ultra 三種規(guī)模,具有極高的效率和領(lǐng)先的精度,適用于代理式 AI 應(yīng)用開發(fā)。 ● Nemotron 3 Nano
    的頭像 發(fā)表于 12-16 09:27 ?622次閱讀
    <b class='flag-5'>NVIDIA</b> 推出 <b class='flag-5'>Nemotron</b> 3 系列開放模型

    NVIDIA Nemotron如何助力企業(yè)構(gòu)建專業(yè)AI智能體

    隨著代理式 AI 的日益普及,開源模型與工具日趨成熟,各行業(yè)企業(yè)都在思考:我們該構(gòu)建怎樣的 AI 智能體來解決自身獨特的業(yè)務(wù)挑戰(zhàn)?
    的頭像 發(fā)表于 12-13 09:14 ?799次閱讀

    NVIDIA擴大與微軟合作推動AI超級工廠建設(shè)

    Microsoft Ignite 大會上,NVIDIA 擴大與微軟的合作,包括在由 NVIDIA Blackwell 平臺驅(qū)動的全新 Microsoft Fairwater
    的頭像 發(fā)表于 12-01 09:52 ?789次閱讀

    NVIDIA AI網(wǎng)絡(luò)閃耀2025云棲大會

    2025 云棲大會于 9 月 24 日至 9 月 26 日舉辦,NVIDIA 作為大會巔峰合作伙伴參與 2025 云棲大會。本文將帶您回顧 NVIDIA
    的頭像 發(fā)表于 10-13 11:19 ?1162次閱讀

    NVIDIA Nemotron模型如何推動AI發(fā)展

    Nemotron 開源技術(shù)能夠幫助開發(fā)者與企業(yè)構(gòu)建強大的通用和專用智能系統(tǒng)。
    的頭像 發(fā)表于 10-13 11:12 ?1003次閱讀

    NVIDIA Nemotron Nano 2推理模型發(fā)布

    NVIDIA 正式推出準確、高效的混合 Mamba-Transformer 推理模型系列 NVIDIA Nemotron Nano 2。
    的頭像 發(fā)表于 08-27 12:45 ?1770次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Nemotron</b> Nano 2推理模型發(fā)布

    數(shù)據(jù)庫數(shù)據(jù)恢復—SQL Server數(shù)據(jù)庫被加密如何恢復數(shù)據(jù)?

    SQL Server數(shù)據(jù)庫故障: SQL Server數(shù)據(jù)庫被加密,無法使用。 數(shù)據(jù)庫MDF、LDF、log日志文件名字被篡改。
    的頭像 發(fā)表于 06-25 13:54 ?667次閱讀
    數(shù)據(jù)庫數(shù)據(jù)恢復—<b class='flag-5'>SQL</b> <b class='flag-5'>Server</b>數(shù)據(jù)庫被加密如何恢復數(shù)據(jù)?

    ServiceNow攜手NVIDIA構(gòu)建150億參數(shù)超級助手

    Apriel Nemotron 15B 開源大語言模型 (LLM) 使用 NVIDIA NeMo、NVIDIA Llama Nemotron 開放數(shù)據(jù)集以及 ServiceNow 專業(yè)
    的頭像 發(fā)表于 05-12 15:37 ?922次閱讀

    企業(yè)使用NVIDIA NeMo微服務(wù)構(gòu)建AI智能體平臺

    已發(fā)布的 NeMo 微服務(wù)可與合作伙伴平臺集成,作為創(chuàng)建 AI 智能體的構(gòu)建模塊,使用商業(yè)智能與強大的邏輯推理模型 (包括 NVIDIA Llama Nemotron) 處理更多任務(wù)。
    的頭像 發(fā)表于 04-27 15:05 ?1277次閱讀

    NVIDIA 推出開放推理 AI 模型系列,助力開發(fā)者和企業(yè)構(gòu)建代理式 AI 平臺

    月 18 日 —— ?NVIDIA 今日發(fā)布具有推理功能的開源 Llama Nemotron 模型系列,旨在為開發(fā)者和企業(yè)提供業(yè)務(wù)就緒型基礎(chǔ),助力構(gòu)建能夠獨立工作或以團隊形式完成復雜任務(wù)的高級
    發(fā)表于 03-19 09:31 ?390次閱讀
    <b class='flag-5'>NVIDIA</b> 推出開放推理 <b class='flag-5'>AI</b> 模型系列,助力開發(fā)者和企業(yè)<b class='flag-5'>構(gòu)建</b>代理式 <b class='flag-5'>AI</b> 平臺

    AI Agent 應(yīng)用與項目實戰(zhàn)》閱讀心得3——RAG架構(gòu)與部署本地知識庫

    系統(tǒng)整體性能。在實際應(yīng)用中,還需要考慮文檔更新的增量處理、查詢結(jié)果的質(zhì)量評估、系統(tǒng)可擴展性等問題。這些工程實踐的經(jīng)驗對于構(gòu)建高性能RAG應(yīng)用系統(tǒng)具有重要的指導意義。在此分享一個重要的
    發(fā)表于 03-07 19:49