操批日韩在线免费观看视频网站,中文一级A片韩国精品无码

在 Microsoft Ignite 2025 大會上，隨著Microsoft SQL Server 2025 的發(fā)布，AI 就緒型企業(yè)數(shù)據(jù)庫愿景成為現(xiàn)實，為開發(fā)者提供強大的新工具，例如內(nèi)置向量搜索和調(diào)用外部 AI 模型的 SQL 原生 API。NVIDIA 與微軟共同將SQL Server 2025與NVIDIA Nemotron RAG開放模型集合無縫連接，這使您能夠在云端或本地環(huán)境中基于自己的數(shù)據(jù)構(gòu)建高性能、安全的 AI 應(yīng)用。

檢索增強生成 (RAG)是企業(yè)利用數(shù)據(jù)的最有效方法。RAG 使 AI 能夠基于實時的、專有的數(shù)據(jù)進行工作，無需從零開始重新訓練模型，從而避免了巨大的成本和復雜性。然而，RAG 的有效性依賴于計算密集型的步驟，其中之一是向量嵌入生成。這在傳統(tǒng)的 CPU 基礎(chǔ)設(shè)施上造成了巨大的性能瓶頸。

大規(guī)模部署的復雜性和對模型靈活性的需求加劇了這一挑戰(zhàn)。企業(yè)需要一系列嵌入式模型來平衡不同任務(wù)的準確性、速度和成本。

本篇詳細介紹了為解決這個問題的 NVIDIA 新參考架構(gòu)。該架構(gòu)建立在 SQL Server 2025 和Llama Nemotron Embed 1B v2上，后者屬于 Nemotron RAG 系列。文中解釋了這種集成如何允許您直接從 SQL Server 數(shù)據(jù)庫調(diào)用 Nemotron RAG 模型，并將其轉(zhuǎn)變?yōu)楦咝阅艿?AI 應(yīng)用引擎。實施方案基于 Azure Cloud 和 Azure Local，涵蓋了 SQL Server 在云端或本地的主要使用場景。

使用 Nemotron RAG 和 SQL Server 2025 解決企業(yè) AI RAG 挑戰(zhàn)

通過 Nemotron RAG 將 SQL Server 2025 連接到靈活、加速的 NVIDIA AI 引擎，解決了企業(yè) AI RAG 的核心挑戰(zhàn)：性能、部署以及靈活性和安全性。

提升 RAG 性能瓶頸

該架構(gòu)通過使用 Llama Nemotron Embed 1B v2，將嵌入生成任務(wù)從 CPU 卸載到 NVIDIA GPU，解決了 RAG 核心的性能瓶頸。Llama Nemotron Embed 1B v2 是一款先進的開放模型，能夠生成準確度高的專為檢索任務(wù)優(yōu)化的嵌入。它支持多語言及跨語言的文本問答檢索，具備長上下文支持能力并優(yōu)化數(shù)據(jù)存儲。

Llama Nemotron Embed 1B v2 屬于 Nemotron RAG 系列，它包含提取、嵌入、重新排序模型，并通過 Nemotron RAG 數(shù)據(jù)集和腳本進行微調(diào)，以實現(xiàn)最佳準確性。

在數(shù)據(jù)庫方面，SQL Server 2025 在本機矢量距離函數(shù)的支持下，通過矢量搜索提供無縫、高性能的數(shù)據(jù)檢索。當嵌入式模型本地托管時，能夠消除網(wǎng)絡(luò)開銷、降低延遲，這兩大因素顯著提升了整體性能。

將 AI 模型部署為簡易的容器化端點

部署環(huán)節(jié)是NVIDIA NIM的用武之地。NIM 是預構(gòu)建的、生產(chǎn)就緒的容器，旨在簡化最新優(yōu)化的 AI 模型 (如 NVIDIA Nemotron RAG) 在任何 NVIDIA 加速基礎(chǔ)設(shè)施上的部署，無論是在云端還是本地。借助 NIM，您可以將 AI 模型部署為簡易的容器化端點，無需管理復雜的庫或環(huán)境。

此外，通過使用由 NIM 支持的本地托管模型，可以有效滿足數(shù)據(jù)駐留與合規(guī)性要求。易于使用是另一個關(guān)鍵優(yōu)勢。NIM 的預構(gòu)建性質(zhì)與原生 SQL REST API 相結(jié)合，顯著縮短了學習曲線，使企業(yè)能夠更輕松地讓 AI 貼近其客戶已有的數(shù)據(jù)。

保持安全性和靈活性

該架構(gòu)提供了一系列先進的 Nemotron RAG 模型，同時確保專有數(shù)據(jù)在 SQL Server 數(shù)據(jù)庫中的安全。NIM 專為企業(yè)級安全性而設(shè)計，并由 NVIDIA 企業(yè)支持提供保障。NIM 和 SQL Server 之間的所有通信均通過端到端 HTTPS 加密得到進一步保護。

Nemotron RAG 和 Microsoft SQL Server 2025 參考架構(gòu)

Nemotron RAG 和 SQL Server 2025 參考架構(gòu)詳細描述了使用 Llama Nemotron Embed 1B v2 嵌入模型（作為 NIM 提供）以實現(xiàn)解決方案的過程。該方案支持直接基于 Azure Cloud 或 Azure Local 部署的 SQL Server 實現(xiàn)企業(yè)級、安全、GPU 加速的 RAG 工作流。

有關(guān)此解決方案的完整代碼、部署腳本和詳細操作指南，請參閱NVIDIA NIM with SQL Server 2025 AI on Azure Cloud and Azure Local。

核心架構(gòu)組件

圖 1 展示了三個核心架構(gòu)組件和流程基礎(chǔ)，下面也將對其進行詳解。

圖1. 該架構(gòu)由三個協(xié)同工作的核心組件組成

SQL Server 2025：AI 就緒數(shù)據(jù)庫

該解決方案基于 SQL Server 2025 引入的兩項變革性功能，充當數(shù)據(jù)庫內(nèi) AI 的引擎：

原生矢量數(shù)據(jù)類型：此功能使您能夠直接將矢量嵌入安全地與結(jié)構(gòu)化數(shù)據(jù)存儲在一起，免除了對單獨矢量數(shù)據(jù)庫的需求，簡化了架構(gòu)，減少了數(shù)據(jù)移動，并支持混合搜索，例如查找既是“跑鞋”（矢量搜索）又是“庫存中”（結(jié)構(gòu)化過濾器）的產(chǎn)品。

矢量距離搜索：您現(xiàn)在可以使用內(nèi)置函數(shù)直接在 SQL Server 2025 中執(zhí)行相似性搜索。您可以根據(jù)嵌入空間的緊密程度對結(jié)果進行排名，支持語義搜索、推薦系統(tǒng)和個性化等用例，所有這些都無需離開數(shù)據(jù)庫。

創(chuàng)建外部模型：在 SQL Server 2025 中將外部 AI 模型（例如 NIM）注冊和管理為一流實體。這提供了一種無縫的方式來編排推理工作流，同時保持集中化治理和安全性。

生成嵌入：使用AI_GENERATE_EMBEDDINGS函數(shù)直接從 T-SQL 創(chuàng)建文本或其他數(shù)據(jù)的嵌入。該函數(shù)在底層利用外部 REST API 調(diào)用，無需復雜的集成步驟即可實現(xiàn)實時嵌入生成。

NVIDIA NIM：加速的 AI 引擎

Nemotron RAG系列開放模型，包括本參考架構(gòu)中使用的 Llama Nemotron Embed 1B v2 模型，作為生產(chǎn)就緒型NVIDIA NIM提供，可在標準 Docker 容器中運行。

這種方法簡化了部署，并確保云和本地 Windows 或 Linux 環(huán)境與 NVIDIA GPU 的兼容性。這些模型可以部署在 Azure Container App 上或使用 Azure Local 進行本地部署。這種容器化交付支持自動和手動擴縮容的策略，并為 SQL Server 2025 提供了理想的“本地到云端”的靈活性。

云規(guī)模：您可以使用無服務(wù)器 NVIDIA GPU將 NIM 部署到 ACA。這種方法屏蔽了所有的基礎(chǔ)設(shè)施管理工作。您將獲得支持自動縮容至零、按秒計費的按需 GPU 加速推理服務(wù)，在優(yōu)化成本的同時簡化運維。

本地部署：為了實現(xiàn)更強的數(shù)據(jù)主權(quán)和低延遲，您可以使用帶有 NVIDIA GPU 的 Azure Local 在本地運行相同的 NIM 容器。Azure Local 將 Azure 的管理平面擴展到您自己的硬件，能夠直接在本地數(shù)據(jù)上運行 AI，同時滿足嚴格的合規(guī)性或性能需求。

SQL Server和NIM 之間的鏈接

SQL Server 和 NIM 之間的通信橋梁簡單而穩(wěn)固，基于標準、安全的 Web 協(xié)議構(gòu)建。

兼容 OpenAI 的 API：NVIDIA NIM 提供兼容 OpenAI 的 API 端點。SQL Server 2025 可以使用其原生函數(shù)來調(diào)用 NIM 服務(wù)，就像調(diào)用 OpenAI 服務(wù)一樣，從而確保無縫、開箱即用的集成。

標準 POST 請求：SQL Server 2025 通過標準的 HTTPS POST 請求來檢索諸如嵌入等結(jié)果。

安全且靈活的通信：該設(shè)計使用 TLS 證書進行端到端加密，建立雙向信任并確保所有響應(yīng)對于云和本地部署都是安全、高性能且符合標準的。這相比僅限遠程模型具有顯著優(yōu)勢，因為您保有完全控制，并且專有數(shù)據(jù)永遠不會離開安全環(huán)境。

此參考架構(gòu)采用先進的 Nemotron RAG 模型，它也可以進行擴展，使 SQL Server 2025 能夠調(diào)用任何 NIM 以支持廣泛的 AI 應(yīng)用程序，例如文本摘要、內(nèi)容分類或預測分析，所有這些都可以直接在 SQL Server 2025 中的數(shù)據(jù)上執(zhí)行。

兩種部署方式

本文介紹此解決方案的兩種主要部署模式：本地部署 (使用 Azure Local) 和云部署 (使用 Azure Container App)。這兩種模式都基于相同的核心機制：SQL Server 2025 使用標準的 OpenAI 兼容協(xié)議調(diào)用 NVIDIA NIM 端點。

使用 Azure Local 進行本地部署

本地部署方案可提供更強的靈活性，支持在搭載 NVIDIA GPU 的服務(wù)器上運行多種 Windows 和 Linux 的系統(tǒng)組合，例如：

同時運行 SQL Server 和 NVIDIA NIM 的 Windows/Ubuntu Server 或 Windows/Ubuntu 本地虛擬機

運行 SQL Server 的 Windows 系統(tǒng)和運行 NVIDIA NIM 的 Ubuntu 系統(tǒng)，反之亦可

如進行部署，使用微軟新推出的 Azure Local 方案，可將 Azure Cloud 平臺直接擴展到本地環(huán)境。有關(guān)建立安全通信的完整安裝說明（包括 NIM 部署的詳細信息），請訪問 GitHub 上的NVIDIA/GenerativeAIExamples。注意此解決方案已通過 SQL Server 2025 (RC 17.0.950.3) 驗證。

云部署

云部署方案采用托管在 Azure Container App (ACA) 上的 NVIDIALlama Nemotron Embedding NIM。ACA 是微軟 Azure 提供的全托管無服務(wù)器容器平臺，不僅全面支持該架構(gòu)，還進一步放大了架構(gòu)優(yōu)勢。如需了解更多信息，請參閱 NVIDIA/GenerativeAIExamples GitHub 存儲庫中的NVIDIA NIM with Microsoft SQL Server 2025 AI on Azure Cloud and Azure Local。

這種無服務(wù)器的方式為部署基于 SQL Server 2025 數(shù)據(jù)的 AI 應(yīng)用程序提供了若干關(guān)鍵優(yōu)勢。

為加速 NIM 副本啟動，建議使用由 Azure File Share 或臨時存儲支持的 ACA 卷，以保留本地 NIM 緩存。副本數(shù)量通過 ACA HTTP 擴展功能自動管理，可支持縮容至零。

ACA 應(yīng)用程序能夠并行托管多個版本和類型的 NIM，每個 NIM 都可通過在 SQL Server 中配置的獨立 URL 進行訪問。

解決方案演示

要獲取運行完整端到端工作流的全套說明，可查閱SQL Server 2025 AI functionality with NVIDIA Retrieval QA using E5 Embedding v5。

該演示 SQL 腳本將引導您完成以下步驟：

創(chuàng)建 AdventureWorks 示例數(shù)據(jù)庫

創(chuàng)建 ProductDescriptionEmbeddings 演示表

執(zhí)行演示腳本，通過 NVIDIA NIM 集成填充嵌入

使用 Select_Embeddings.sql 驗證并可視化存儲的嵌入

此工作流演示了 SQL Server 2025 AI 的新功能，其中運用了內(nèi)置的 T-SQL AI 功能，包括：VECTOR_DISTANC、AI_GENERATE_EMBEDDINGS和CREATE EXTERNAL MODEL，這些功能共同構(gòu)成了 SQL Server 2025 中新 AI 集成的基礎(chǔ)。

開始使用 SQL Serve 2025 和 NVIDIA Nemotron RAG

Microsoft SQL Server 2025與以生產(chǎn)級 NVIDIA NIM 形式交付的 NVIDIA Nemotron RAG 相集成，為構(gòu)建高性能 AI 應(yīng)用提供了一條無縫的“本地到云端”實現(xiàn)路徑。通過結(jié)合 SQL Server 2025 內(nèi)置的 AI 功能與 NVIDIA GPU 優(yōu)化推理堆棧，能夠有效解決 RAG 核心性能瓶頸，將 AI 安全、高效地引入到數(shù)據(jù)中，并且無需額外管理復雜的數(shù)據(jù)管道。

此聯(lián)合參考架構(gòu)演示了如何在 SQL Server 2025 中構(gòu)建 RAG 應(yīng)用，使其能夠直接生成嵌入、執(zhí)行語義搜索并調(diào)用推理服務(wù)。這種方法可以在保留完整的數(shù)據(jù)主權(quán)的情況下，靈活地在數(shù)據(jù)所在的任何位置（如 Azure Cloud 或使用 Azure Local 進行本地部署）部署 NVIDIA Nemotron 等先進模型。

準備好開始了嗎？通過 NVIDIA/GenerativeAIExamples GitHub 存儲庫中的NVIDIA NIM with Microsoft SQL Server 2025 AI on Azure Cloud and Azure Local查閱所有部署腳本、代碼示例和云端及本地部署的詳細操作步驟。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴