Kioxia Corporation今日宣布,憑借其開(kāi)源的KIOXIA AiSAQ?近似最近鄰搜索(ANNS)技術(shù),成功演示在單臺(tái)服務(wù)器上實(shí)現(xiàn)48億向量的高維向量搜索擴(kuò)展。此外,Kioxia還展示了通過(guò)NVIDIA cuVS利用GPU加速,顯著縮短索引構(gòu)建時(shí)間的成果。這兩項(xiàng)成果標(biāo)志著檢索增強(qiáng)生成(RAG)搜索解決方案取得了重大進(jìn)展。目前公司正持續(xù)開(kāi)發(fā),以支持超過(guò)48億向量的更大規(guī)模部署。
大規(guī)模向量數(shù)據(jù)庫(kù)的索引構(gòu)建時(shí)間是行業(yè)的核心痛點(diǎn)。Kioxia與NVIDIA合作,演示了其在1024維高維向量的KIOXIA AiSAQ索引構(gòu)建時(shí)間上最多20倍的改進(jìn),以及端到端構(gòu)建時(shí)間上最多7.8倍的改進(jìn)。這20倍的改進(jìn)意味著,構(gòu)建索引的時(shí)間從使用CPU的28.4天縮短至使用4塊NVIDIAHopperGPU的1.4天,端到端測(cè)試時(shí)間從31天縮短至4天。
如今,AI應(yīng)用可依賴存儲(chǔ)在固態(tài)硬盤(pán)上的更大規(guī)模向量化信息(可達(dá)數(shù)百億向量及以上),而僅靠DRAM即便在十億級(jí)規(guī)模下也已不再適用。Kioxia借助KIOXIA AiSAQ技術(shù),實(shí)現(xiàn)了十億級(jí)搜索的高可擴(kuò)展存儲(chǔ)架構(gòu),在Milvus向量數(shù)據(jù)庫(kù)環(huán)境中,使用單臺(tái)查詢服務(wù)器即可滿足RAG應(yīng)用的延遲要求。其索引構(gòu)建依托GPU加速,讓大規(guī)模部署變得切實(shí)可行。
NVIDIA存儲(chǔ)技術(shù)副總裁Jason Hardy表示:“向量數(shù)據(jù)庫(kù)是那些需要在海量非結(jié)構(gòu)化數(shù)據(jù)集中實(shí)時(shí)理解意圖、上下文和相似度的應(yīng)用的核心支撐。通過(guò)借助NVIDIA cuVS庫(kù)實(shí)現(xiàn)GPU加速索引,Kioxia支持高維向量數(shù)據(jù)庫(kù)實(shí)現(xiàn)擴(kuò)展,并以前所未有的效率構(gòu)建索引?!?/p>
KIOXIA AiSAQ開(kāi)源軟件技術(shù)于去年首次發(fā)布,通過(guò)支持直接從固態(tài)硬盤(pán)進(jìn)行向量搜索并降低DRAM用量,解決了RAG技術(shù)的可擴(kuò)展性挑戰(zhàn)。KIOXIA AiSAQ技術(shù)具備高可擴(kuò)展性,非常適合多租戶環(huán)境和大規(guī)模單體索引部署。該技術(shù)采用創(chuàng)新的全局索引(Global Index)算法,結(jié)合混合聚類(lèi)和圖搜索,在超大規(guī)模下實(shí)現(xiàn)高效向量搜索。KIOXIA AiSAQ軟件提供靈活的調(diào)優(yōu)選項(xiàng),可在性能與大規(guī)模向量可擴(kuò)展性之間取得平衡,讓大規(guī)模部署更易實(shí)現(xiàn)和擴(kuò)展。
Kioxia Corporation常務(wù)執(zhí)行董事、固態(tài)硬盤(pán)事業(yè)部副總裁Masashi Yokotsuka表示:“將向量數(shù)據(jù)庫(kù)擴(kuò)展至十億級(jí)規(guī)模,需要重新思考內(nèi)存和計(jì)算方案。通過(guò)將基于KIOXIA AiSAQ固態(tài)硬盤(pán)的向量搜索與NVIDIA用于索引構(gòu)建的GPU加速相結(jié)合,我們實(shí)現(xiàn)了大規(guī)模部署下切實(shí)可行的索引構(gòu)建。作為行業(yè)創(chuàng)新者,我們將繼續(xù)利用閃存技術(shù)突破AI的邊界。”
Kioxia始終致力于推進(jìn)由存儲(chǔ)驅(qū)動(dòng)的AI解決方案,以支持大規(guī)模智能數(shù)據(jù)處理,并持續(xù)推動(dòng)KIOXIA AiSAQ向萬(wàn)億向量級(jí)部署邁進(jìn)。
審核編輯 黃宇
-
gpu
+關(guān)注
關(guān)注
28文章
5217瀏覽量
135628 -
服務(wù)器
+關(guān)注
關(guān)注
14文章
10285瀏覽量
91573 -
數(shù)據(jù)庫(kù)
+關(guān)注
關(guān)注
7文章
4038瀏覽量
68416
發(fā)布評(píng)論請(qǐng)先 登錄
不用編程不用聯(lián)網(wǎng),快速實(shí)現(xiàn)PLC與數(shù)據(jù)庫(kù)雙向數(shù)據(jù)通訊的案例
恒訊科技解析:如何在日本服務(wù)器上安裝和配置數(shù)據(jù)庫(kù)(如MySQL)?
華納云香港服務(wù)器數(shù)據(jù)庫(kù)索引優(yōu)化策略
不用編程不用聯(lián)網(wǎng),實(shí)現(xiàn)倍福(BECKHOFF)PLC對(duì)接SQL數(shù)據(jù)庫(kù),上報(bào)和查詢數(shù)據(jù)的案例
不用編程序無(wú)需聯(lián)外網(wǎng),將Rockwell羅克韋爾(AB)PLC的標(biāo)簽數(shù)據(jù)存入SQL數(shù)據(jù)庫(kù)
數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—服務(wù)器異常斷電導(dǎo)致Oracle數(shù)據(jù)庫(kù)故障的數(shù)據(jù)恢復(fù)案例
milvus向量數(shù)據(jù)庫(kù)的主要特性和應(yīng)用場(chǎng)景
硅谷GPU云服務(wù)器是什么意思?使用指南詳解
高通SoC陣列服務(wù)器
服務(wù)器數(shù)據(jù)恢復(fù)—Linux系統(tǒng)服務(wù)器崩潰的數(shù)據(jù)恢復(fù)案例
Redis 8 向量搜索實(shí)測(cè):輕松擴(kuò)展至 10 億向量
數(shù)據(jù)采集到MYSQL和SQLSERVER數(shù)據(jù)庫(kù)可以實(shí)現(xiàn)哪些功能
RAKsmart服務(wù)器SEO優(yōu)化優(yōu)勢(shì)分析
分布式存儲(chǔ)數(shù)據(jù)恢復(fù)—虛擬機(jī)上hbase和hive數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)案例
數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)——MongoDB數(shù)據(jù)庫(kù)文件拷貝后服務(wù)無(wú)法啟動(dòng)的數(shù)據(jù)恢復(fù)
KIOXIA單服務(wù)器實(shí)現(xiàn)48億高維向量搜索數(shù)據(jù)庫(kù),借助GPU實(shí)現(xiàn)索引構(gòu)建時(shí)間加速7.8倍
評(píng)論