格靈深瞳多模態(tài)大模型榮登InfoQ 2025中國技術(shù)力量年度榜單

洞察AI變革，見證智能未來

2025中國技術(shù)力量年度榜單

AI開源明星項目TOP10

LLaVA-OneVision-1.5多模態(tài)大模型

靈感實驗室聯(lián)合LLaVA社區(qū)發(fā)布的多模態(tài)大模型LLaVA-OneVision-1.5，實現(xiàn)了訓練數(shù)據(jù)、代碼和模型權(quán)重的全鏈路開源，在多項公開多模態(tài)基準上表現(xiàn)優(yōu)于同等規(guī)模的Qwen2.5-VL。

在創(chuàng)新性上，技術(shù)團隊對“視覺編碼器+投影層+大語言模型”的LLaVA架構(gòu)進行模塊升級：視覺編碼器從CLIP替換為格靈深瞳自研Glint-ViT v1.5(RICE)，大語言模型從Qwen2替換為Qwen3。

在訓練數(shù)據(jù)方面，團隊推出完整開放的85M預訓練數(shù)據(jù)集(LLaVA-OV-1.5-Mid-Training-85M)與精篩22M指令數(shù)據(jù)集(LLaVA-OV-1.5-Instruct-22M)，并且做到“概念均衡”——構(gòu)建一個50萬的詞表，利用圖像特征與詞表特征碰撞，并控制每個詞碰到的圖片數(shù)，制作出一個不同于隨機采樣的概念均衡訓練集。

除了數(shù)據(jù)集以外，LLaVA-OneVision-1.5 技術(shù)報告、代碼、模型也已開源：

LLaVA-OneVision-1.5

技術(shù)報告：

https://arxiv.org/abs/2509.23661

代碼：

https://github.com/EvolvingLMMs-Lab/LLaVA-OneVision-1.5

模型：

https://huggingface.co/lmms-lab/LLaVA-OneVision-1.5-8B-Instruct

Demo：

https://huggingface.co/spaces/lmms-lab/LLaVA-OneVision-1.5

數(shù)據(jù)集：

Pretrain Data：https://huggingface.co/datasets/lmms-lab/LLaVA-One-Vision-1.5-Mid-Training-85M

Instruct Data：https://huggingface.co/datasets/lmms-lab/LLaVA-OneVision-1.5-Insturct-Data

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

開源

開源

+關(guān)注

關(guān)注
3

文章
4199

瀏覽量
46102
格靈深瞳

格靈深瞳

+關(guān)注

關(guān)注
1

文章
90

瀏覽量
5952
大模型

大模型

+關(guān)注

關(guān)注
2

文章
3644

瀏覽量
5173

原文標題：LLaVA-OneVision-1.5多模態(tài)大模型入選InfoQ 2025中國技術(shù)力量年度榜單

文章出處：【微信號：shentongzhineng，微信公眾號：格靈深瞳】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

格靈深瞳
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關(guān)注個人主頁

Hot 格靈深瞳發(fā)布自主研發(fā)的大規(guī)模沉浸式人機交互系統(tǒng)—大宇宙
Hot 格靈深瞳打造面向銀行運營場景的AI智能管理系統(tǒng)

New 格靈深瞳2025年度關(guān)鍵詞回顧
New 格靈深瞳入選多家媒體2025年度榜單

精選推薦
更多

文章

資料

帖子

步進控制的光柵尺全閉環(huán)EtherCAT運動控制器ZMC432CL-V2快速入門：二維螺距補償(下)

正運動技術(shù)
13小時前

1172 閱讀

地平線HSD賦能iCAR V27：超強算力+真一段式端到端，定義硬派SUV智駕標桿

章鷹觀察
14小時前

757 閱讀

如何在邊緣AI應用場景中實現(xiàn)高性能、低功耗推理（上）

RA生態(tài)工作室
15小時前

974 閱讀

基于XILINX Vivado平臺的GTX收發(fā)器的開發(fā)

FPGA設計論壇
15小時前

922 閱讀

瑞薩RA系列FSP庫開發(fā)實戰(zhàn)指南之QSPI讀寫外部Flash芯片實驗

瑞薩嵌入式小百科
16小時前

954 閱讀

耳機檢驗標準

YYXIAO
43

5積分

50下載

FPS200在基于DSP的嵌入式系統(tǒng)中的應用

nana
1.22 MB

免費

71下載

Vladimir日志采集工具

莫聯(lián)雪
23.00 MB

2積分

1下載

Maltrail惡意流量檢測系統(tǒng)

梁宏滿
6.25 MB

免費

0下載

用于ADE7816 6通道能量監(jiān)視器ASIC的分線板

鳳毛麟角
0.16 MB

2積分

4下載

RDMA設計47：雙邊語義驗證

xianuser2012
2天前

398 閱讀

飛凌嵌入式ElfBoard-進程之什么是進程

jf_13411809
2天前

835 閱讀

RDMA設計46：RoCE v2原語功能：單邊語義

xianuser2012
3天前

812 閱讀

基于STM32F103C8T6的智能超聲波測距尺：從原理到代碼的完整實現(xiàn)

jf_51201288
4天前

1758 閱讀

《Altium Designeder 25電路設計精講實踐》SAM V71章節(jié)有感

HXM1539
5天前

1715 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲日韩欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

搜索歷史

格靈深瞳多模態(tài)大模型榮登InfoQ 2025中國技術(shù)力量年度榜單

評論