91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

模型原生操作系統(tǒng):機(jī)遇、挑戰(zhàn)與展望 CCCF精選

OpenHarmony TSC ? 來源:OpenHarmony TSC ? 作者:OpenHarmony TSC ? 2025-03-14 17:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文立足人工智能時代用戶、應(yīng)用和系統(tǒng)的需求,分析“外掛式模型”演進(jìn)路徑下的操作系統(tǒng)發(fā)展困局,提出通過“模型-系統(tǒng)-芯片”的全棧協(xié)同設(shè)計(jì)來構(gòu)建模型原生操作系統(tǒng),并進(jìn)一步探討了面臨的機(jī)遇與挑戰(zhàn),以及業(yè)界與作者團(tuán)隊(duì)的相關(guān)初步探索。

wKgZO2fT-8mAOUpTAAC-Z-xLPOs337.png

以ChatGPT為代表的生成式人工智能(Generative AI)正在深刻變革人類社會。大模型憑借其卓越的語言理解、內(nèi)容生成與邏輯推理能力,已成為科技發(fā)展的新范式與重要推動力。全球主要經(jīng)濟(jì)體和科技巨頭紛紛布局,美國和歐盟累計(jì)投資上千億美元推進(jìn)技術(shù)研發(fā),微軟、英偉達(dá)、蘋果、谷歌等公司在模型架構(gòu)、系統(tǒng)、芯片等方面展開全方位競爭。

然而,操作系統(tǒng)作為計(jì)算機(jī)系統(tǒng)的核心樞紐,其與人工智能技術(shù)的融合仍面臨諸多挑戰(zhàn)。當(dāng)前主流方案如微軟的Windows Copilot和蘋果的Apple Intelligence機(jī)制,采用將模型作為外掛服務(wù)的方式。這種方案雖然能快速落地,但模型的概率性特征、軟硬件棧的復(fù)雜性,以及模型-系統(tǒng)-芯片的割裂狀態(tài)等結(jié)構(gòu)性問題,導(dǎo)致當(dāng)前基于模型的智能應(yīng)用存在可控性差、開發(fā)難度大、算力效能低等短板,領(lǐng)域生態(tài)面臨“重作詩、輕做事”、生態(tài)碎片化、智能水平受限等問題。

本文立足人工智能時代用戶、應(yīng)用和系統(tǒng)的需求,分析“外掛式”AI演進(jìn)路徑下的操作系統(tǒng)發(fā)展困局,提出通過“模型-系統(tǒng)-芯片”的全棧協(xié)同設(shè)計(jì)來構(gòu)建模型原生操作系統(tǒng)。這一新型操作系統(tǒng)將重構(gòu)交互范式、接口抽象、執(zhí)行模式、安全機(jī)制等,打通智能應(yīng)用間的數(shù)據(jù)壁壘,促進(jìn)多模型有機(jī)協(xié)同,優(yōu)化資源供給以提升運(yùn)行效能,最終實(shí)現(xiàn)模型的概率性智能與操作系統(tǒng)的確定性規(guī)則的有機(jī)統(tǒng)一。本文將探討模型原生操作系統(tǒng)面臨的機(jī)遇與挑戰(zhàn),并介紹業(yè)界與作者團(tuán)隊(duì)的相關(guān)初步探索。

人工智能時代操作系統(tǒng)的需求與挑戰(zhàn)

算法、數(shù)據(jù)、算力被譽(yù)為人工智能發(fā)展的三大引擎。操作系統(tǒng)的泛在性是連接和驅(qū)動這三大引擎的關(guān)鍵紐帶,是人工智能邁向通用智能、賦能千行百業(yè)的重要基石。從操作系統(tǒng)的視角來看,包括大模型、小模型、傳統(tǒng)機(jī)器學(xué)習(xí)方法等在內(nèi)的“模型”正在演變?yōu)橐环N底層基礎(chǔ)能力。人工智能時代的操作系統(tǒng)亟須實(shí)現(xiàn)對模型的原生支持,以滿足來自用戶、應(yīng)用及系統(tǒng)自身的智能化需求,在執(zhí)行效能、智力水平、交互范式、隱私保護(hù)與系統(tǒng)安全等方面實(shí)現(xiàn)變革。

執(zhí)行效能

隨著生成式人工智能的發(fā)展,模型參數(shù)規(guī)模呈指數(shù)級增長,對算力的需求也急劇攀升。為提供更強(qiáng)的算力支撐,GPU、NPU等新型算力硬件組成的異構(gòu)、混合精度算力系統(tǒng)已成為當(dāng)前人工智能場景的基礎(chǔ)設(shè)施,主流芯片設(shè)計(jì)廠商紛紛推出異構(gòu)算力芯片。異構(gòu)算力也促使虛擬數(shù)字人等新興應(yīng)用場景出現(xiàn),該應(yīng)用往往需要GPU/NPU/CPU等多種計(jì)算硬件協(xié)同工作以支持虛擬數(shù)字人的實(shí)時交互和智能表現(xiàn)。在這一趨勢下,操作系統(tǒng)需要管理的資源從傳統(tǒng)的離散垂域分治轉(zhuǎn)向異構(gòu)融合架構(gòu),這帶來了雙重挑戰(zhàn):(1)異構(gòu)算力的融合使編程模型與框架日趨復(fù)雜,迫切需要操作系統(tǒng)向應(yīng)用提供統(tǒng)一、易用的編程抽象,以降低開發(fā)門檻;(2)不同硬件具有獨(dú)特的性能特質(zhì)和適用場景,如GPU、NPU適合大批量數(shù)據(jù)的高吞吐計(jì)算,CPU則更適合小規(guī)模數(shù)據(jù)的低延遲處理,這要求操作系統(tǒng)能夠智能規(guī)劃任務(wù)分配,實(shí)現(xiàn)異構(gòu)硬件的協(xié)同調(diào)度,最終提升系統(tǒng)整體執(zhí)行效能。

智力水平

大模型的迅猛發(fā)展正在重塑智能終端設(shè)備形態(tài),有望賦能百億級參數(shù)的智能設(shè)備。全球領(lǐng)先的智能手機(jī)、個人電腦(PC)和汽車制造商正積極探索將大模型部署至移動設(shè)備和車載芯片上,以獲得更好的隱私保護(hù)和發(fā)揮本地化優(yōu)勢。谷歌推出的AI Core可在智能手機(jī)上運(yùn)行擁有20億參數(shù)的Gemini Nano模型,蘋果計(jì)劃在iOS 18中整合30億參數(shù)的本地大模型,華為也通過鴻蒙原生智能將AI能力下沉到終端。面對這一趨勢,操作系統(tǒng)必須突破創(chuàng)新,使規(guī)模更大、智能水平更高的模型能夠在終端設(shè)備上高效運(yùn)行。然而,現(xiàn)有的模型壓縮方法如量化、裁剪等往往導(dǎo)致模型性能顯著下降。這一技術(shù)瓶頸要求操作系統(tǒng)深入理解模型特性,探索更有針對性的優(yōu)化方案,而不能僅依靠簡單的壓縮、量化等手段。

交互范式

大模型正在引領(lǐng)人機(jī)交互范式的革命性轉(zhuǎn)變,將用戶從傳統(tǒng)的圖形界面演進(jìn)為語音、手勢、眼神等自然時空交互。很多行業(yè)正在積極探索這一新型交互形態(tài),例如,OpenAI的GPT-4o支持實(shí)時語音對話,可充當(dāng)智能家教輔導(dǎo)作業(yè);智譜AI的AutoGLM能夠理解并執(zhí)行復(fù)雜甚至跨APP的指令,包括“在線購物”“酒店預(yù)訂”甚至“發(fā)送紅包”等。可以預(yù)見,隨著數(shù)字化與智能化的深入,大模型將成為人機(jī)交互的重要入口,甚至能夠根據(jù)用戶習(xí)慣和場景動態(tài)調(diào)整交互界面。然而,當(dāng)前模型在理解用戶界面方面仍面臨諸多挑戰(zhàn)。例如,界面元素往往具有多樣的分辨率、比例和布局,并包含大量細(xì)粒度的文本、按鈕等交互對象,這些特點(diǎn)使現(xiàn)有模型難以準(zhǔn)確理解界面語義,制約了自然語言交互的效果。

隱私保護(hù)與系統(tǒng)安全

隨著大模型應(yīng)用的普及,其安全與隱私問題日益突出。近期歐洲數(shù)據(jù)保護(hù)委員會(EDPB)和意大利隱私監(jiān)管機(jī)構(gòu)對OpenAI服務(wù)進(jìn)行了嚴(yán)格審查,意大利甚至一度叫停ChatGPT。大模型的隱私保護(hù)涉及多個層面:(1)在數(shù)據(jù)層面,模型在訓(xùn)練和推理過程中可能泄露敏感信息,同時模型參數(shù)本身也是重要的數(shù)字資產(chǎn);(2)在系統(tǒng)層面,復(fù)雜的軟硬件棧難免存在安全漏洞;(3)在行為層面,模型輸出的不確定性可能導(dǎo)致越權(quán)操作或偏離預(yù)期;(4)當(dāng)前系統(tǒng)過度關(guān)注性能指標(biāo),缺乏系統(tǒng)化的行為審計(jì)與約束機(jī)制。這要求我們構(gòu)建多維度的安全防護(hù)體系,在數(shù)據(jù)、系統(tǒng)、行為、審計(jì)等層面實(shí)現(xiàn)全方位的隱私保護(hù)。

當(dāng)前“外掛式”AI演進(jìn)路徑的發(fā)展困局

以微軟Windows Copilot為代表的AI發(fā)展路徑以“外掛”形式在操作系統(tǒng)中提供智能化服務(wù)。Windows 11操作系統(tǒng)內(nèi)置了專門的Copilot窗口,支持用戶通過任務(wù)欄圖標(biāo)、快捷鍵或?qū)S冒存I等多種方式快速調(diào)用AI助手。Copilot不僅能夠進(jìn)行文本對話,還能執(zhí)行調(diào)整系統(tǒng)設(shè)置、輔助日常操作、給出寫作建議等多樣化任務(wù)。然而,這種將AI作為外掛式服務(wù)集成到現(xiàn)有操作系統(tǒng)的方案,雖然能夠快速落地并讓用戶體驗(yàn)到智能服務(wù),但從長遠(yuǎn)來看,存在算力差、智力差、魅力差、安全差四個方面的根本性困局,阻礙人工智能技術(shù)與操作系統(tǒng)的深度融合,影響為用戶提供更高水平的智能服務(wù)。

算力差:無法充分利用異構(gòu)硬件的計(jì)算能力

當(dāng)前算力硬件呈現(xiàn)快速迭代和多元化發(fā)展趨勢。一方面,主流GPU硬件不斷升級迭代;另一方面,各類AI芯片在提供特定算力優(yōu)化的同時,也在能耗、性價比等方面給予了更多選擇。智能手機(jī)、AI PC等端側(cè)場景更是普遍采用混合算力架構(gòu),追求提升絕對計(jì)算能力的同時降低整體功耗。但在端側(cè)部署大模型時,其參數(shù)規(guī)模當(dāng)前停留在70億左右,大大限制了系統(tǒng)的智能水平。隨著智能化應(yīng)用的普及,算力硬件資源不再被少數(shù)應(yīng)用獨(dú)享,亟須操作系統(tǒng)對異構(gòu)化算力進(jìn)行統(tǒng)一、高效、協(xié)同的調(diào)度和管理,進(jìn)而將硬件的絕對計(jì)算能力兌現(xiàn)成應(yīng)用和系統(tǒng)的智力。外掛式智能服務(wù)面臨的困局在于,缺少操作系統(tǒng)的原生支持,無法有效利用和管理混合、異構(gòu)化算力資源,甚至可能造成算力資源的競爭與沖突。

智力差:智能化技術(shù)難以與操作系統(tǒng)深度融合

以外掛方式集成智能技術(shù),僅能提供單向、有限的智能化支持,難以與操作系統(tǒng)各模塊深度融合,導(dǎo)致智能技術(shù)難以滲透到操作系統(tǒng)的關(guān)鍵服務(wù)和功能,限制了系統(tǒng)的智能化水平,阻礙其從“作詩”走向“做事”。外掛式智能技術(shù)難以利用操作系統(tǒng)的底層數(shù)據(jù)和資源,大大限制了其智力水平。例如,Windows Copilot無法直接訪問系統(tǒng)深層數(shù)據(jù),未能與系統(tǒng)深度融合,且已被降級為漸進(jìn)式網(wǎng)絡(luò)應(yīng)用程序(PWA)。此外,外掛式智能技術(shù)存在數(shù)據(jù)孤島、響應(yīng)延遲高等問題,模型的概率性問題進(jìn)一步突顯,導(dǎo)致資源分配、任務(wù)調(diào)度及內(nèi)存管理等系統(tǒng)服務(wù)的智能化受到極大限制,難以實(shí)現(xiàn)深度系統(tǒng)級優(yōu)化。

魅力差:未能突破傳統(tǒng)操作系統(tǒng)固化的交互模式

傳統(tǒng)操作系統(tǒng)固化的交互邏輯難以滿足用戶群體的不同偏好,以及在不同場景下的交互需求。一方面,現(xiàn)有交互邏輯仍然是由開發(fā)者靜態(tài)設(shè)計(jì),所有用戶體驗(yàn)一份相同的交互邏輯,無法提供“千人千面”的個性化用戶體驗(yàn)。另一方面,不同應(yīng)用的交互邏輯完全獨(dú)立,即便一個簡單的用戶任務(wù)也會涉及多個應(yīng)用,導(dǎo)致用戶必須在應(yīng)用之間反復(fù)切換。傳統(tǒng)操作系統(tǒng)固化的交互模式大大限制了智能技術(shù)融入人機(jī)交互過程。以蘋果公司Ferret-UI為例,其雖能利用多模態(tài)大模型操控用戶界面(UI)屏幕完成任務(wù),但受限于固化交互模式,仍然被迫在多個應(yīng)用間頻繁切換與操作,單次任務(wù)包含冗長的操作與決策鏈條,導(dǎo)致任務(wù)完成率低、完成時間長、推理費(fèi)用高等問題。

安全差:易導(dǎo)致系統(tǒng)安全隱患和隱私泄露問題

當(dāng)前智能技術(shù)本身存在不可解釋、不確定等安全隱患,而智能服務(wù)的執(zhí)行模式、交互方式等仍處于快速迭代發(fā)展中,其安全可靠性遠(yuǎn)低于操作系統(tǒng)。近年來,使用ChatGPT引發(fā)的機(jī)密泄露事件頻發(fā),反映出大模型和智能服務(wù)面臨安全挑戰(zhàn)。以外掛形式集成智能服務(wù),未將其納入到整個系統(tǒng)的安全保護(hù)機(jī)制中,可能引入安全漏洞并放大操作系統(tǒng)攻擊面,勢必影響系統(tǒng)的安全穩(wěn)定。如果允許外掛式智能服務(wù)直接訪問系統(tǒng)和處理數(shù)據(jù),容易被利用成為攻擊入口和跳板。而如果單純將其隔離在外,智能服務(wù)使用的用戶數(shù)據(jù)又會面臨隱私泄露風(fēng)險。

上述困局本質(zhì)上源于外掛式智能服務(wù)方案未能實(shí)現(xiàn)AI與操作系統(tǒng)的有機(jī)融合,最終限制了整體的智能化水平。要真正發(fā)揮AI的潛力,需要在操作系統(tǒng)架構(gòu)層面進(jìn)行更深層次的變革。

破局思考:模型原生操作系統(tǒng)

模型作為一種底層基礎(chǔ)能力,在人工智能時代的操作系統(tǒng)演進(jìn)中必然扮演著重要角色,但操作系統(tǒng)以何種路徑與模型融合是一個重要且開放的問題。圖1對比了不同的發(fā)展路徑。圖1(a)為漸進(jìn)路線,即采用前文所提的將大模型作為應(yīng)用外掛到現(xiàn)有操作系統(tǒng)的方法,優(yōu)點(diǎn)是對現(xiàn)有操作系統(tǒng)改動少,可快速落地;缺點(diǎn)在于割裂模型與操作系統(tǒng),制約了模型的能力。圖1(b)為激進(jìn)路線,即用大模型一次性取代操作系統(tǒng)成為新的操作系統(tǒng),優(yōu)點(diǎn)在于可充分發(fā)揮大模型的智能能力;缺點(diǎn)在于完全顛覆現(xiàn)有軟件格局與生態(tài),過于依賴模型本身的能力,缺乏與物理世界的交互能力,也缺乏對輸出的確定性保證。

wKgZO2fT-8qAH-e6AANJXrmuPAk848.png

圖1 智能時代操作系統(tǒng)與模型融合的不同發(fā)展路徑的系統(tǒng)架構(gòu)對比

與前兩種技術(shù)路線不同,我們提出采用融合路線探索模型原生操作系統(tǒng),如圖1(c)所示。融合路線基于模型與操作系統(tǒng)雙向奔赴的思路,即系統(tǒng)原生為模型設(shè)計(jì),模型原生為系統(tǒng)調(diào)整,通過在服務(wù)模型操控、供給模型資源、融合模型能力方面進(jìn)行探索,實(shí)現(xiàn)模型與操作系統(tǒng)的多層次深度融合。通過“模型-系統(tǒng)-芯片”全棧協(xié)同設(shè)計(jì),重構(gòu)接口抽象、執(zhí)行模式、運(yùn)行效能和安全機(jī)制等核心要素,實(shí)現(xiàn)概率性智能與確定性規(guī)則的有機(jī)統(tǒng)一,提升手機(jī)、PC、通用機(jī)器人、智能制造等領(lǐng)域的系統(tǒng)智能化水平,為用戶提供更加流暢、智能、個性化的服務(wù)。在此,我們將從六個維度闡述對模型原生操作系統(tǒng)的思考。

思考一:智能交互范式(面向交互范式革新)

大模型正在重塑操作系統(tǒng)與用戶的交互方式。傳統(tǒng)操作系統(tǒng)采用直接面向用戶的交互設(shè)計(jì),用戶通過命令行、圖形界面、語音等接口操控硬件。在模型原生時代,用戶將更多地通過與智能體交互實(shí)現(xiàn)設(shè)備控制。然而,當(dāng)前操作系統(tǒng)的交互框架與智能體存在多重不匹配。在接口層面,現(xiàn)有框架主要依賴圖形界面表達(dá)功能語義,而大模型在UI理解的準(zhǔn)確性和確定性方面仍有明顯短板;在邏輯層面,傳統(tǒng)框架要求開發(fā)者靜態(tài)設(shè)計(jì)每個應(yīng)用的交互邏輯,難以支持大模型為用戶提供動態(tài)個性化的交互體驗(yàn);在能力層面,應(yīng)用間數(shù)據(jù)與功能的割裂狀態(tài),阻礙了操作系統(tǒng)利用大模型實(shí)現(xiàn)跨應(yīng)用的智能服務(wù)。

為應(yīng)對這些挑戰(zhàn),模型原生操作系統(tǒng)需要在多個層面進(jìn)行協(xié)同創(chuàng)新。在交互接口層面,設(shè)計(jì)面向模型的新型操作接口,使模型能夠準(zhǔn)確高效地調(diào)用系統(tǒng)功能;在交互邏輯層面,提供支持多模態(tài)的生成式交互邏輯開發(fā)框架,使開發(fā)者能夠利用大模型動態(tài)構(gòu)建時空自然交互;在交互能力層面,構(gòu)建“系統(tǒng)-模型-應(yīng)用”的數(shù)據(jù)互通機(jī)制,打通應(yīng)用間壁壘,支持基于上下文的智能交互。

思考二:創(chuàng)新系統(tǒng)抽象接口(面向提高執(zhí)行效能)

隨著模型與操作系統(tǒng)的融合,傳統(tǒng)操作系統(tǒng)的抽象面臨挑戰(zhàn)。現(xiàn)有接口針對命令式服務(wù)設(shè)計(jì),難以滿足智能體的需求:(1)無法充分表達(dá)應(yīng)用語義或?qū)崿F(xiàn)端到端智能優(yōu)化;(2)缺乏原生智能化能力支持,增加了開發(fā)負(fù)擔(dān),限制了智能體間的協(xié)作。同時,現(xiàn)有接口難以暴露底層系統(tǒng)服務(wù)和異構(gòu)硬件能力,導(dǎo)致性能損失。

為應(yīng)對這些挑戰(zhàn),操作系統(tǒng)須引入智能化抽象,支持從單一命令到端到端需求的動態(tài)、靈活表達(dá)。在系統(tǒng)層面,支持多種層次的系統(tǒng)服務(wù)接口,高層接口滿足傳統(tǒng)應(yīng)用和程序使用,底層接口用于高性能智能應(yīng)用優(yōu)化,充分平衡智能的應(yīng)用和系統(tǒng)的實(shí)時性。同時,應(yīng)結(jié)合歷史行為和模型智能,利用生成式接口的新特性實(shí)現(xiàn)自我優(yōu)化與智能演進(jìn)。

思考三:系統(tǒng)內(nèi)生智能(面向提高智力水平)

當(dāng)前智能體的能力邊界局限于單個應(yīng)用范圍,各應(yīng)用通過外掛模型實(shí)現(xiàn)智能化。例如,用戶期望智能體能自動完成日程安排,這需要跨越日歷、會議、郵件等多個應(yīng)用實(shí)現(xiàn)協(xié)同。然而,目前面向特定領(lǐng)域的專用模型在適應(yīng)性和魯棒性方面存在明顯不足。典型案例是當(dāng)前的手機(jī)智能助手,雖然能夠執(zhí)行簡單的購物任務(wù),但一旦遇到未經(jīng)訓(xùn)練的廣告彈窗等干擾就極易中斷操作。

為此,模型原生操作系統(tǒng)應(yīng)具備內(nèi)生智能,從而有機(jī)整合來自不同應(yīng)用智能體的能力,實(shí)現(xiàn)跨應(yīng)用的無縫配合與復(fù)雜協(xié)同。這就需要構(gòu)建面向操作系統(tǒng)的通用基礎(chǔ)模型,提供系統(tǒng)級智能體服務(wù),并實(shí)現(xiàn)模型能力與系統(tǒng)功能的深度融合,支持跨應(yīng)用的無縫協(xié)作;同時,建立高效的持續(xù)學(xué)習(xí)機(jī)制,探索新的操作系統(tǒng)內(nèi)生智能的訓(xùn)練方法,并實(shí)現(xiàn)高效、低成本的持續(xù)訓(xùn)練和微調(diào),以更好地滿足用戶多樣化的智能需求。

思考四:智能知識存儲(面向提高智力水平)

模型智能水平與知識型數(shù)據(jù)緊密相關(guān),現(xiàn)有存儲系統(tǒng)主要面向數(shù)據(jù)而非知識,難以滿足大模型對知識生成、管理和利用的需求。在縱向維度,現(xiàn)有系統(tǒng)在設(shè)計(jì)上強(qiáng)調(diào)對原始數(shù)據(jù)的存取,缺乏對數(shù)據(jù)語義層次和知識表示的高效支持;在橫向維度,模型應(yīng)用模糊化的輸入使多模態(tài)、多類型的存儲系統(tǒng)關(guān)聯(lián)更加緊密,而異構(gòu)表達(dá)形式給數(shù)據(jù)跨應(yīng)用橫向流動帶來挑戰(zhàn)。

為應(yīng)對這些挑戰(zhàn),在縱向?qū)用妫到y(tǒng)須面向知識存儲最大程度地利用軟硬協(xié)同的通信機(jī)制,提供與硬件演進(jìn)協(xié)同發(fā)展的編程抽象;在橫向?qū)用?,系統(tǒng)應(yīng)通過更高整合度的數(shù)據(jù)結(jié)構(gòu)與通信機(jī)制,實(shí)現(xiàn)不同存儲系統(tǒng)數(shù)據(jù)互通與協(xié)作,為模型提供跨應(yīng)用的數(shù)據(jù)融合能力,使多模態(tài)等任務(wù)中的數(shù)據(jù)協(xié)同更加高效,從而提升模型在復(fù)雜場景下的智能水平。

思考五:高效算力供給(面向提高執(zhí)行效能)

模型對算力有著極高的要求。然而,模型原生操作系統(tǒng)在為模型提供算力時,不能僅考慮模型本身的需求,還要綜合考慮算力、內(nèi)存、功耗、智能水平等多個相互制衡的關(guān)鍵指標(biāo)。當(dāng)前異構(gòu)算力硬件體系為智能應(yīng)用提供了關(guān)鍵性的算力支撐,但當(dāng)前操作系統(tǒng)仍然以特殊外設(shè)的方式管理算力硬件,智能應(yīng)用主要依賴專門化適配與設(shè)計(jì)來利用特定的算力硬件,導(dǎo)致系統(tǒng)嚴(yán)重碎片化,也大大限制了智能應(yīng)用的發(fā)展和普及。

為應(yīng)對這些挑戰(zhàn),需要在多個層面實(shí)施優(yōu)化策略。在模型層面,研究如何在保持模型性能的同時減少參數(shù)量;探索動態(tài)調(diào)整模型結(jié)構(gòu)的方法,并針對智能體等復(fù)雜場景提出針對性的模型微調(diào)和輕量化設(shè)計(jì)。在系統(tǒng)層面,探索端側(cè)資源受限場景下的高效推理方案,包括面向操作系統(tǒng)目標(biāo)任務(wù)的模型稀疏化、投機(jī)推理等;同時設(shè)計(jì)新的計(jì)算卸載方案,在保證用戶數(shù)據(jù)隱私以及對應(yīng)用盡可能透明的前提下,充分利用來自富算力設(shè)備的計(jì)算資源。在硬件層面,探索異構(gòu)計(jì)算架構(gòu),針對不同類型任務(wù)提供專用處理單元并實(shí)現(xiàn)協(xié)同調(diào)度和統(tǒng)一管理,提高整體效率。

思考六:系統(tǒng)安全可靠(面向隱私保護(hù)與系統(tǒng)安全)

隨著大模型系統(tǒng)應(yīng)用越來越廣泛,其在隱私安全與可靠性方面的挑戰(zhàn)也越來越突出。在數(shù)據(jù)隱私方面,一方面大模型在訪問和生成數(shù)據(jù)時,可能會泄露隱私數(shù)據(jù)和敏感信息;另一方面,大模型自身的參數(shù)也是需要保護(hù)的重要數(shù)字資產(chǎn)。在可靠性層面,大模型的輸出存在不確定性,可能導(dǎo)致模型執(zhí)行未經(jīng)授權(quán)的操作或出現(xiàn)偏離預(yù)期的行為;目前的系統(tǒng)往往注重性能和精度等指標(biāo)的提升,缺乏有效的行為審計(jì)機(jī)制和約束技術(shù)。

為應(yīng)對這些挑戰(zhàn),在數(shù)據(jù)安全方面,應(yīng)對大模型的參數(shù)和數(shù)據(jù)進(jìn)行“存儲-傳輸-計(jì)算”的全生命周期加密保護(hù),嚴(yán)格控制數(shù)據(jù)流轉(zhuǎn)時的訪問權(quán)限,并構(gòu)建輕量化、定制化的可信AI軟件棧,減少攻擊面以提高系統(tǒng)的整體安全性;在可靠性方面,提出面向智能應(yīng)用安全的內(nèi)生安全審計(jì)機(jī)制,通過彈性規(guī)則對模型的行為進(jìn)行動態(tài)約束,在保證模型智能水平的同時有效提升確定性。

當(dāng)前探索與實(shí)踐

模型原生操作系統(tǒng)作為一種新興的技術(shù)范式,正在成為人工智能大模型從“作詩”走向“做事”的關(guān)鍵。雖然目前尚未出現(xiàn)完全實(shí)現(xiàn)這一設(shè)計(jì)理念的成熟產(chǎn)品,但國內(nèi)外學(xué)術(shù)界和工業(yè)界已經(jīng)開展了這方面的初步探索。

OpenAI聯(lián)合創(chuàng)始人安德烈·卡帕西(Andrej Karpathy)在2023年11月提出了LLM OS理念,激進(jìn)地用大語言模型替代操作系統(tǒng)(LLM as OS)。美國羅格斯大學(xué)提出的AIOS是LLM OS理念的一次初步實(shí)踐。然而,這類探索主要存在兩個局限:一是提出了全新的交互范式和軟件開發(fā)模式,難以有效兼容現(xiàn)有軟件生態(tài);二是將模型作為黑盒使用,并未針對模型的推理效能、智力水平等進(jìn)行針對性地優(yōu)化。作為一種折衷方案,SWE-agent提出了智能體-計(jì)算機(jī)接口(Agent-Computer Interface, ACI),將大模型智能體在軟件工程任務(wù)中能夠解決的問題從3.8%提升至18%,驗(yàn)證了操作系統(tǒng)與大模型協(xié)同的重要性。

除了系統(tǒng)架構(gòu)和編程接口層面的創(chuàng)新,工業(yè)界正在積極探索操作系統(tǒng)智能體技術(shù)。美國Anthropic公司的Computer Use和國內(nèi)智譜公司的AutoGLM等系統(tǒng)通過將云端大模型與圖形界面(GUI)深度融合,實(shí)現(xiàn)了智能化的界面操作自動化,在辦公應(yīng)用、社交媒體、在線購物等場景展現(xiàn)出接近人類水平的操作能力。然而,當(dāng)前基于外掛式多模態(tài)大模型的方案在處理動態(tài)UI和復(fù)雜操作時仍面臨挑戰(zhàn)。同時,依賴云端大模型帶來的網(wǎng)絡(luò)延遲和隱私安全問題也亟待解決。

為了支持大模型在端側(cè)設(shè)備中的推理,當(dāng)前業(yè)界提出了多種端側(cè)大模型推理框架,如ExecuTorch、llama.cpp和MLC LLM等,然而這些系統(tǒng)對異構(gòu)算力的利用有限,端側(cè)設(shè)備通常只能運(yùn)行不超過100億參數(shù)的小型模型,制約了模型原生操作系統(tǒng)的性能水平。為解決這一問題,上海交通大學(xué)推出PowerInfer系列工作,首次探索“模型-系統(tǒng)-芯片”協(xié)同設(shè)計(jì)理念,實(shí)現(xiàn)端側(cè)大模型的顯著加速。該方案在模型層面采用Turbo Sparse方法提升模型稀疏性,在系統(tǒng)和芯片層面優(yōu)化操作系統(tǒng)推理設(shè)計(jì),實(shí)現(xiàn)異構(gòu)算力調(diào)度、神經(jīng)元簇流水線等技術(shù)。實(shí)驗(yàn)結(jié)果表明,PowerInfer-1在個人電腦上實(shí)現(xiàn)11.7倍加速,可運(yùn)行1750億參數(shù)模型;PowerInfer-2讓智能手機(jī)流暢運(yùn)行470億參數(shù)模型,性能提升27.8倍。

模型原生操作系統(tǒng)除了需要解決端側(cè)推理性能問題,還需要解決智能應(yīng)用在硬件加速器層面的高效調(diào)度問題。當(dāng)前商用GPU缺乏有效的搶占式調(diào)度機(jī)制,實(shí)時任務(wù)面臨兩難選擇:要么獨(dú)占GPU資源,增加成本;要么等待低優(yōu)先級任務(wù)完成,影響性能。上海交通大學(xué)團(tuán)隊(duì)最早在商用GPU上實(shí)現(xiàn)了百微秒內(nèi)的任務(wù)搶占和細(xì)粒度的空分算力共享,與將GPU專用于實(shí)時任務(wù)相比,整體吞吐能力提升7.7倍,與多任務(wù)共享GPU相比,時延干擾減少99%。當(dāng)前硬件加速器百家爭鳴,系統(tǒng)層面的支持成為競爭關(guān)鍵,團(tuán)隊(duì)進(jìn)一步提出了硬件加速器調(diào)度的通用抽象和多層硬件模型,能夠快速支持不同架構(gòu)、品牌、代次硬件加速器的搶占式調(diào)度,以及開發(fā)硬件無關(guān)的通用調(diào)度策略。

結(jié)束語

模型原生操作系統(tǒng)是人工智能時代操作系統(tǒng)的重要發(fā)展方向,需要在模型與系統(tǒng)的深度融合中探索理論創(chuàng)新。這種融合不是簡單的功能疊加,而是要從架構(gòu)到實(shí)現(xiàn)進(jìn)行全方位創(chuàng)新,從而推動操作系統(tǒng)的智能化演進(jìn)。雖然學(xué)術(shù)界和產(chǎn)業(yè)界在架構(gòu)設(shè)計(jì)、性能優(yōu)化、調(diào)度機(jī)制等方面取得了一系列初步探索,但要實(shí)現(xiàn)真正可用的產(chǎn)品級系統(tǒng),仍須在交互范式革新、模型推理效能、系統(tǒng)融合程度、生態(tài)演進(jìn)策略等方面持續(xù)深入研究。

(本文內(nèi)容是基于2024中國計(jì)算機(jī)大會(CNCC2024)“大模型基礎(chǔ)軟件”論壇上的報告《模型原生操作系統(tǒng)的一些思考》進(jìn)行的擴(kuò)展)

wKgZO2fT-8qAHpq7AAADrkErmTA829.png

掃碼觀看相關(guān)視頻

wKgZO2fT-8qAJMTdAAAnu5sA3f4332.jpg

陳海波

CCF會士、系統(tǒng)軟件專委會副主任、開源發(fā)展委員會常務(wù)委員。上海交通大學(xué)特聘教授,ACM/IEEE Fellow。主要研究方向?yàn)椴僮飨到y(tǒng)、分布式系統(tǒng)和機(jī)器學(xué)習(xí)系統(tǒng)等。haibochen@sjtu.edu.cn

wKgZO2fT-8qANOoQAAAr8KldzCU463.jpg

夏虞斌

CCF杰出會員、系統(tǒng)軟件專委會常務(wù)委員、開源發(fā)展委員會執(zhí)行委員、教育工委主任助理。上海交通大學(xué)教授。主要研究方向?yàn)椴僮飨到y(tǒng)、體系結(jié)構(gòu)等。xiayubin@sjtu.edu.cn

wKgZO2fT-8qANTs9AAAvP3ejQ_g259.jpg

陳榕

CCF杰出會員、CCCF專欄編委。上海交通大學(xué)教授。主要研究方向?yàn)椴僮飨到y(tǒng)、分布式系統(tǒng)、智能計(jì)算系統(tǒng)等。rongchen@sjtu.edu.cn

其他作者:王肇國 糜澤羽 古金宇

CCF推薦

【精品文章】

泛在操作系統(tǒng):研究與實(shí)踐 | CCCF精選

分布式系統(tǒng)與可信計(jì)算的探索之路——專訪“CCF 海外科技人物獎”獲得者徐潔 | CCCF精選

梅宏:擁抱泛在計(jì)算 | CCCF精選

wKgZO2fT-8qAbTdqAACmqtKsn4A804.jpg

wKgZO2fT-8qAeqzZAAC7x5sChNA731.jpg 審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 操作系統(tǒng)
    +關(guān)注

    關(guān)注

    37

    文章

    7402

    瀏覽量

    129346
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50104

    瀏覽量

    265528
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3755

    瀏覽量

    52125
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    openKylin賦能國防科大構(gòu)建操作系統(tǒng)創(chuàng)新型人才培養(yǎng)體系

    國防科技大學(xué)操作系統(tǒng)團(tuán)隊(duì)在承擔(dān)國家重大科研任務(wù)、推進(jìn)麒麟操作系統(tǒng)研發(fā)和推廣應(yīng)用的過程中,立足工程實(shí)踐和科研創(chuàng)新能力培養(yǎng)需求,針對傳統(tǒng)操作系統(tǒng)教學(xué)面臨的諸多挑戰(zhàn),在開放協(xié)作、創(chuàng)新競賽、實(shí)
    的頭像 發(fā)表于 01-23 13:49 ?414次閱讀

    操作系統(tǒng)體系結(jié)構(gòu)

    操作系統(tǒng)的體系結(jié)構(gòu)是一個開放的問題。正如上文所述,操作系統(tǒng)在核心態(tài)為應(yīng)用程序提供公共的服務(wù),那么操作系統(tǒng)在核心態(tài)應(yīng)該提供什么服務(wù)、怎樣提供服務(wù)?有關(guān)這個問題的回答形成了兩種主要的體系結(jié)構(gòu):大內(nèi)核和微
    發(fā)表于 01-15 08:19

    操作系統(tǒng)運(yùn)行機(jī)制

    計(jì)算機(jī)系統(tǒng)中,通常CPU執(zhí)行兩種不同性質(zhì)的程序:一種是操作系統(tǒng)內(nèi)核程序;另一種是用戶自編程序或系統(tǒng)外層的應(yīng)用程序。對操作系統(tǒng)而言,這兩種程序的作用不同,前者是后者的管理者,因此“管理程
    發(fā)表于 01-15 07:12

    中科創(chuàng)達(dá)推出全新一代AI原生整車操作系統(tǒng)滴水OS 2.0 Pre

    整車操作系統(tǒng)。該系統(tǒng)憑借“融合體驗(yàn)、AI原生、更快量產(chǎn)”三大核心優(yōu)勢,通過創(chuàng)新的智能座艙顯示布局與智能交互設(shè)計(jì),重新定義智能汽車的體驗(yàn)邊界。尤為值得關(guān)注的是,滴水OS 2.0 Pre 與 AIBOX深度
    的頭像 發(fā)表于 01-10 16:01 ?1474次閱讀

    從內(nèi)核到生態(tài):一次看懂HarmonyOS 6如何重寫操作系統(tǒng)的“基礎(chǔ)代碼”

    在移動操作系統(tǒng)競爭進(jìn)入“深水區(qū)”的當(dāng)下,用戶對于系統(tǒng)體驗(yàn)的期待早已不再局限于功能的簡單疊加,而是追求一種從底層架構(gòu)革新帶來的全方位飛躍。HarmonyOS 6的正式發(fā)布,正是這樣一次對操作系統(tǒng)
    的頭像 發(fā)表于 12-31 09:09 ?270次閱讀
    從內(nèi)核到生態(tài):一次看懂HarmonyOS 6如何重寫<b class='flag-5'>操作系統(tǒng)</b>的“基礎(chǔ)代碼”

    龍蜥操作系統(tǒng)裝機(jī)量突破1000萬

    11月17日,以“生態(tài)共融·智驅(qū)未來”為主題的2025龍蜥操作系統(tǒng)大會(OpenAnolis Conference)在北京成功舉辦。千余位全球技術(shù)大咖、業(yè)界精英和行業(yè)開發(fā)者齊聚一堂,深入探討AI時代下操作系統(tǒng)產(chǎn)業(yè)發(fā)展的新趨勢、新挑戰(zhàn)
    的頭像 發(fā)表于 11-20 11:40 ?847次閱讀

    單片機(jī)的操作系統(tǒng)

    單片機(jī)操作系統(tǒng)主要分為實(shí)時操作系統(tǒng)(RTOS)和嵌入式操作系統(tǒng)兩類,以下是常見選擇: 實(shí)時操作系統(tǒng)(RTOS) ? FreeRTOS ?:輕量級開源內(nèi)核(最小內(nèi)核約6 KB RAM)
    發(fā)表于 11-14 06:18

    嵌入式實(shí)時操作系統(tǒng)的特點(diǎn)

    實(shí)時嵌入式操作系統(tǒng)(Real-Time Embedded Operating System)是專門設(shè)計(jì)用于嵌入式系統(tǒng)的實(shí)時操作系統(tǒng)。嵌入式系統(tǒng)是一種特殊的計(jì)算機(jī)
    發(fā)表于 11-13 06:30

    如何選擇合適的實(shí)時操作系統(tǒng)

    選擇合適的實(shí)時操作系統(tǒng)(RTOS,Real-Time Operating System)可能會影響你在不同行業(yè)的職業(yè)發(fā)展路徑。
    的頭像 發(fā)表于 09-09 14:47 ?1078次閱讀

    電力操作系統(tǒng):新型電力系統(tǒng)的智能底座

    實(shí)時互動成為關(guān)鍵挑戰(zhàn)。 面對電力物聯(lián)網(wǎng)終端規(guī)模大幅增加、設(shè)備復(fù)雜度提升、協(xié)議標(biāo)準(zhǔn)不統(tǒng)一的現(xiàn)狀,電力操作系統(tǒng)作為新一代智能終端的“指揮中樞”,正發(fā)揮著至關(guān)重要的作用。 --- 01 電力操作系統(tǒng)的戰(zhàn)略意義 電力
    的頭像 發(fā)表于 08-25 15:57 ?595次閱讀

    樹莓派操作系統(tǒng):版本、特性及設(shè)置完整指南!

    樹莓派操作系統(tǒng)是什么?樹莓派操作系統(tǒng)是由樹莓派基金會專為樹莓派開發(fā)的官方操作系統(tǒng)。它基于DebianLinux發(fā)行版,并針對樹莓派的ARM架構(gòu)進(jìn)行了專門優(yōu)化。樹莓派操作系統(tǒng)有多個版本,
    的頭像 發(fā)表于 07-28 18:26 ?1462次閱讀
    樹莓派<b class='flag-5'>操作系統(tǒng)</b>:版本、特性及設(shè)置完整指南!

    鴻道Intewell操作系統(tǒng):人形機(jī)器人底層操作系統(tǒng)

    操作系統(tǒng)的實(shí)時性賦能東土科技的鴻道(Intewell)工業(yè)操作系統(tǒng)作為國內(nèi)唯一通過汽車、工業(yè)控制、醫(yī)療、軌道交通四項(xiàng)功能安全認(rèn)證的系統(tǒng),為標(biāo)準(zhǔn)體系中的技術(shù)層架構(gòu)提供了底層支持。其微內(nèi)核虛擬化架構(gòu)可將人形機(jī)器人電子架構(gòu)成本降低50
    的頭像 發(fā)表于 05-16 14:44 ?796次閱讀

    KaihongOS操作系統(tǒng)FA模型與Stage模型介紹

    FA模型與Stage模型介紹 KaihongOS操作系統(tǒng)中,F(xiàn)A模型(Feature Ability)和Stage模型是兩種不同的應(yīng)用
    發(fā)表于 04-24 07:27

    中國汽車報:睿賽德攜“程翧整車基礎(chǔ)軟件OS”亮相操作系統(tǒng)年會

    領(lǐng)域?qū)<?,圍繞具身智能與系統(tǒng)、硬件與內(nèi)核、云原生與虛擬化等領(lǐng)域探討最新技術(shù)趨勢和未來發(fā)展方向。其中,近年來愈發(fā)重視自主可控操作系統(tǒng)發(fā)展的智能汽車領(lǐng)域,也成為本屆會議的討
    的頭像 發(fā)表于 04-01 21:00 ?969次閱讀
    中國汽車報:睿賽德攜“程翧整車基礎(chǔ)軟件OS”亮相<b class='flag-5'>操作系統(tǒng)</b>年會

    芯盾時代全線產(chǎn)品完成鴻蒙操作系統(tǒng)深度適配

    近日華為推出首款全面搭載原生鴻蒙操作系統(tǒng)HarmonyOS 5的手機(jī)HUAWEI Pura X,標(biāo)志著華為終端已全面進(jìn)入原生鴻蒙的時代,預(yù)示著華為終端產(chǎn)品將為用戶帶來更加流暢、智能和安全的使用體驗(yàn)。
    的頭像 發(fā)表于 03-28 09:38 ?967次閱讀