91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

OpenVINO? 賦能 BLIP 實現(xiàn)視覺語言 AI 邊緣部署

研揚科技AAEON ? 2023-09-04 16:21 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人類通過視覺和語言感知世界。人工智能的一個長期目標是構(gòu)建智能體,通過視覺和語言輸入來理解世界,并通過自然語言與人類交流。比如,在《幾行代碼加速 Stable Diffusion,使用 OpenVINO 輕松文生圖》中,我們介紹了利用 OpenVINO 運行 Stable Diffusion 模型,快速實現(xiàn)文生圖應(yīng)用。讓人人可以成為繪畫大師,利用 AI 隨心作畫。

隨著計算機視覺和自然語言處理領(lǐng)域的快速發(fā)展,視覺與語言的融合越來越受到研究人員的重視。在這個背景下,BLIP(Bootstrapping Language-Image Pre-training)作為一種創(chuàng)新的預(yù)訓(xùn)練模型,引起了廣泛關(guān)注。該模型在大規(guī)模的圖像文本數(shù)據(jù)集上預(yù)訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)模型,以提高下游視覺語言任務(wù)的性能,如圖像文本檢索、圖像字幕和視覺問答。通過聯(lián)合訓(xùn)練圖像和文本數(shù)據(jù),為視覺與語言的融合提供了強大的基礎(chǔ)。

BLIP 的預(yù)訓(xùn)練過程涉及兩個關(guān)鍵組件:圖像編碼器和文本編碼器。圖像編碼器負責(zé)將輸入的圖像轉(zhuǎn)換為低維向量表示,而文本編碼器則將輸入的文本轉(zhuǎn)換為另一個低維向量表示。為了實現(xiàn)統(tǒng)一的視覺-語言預(yù)訓(xùn)練,BLIP 采用了一種跨模態(tài)約束策略,即在預(yù)訓(xùn)練階段,圖像編碼器和文本編碼器被設(shè)計成相互約束的。這樣的約束機制強制模型學(xué)習(xí)將視覺信息和語言信息進行對齊,從而使得模型在后續(xù)任務(wù)中能夠更好地處理視覺與語言之間的聯(lián)合信息。

除了視覺-語言理解任務(wù),BLIP 還在視覺-語言生成任務(wù)中表現(xiàn)出色。在這個任務(wù)中,模型需要根據(jù)輸入的圖像和文本生成相關(guān)的描述或回答問題。BLIP 通過聯(lián)合訓(xùn)練和引入了圖像-文本生成任務(wù),使得模型具備了更強大的圖像描述和問題回答能力。這使得 BLIP 在圖像描述生成和視覺問答等任務(wù)上取得了優(yōu)異的成績。

接下來,我們一起來看看如何在研揚科技(AAEON)的新品 UP Squared Pro 7000 Edge 運行利用 OpenVINO 來優(yōu)化加速 BLIP 的推理有哪些重點步驟吧。

f6823dfe-4afb-11ee-a20b-92fbcf53809c.png

作為研揚 UP Squared Pro 系列的第三代產(chǎn)品,Upsquared Pro 7000 系列[1] 透過高性能計算能力、升級的電路板設(shè)計和擴展的顯示接口,提供更大的開發(fā)潛力。作為該系列中首款采用 Intel Core/Atom/N 系列處理器(原 Alder Lake-N)的產(chǎn)品,UP Squared Pro 7000 是首款配備板載 LPDDR5 內(nèi)存的產(chǎn)品,提高了 I/O 的運行速度。此外,UP Squared Pro 7000 在圖像處理和顯示功能方面都有顯著提升,支持 MIPI CSI 照相機,并搭配 Intel UHD 顯卡,可同時進行三臺 4K 顯示器。

1.4 倍以上 CPU 性能提升

UP Squared Pro 7000 采用 Intel Core/Atom/N- 系列處理器,CPU 性能是上一代的 1.4 倍。UP Squared Pro 7000 擁有多達 8 個 Gracemont 內(nèi)核,支持 OpenVINO Toolkit,以及第 12 代 Intel處理器的 UHD 顯卡,擁有強大的計算能力、優(yōu)化的推理引擎和圖像處理功能,提供絕佳的智能解決方案。

同步支持 3 臺 4K 顯示器

UP Squared Pro 7000 配備 HDMI 2.0b、DP 1.2 埠和透過 USB Type-C 的 DP 1.4a,擁有出色的顯示接口。UP Squared Pro 7000 整合了 GPU 和多重輸出,可以同步支持三個 4K 顯示器,非常適合用于數(shù)字廣告牌等視覺導(dǎo)向型的相關(guān)應(yīng)用。

雙倍的高速系統(tǒng)內(nèi)存

作為 UP Squared Pro 系列中第一塊配備板載 LPDDR5 系統(tǒng)內(nèi)存的板卡,UP Squared Pro 7000 搭載了 16GB 的系統(tǒng)內(nèi)存,是上一代的兩倍。此外,快達 4800MHz 的內(nèi)存速度讓用戶的帶寬和數(shù)據(jù)傳輸速度加倍,同時也更加省電。

全面的 I/O 升級

除了維持 UP Squared Pro 系列 4" x 4" 的緊湊外形之外,UP Squared Pro 7000 在電路板設(shè)計上更為精實。UP Squared Pro 7000 配備了兩個 2.5GbE、三個 USB 3.2 和一個 FPC 端口,可外接更多像是 MIPI CSI 相機的外圍設(shè)備。將這些特色與板載 LPDDR5 及性能強大的 CPU 相結(jié)合,非常適合用于智慧工廠機器人方面的視覺解決方案。

第一步:安裝相應(yīng)工具包、加載模型并轉(zhuǎn)換為 OpenVINO IR 格式

本次代碼示例需要首先安裝 BLIP 相應(yīng)工具包。

!pip install "transformers >= 4.26.0"

向右滑動查看完整代碼

然后下載及加載相應(yīng)的 PyTorch 模型。在本問中,您將使用可從 Hugging Face 下載的 blip-vqa-base [2] 基本模型。同樣的操作也適用于 BLIP 系列中的其它模型。盡管該模型類是為執(zhí)行問答而設(shè)計的,但其組件也可以用于圖像字幕。要開始使用該模型,需要使用 from_pretrained 方法實例化 BlipForQuestionAnswering 類。BlipProcessor 是一個助手類,用于準備文本和視覺模態(tài)的輸入數(shù)據(jù)以及生成結(jié)果的后處理。

import sysimport timefrom PIL import Imagefrom transformers import BlipProcessor, BlipForQuestionAnswering
sys.path.append("../utils")from notebook_utils import download_file
# Get model and processorprocessor = BlipProcessor.from_pretrained("Salesforce/blip-vqa-base")model = BlipForQuestionAnswering.from_pretrained("Salesforce/blip-vqa-base")

接下來,我們看看如何將原始模型轉(zhuǎn)換為 OpenVINO IR格式的模型,并利用 OpenVINO 進行相應(yīng)的優(yōu)化以及部署推理加速。

第二步:將模型轉(zhuǎn)換為 OpenVINO IR 格式

根據(jù)我們前面的介紹,BLIP 模型包含視覺模型、文本編碼和文本解碼三個模型,因此我們需要分別將這三個模型轉(zhuǎn)換為 OpenVINO IR 格式。視覺模型的轉(zhuǎn)換操作比較常規(guī),具體代碼可以參考我們的 notebook[3],這里重點介紹一下文本編碼和文本解碼模型的轉(zhuǎn)換部分。

文本編碼器轉(zhuǎn)換

視覺問答任務(wù)使用文本編碼器來構(gòu)建問題的嵌入表示。它采用經(jīng)過分詞后的問題的 input_ids,并輸出從視覺模型獲得的圖像嵌入和它們的注意力掩碼。根據(jù)問題文本的不同,標記化輸入后的標記數(shù)量可能不同。因此,為使用標記的模型輸入保留動態(tài)形狀,dynamic_axes 參數(shù)負責(zé)在 torch.onx.export 中保留輸入的動態(tài)特定維度。代碼如下:

TEXT_ENCODER_OV = Path("blip_text_encoder.xml")TEXT_ENCODER_ONNX = TEXT_ENCODER_OV.with_suffix(".onnx")
text_encoder = model.text_encodertext_encoder.eval()
# if openvino model does not exist, convert it to onnx and then to IRif not TEXT_ENCODER_OV.exists(): if not TEXT_ENCODER_ONNX.exists(): # prepare example inputs for ONNX export image_embeds = vision_outputs[0] image_attention_mask = torch.ones(image_embeds.size()[:-1], dtype=torch.long) input_dict = {"input_ids": inputs["input_ids"], "attention_mask": inputs["attention_mask"], "encoder_hidden_states": image_embeds, "encoder_attention_mask": image_attention_mask} # specify variable length axes dynamic_axes = {"input_ids": {1: "seq_len"}, "attention_mask": {1: "seq_len"}} # export PyTorch model to ONNX with torch.no_grad(): torch.onnx.export(text_encoder, input_dict, TEXT_ENCODER_ONNX, input_names=list(input_dict), dynamic_axes=dynamic_axes) # convert ONNX model to IR using model conversion Python API, use compress_to_fp16=True for compressing model weights to FP16 precision ov_text_encoder = mo.convert_model(TEXT_ENCODER_ONNX, compress_to_fp16=True) # save model on disk for next usages serialize(ov_text_encoder, str(TEXT_ENCODER_OV)) print(f"Text encoder successfuly converted and saved to {TEXT_ENCODER_OV}")else: print(f"Text encoder will be loaded from {TEXT_ENCODER_OV}")

向右滑動查看完整代碼

文本解碼器轉(zhuǎn)換

文本解碼器負責(zé)使用圖像(以及問題,如果需要的話)的表示來生成模型輸出(問題的答案或標題)的分詞 token 序列。生成方法基于這樣的假設(shè),即單詞序列的概率分布可以分解為下一個單詞條件分布的乘積。換言之,模型預(yù)測由先前生成的 token 引導(dǎo)循環(huán)生成下一個 token,直到達到停止生成的條件(生成達到最大長度序列或獲得的字符串結(jié)束的 token)。在預(yù)測概率之上選擇下一個 token的方式由所選擇的解碼方法來驅(qū)動。與文本編碼器類似,文本解碼器可以處理不同長度的輸入序列,并且需要保留動態(tài)輸入形狀。這部分特殊的處理可由如下代碼完成:

text_decoder = model.text_decodertext_decoder.eval()
TEXT_DECODER_OV = Path("blip_text_decoder.xml")TEXT_DECODER_ONNX = TEXT_DECODER_OV.with_suffix(".onnx")
# prepare example inputs for ONNX exportinput_ids = torch.tensor([[30522]]) # begin of sequence token idattention_mask = torch.tensor([[1]]) # attention mask for input_idsencoder_hidden_states = torch.rand((1, 10, 768)) # encoder last hidden state from text_encoderencoder_attention_mask = torch.ones((1, 10), dtype=torch.long) # attention mask for encoder hidden states
input_dict = {"input_ids": input_ids, "attention_mask": attention_mask, "encoder_hidden_states": encoder_hidden_states, "encoder_attention_mask": encoder_attention_mask}# specify variable length axesdynamic_axes = {"input_ids": {1: "seq_len"}, "attention_mask": {1: "seq_len"}, "encoder_hidden_states": {1: "enc_seq_len"}, "encoder_attention_mask": {1: "enc_seq_len"}}
# specify output names, logits is main output of modeloutput_names = ["logits"]
# past key values outputs are output for caching model hidden statepast_key_values_outs = []text_decoder_outs = text_decoder(**input_dict)for idx, _ in enumerate(text_decoder_outs["past_key_values"]): past_key_values_outs.extend([f"out_past_key_value.{idx}.key", f"out_past_key_value.{idx}.value"])

向右滑動查看完整代碼

接下來,對于文本解碼器的轉(zhuǎn)換,還有來自前一步驟的隱藏狀態(tài)的額外輸入。與輸出類似,在模型導(dǎo)出為 ONNX 格式后,它們將被展平。需要使用新的輸入層更新 dynamic_axies 和 input_names。因此,其后面的轉(zhuǎn)換過程與前面的文本編碼器的轉(zhuǎn)換過程類似,在本文中不再贅述。

第三步:運行 OpenVINO 推理

如前所述,在這里我們將主要展示 BLIP 進行視覺問答以及圖像字幕的流水線如何搭建、以及如何運行 OpenVINO 來進行推理的情況。

圖像字幕

視覺模型接受 BlipProcessor 預(yù)處理的圖像作為輸入,并生成圖像嵌入,這些圖像嵌入直接傳遞給文本解碼器以生成字幕標記。生成完成后,分詞 tokenizer 的輸出序列被提供給 BlipProcessor,用于使用 tokenizer 解碼為文本。

定義 OVBLIPModel 類:

class OVBlipModel: """ Model class for inference BLIP model with OpenVINO """ def __init__(self, config, decoder_start_token_id:int, vision_model, text_encoder, text_decoder): """ Initialization class parameters """ self.vision_model = vision_model self.vision_model_out = vision_model.output(0) self.text_encoder = text_encoder self.text_encoder_out = text_encoder.output(0) self.text_decoder = text_decoder self.config = config self.decoder_start_token_id = decoder_start_token_id self.decoder_input_ids = c

向右滑動查看完整代碼

定義圖像字幕函數(shù)如下,

def generate_caption(self, pixel_values:torch.Tensor, input_ids:torch.Tensor = None, attention_mask:torch.Tensor = None, **generate_kwargs): """ Image Captioning prediction Parameters: pixel_values (torch.Tensor): preprocessed image pixel values input_ids (torch.Tensor, *optional*, None): pregenerated caption token ids after tokenization, if provided caption generation continue provided text attention_mask (torch.Tensor): attention mask for caption tokens, used only if input_ids provided Retruns: generation output (torch.Tensor): tensor which represents sequence of generated caption token ids """ batch_size = pixel_values.shape[0]
image_embeds = self.vision_model(pixel_values.detach().numpy())[self.vision_model_out]
image_attention_mask = torch.ones(image_embeds.shape[:-1], dtype=torch.long)
if isinstance(input_ids, list): input_ids = torch.LongTensor(input_ids) elif input_ids is None: input_ids = ( torch.LongTensor([[self.config.text_config.bos_token_id, self.config.text_config.eos_token_id]]) .repeat(batch_size, 1) ) input_ids[:, 0] = self.config.text_config.bos_token_id attention_mask = attention_mask[:, :-1] if attention_mask is not None else None
outputs = self.text_decoder.generate( input_ids=input_ids[:, :-1], eos_token_id=self.config.text_config.sep_token_id, pad_token_id=self.config.text_config.pad_token_id, attention_mask=attention_mask, encoder_hidden_states=torch.from_numpy(image_embeds), encoder_attention_mask=image_attention_mask, **generate_kwargs, )
return outputs

向右滑動查看完整代碼

視覺問答

視覺回答的流水線看起來很相似,但有額外的問題處理。在這種情況下,由 BlipProcessor 標記的圖像嵌入和問題被提供給文本編碼器,然后多模態(tài)問題嵌入被傳遞給文本解碼器以執(zhí)行答案的生成。

在 OVBLIPModel 類內(nèi)部同理可定義視覺問答函數(shù)如下:

def generate_answer(self, pixel_values:torch.Tensor, input_ids:torch.Tensor, attention_mask:torch.Tensor, **generate_kwargs): """ Visual Question Answering prediction Parameters: pixel_values (torch.Tensor): preprocessed image pixel values input_ids (torch.Tensor): question token ids after tokenization attention_mask (torch.Tensor): attention mask for question tokens Retruns: generation output (torch.Tensor): tensor which represents sequence of generated answer token ids """ image_embed = self.vision_model(pixel_values.detach().numpy())[self.vision_model_out] image_attention_mask = np.ones(image_embed.shape[:-1], dtype=int) if isinstance(input_ids, list): input_ids = torch.LongTensor(input_ids) question_embeds = self.text_encoder([input_ids.detach().numpy(), attention_mask.detach().numpy(), image_embed, image_attention_mask])[self.text_encoder_out] question_attention_mask = np.ones(question_embeds.shape[:-1], dtype=int)
bos_ids = np.full((question_embeds.shape[0], 1), fill_value=self.decoder_start_token_id)
outputs = self.text_decoder.generate( input_ids=torch.from_numpy(bos_ids), eos_token_id=self.config.text_config.sep_token_id, pad_token_id=self.config.text_config.pad_token_id, encoder_hidden_states=torch.from_numpy(question_embeds), encoder_attention_mask=torch.from_numpy(question_attention_mask), **generate_kwargs, ) return outputs

向右滑動查看完整代碼

初始化 OpenVINO 運行時并運行推理

初始化 OpenVINO Core 對象,選擇推理設(shè)備,并加載、編譯模型

# create OpenVINO Core object instancecore = Core()
import ipywidgets as widgets
device = widgets.Dropdown( options=core.available_devices + ["AUTO"], value='AUTO', description='Device:', disabled=False,)
device
# load models on deviceov_vision_model = core.compile_model(VISION_MODEL_OV, device.value)ov_text_encoder = core.compile_model(TEXT_ENCODER_OV, device.value)ov_text_decoder = core.compile_model(TEXT_DECODER_OV, device.value)ov_text_decoder_with_past = core.compile_model(TEXT_DECODER_WITH_PAST_OV, device.value)

向右滑動查看完整代碼

運行圖像字幕推理

out = ov_model.generate_caption(inputs["pixel_values"], max_length=20)caption = processor.decode(out[0], skip_special_tokens=True)fig = visualize_results(raw_image, caption)

運行視覺問答推理

start = time.perf_counter()out = ov_model.generate_answer(**inputs, max_length=20)end = time.perf_counter() - startanswer = processor.decode(out[0], skip_special_tokens=True)fig = visualize_results(raw_image, answer, question)

小結(jié)

整個的步驟就是這樣!現(xiàn)在就開始跟著我們提供的代碼和步驟,動手試試用 Open VINO 和 BLIP 吧。

除此之外,為了方便大家了解并快速掌握 OpenVINO 的使用,我們還提供了一系列開源的 Jupyter notebook demo。運行這些 notebook,就能快速了解在不同場景下如何利用 OpenVINO 實現(xiàn)一系列、包括計算機視覺、語音及自然語言處理任務(wù)。OpenVINO notebooks 的資源可以在 GitHub 這里下載安裝:https://github.com/openvinotoolkit/openvino_notebooks 。

研揚科技簡介

研揚科技成立于 1992 年,是工業(yè)物聯(lián)網(wǎng)和人工智能邊緣解決方案的領(lǐng)先設(shè)計商和制造商之一。以不斷創(chuàng)新為核心價值觀,研揚科技為市場帶來可靠、高質(zhì)量的計算平臺,包括工業(yè)主板和系統(tǒng)、強固式平板電腦、嵌入式人工智能系統(tǒng)、uCPE 網(wǎng)絡(luò)設(shè)備以及 LoRaWAN/WWAN 解決方案。研揚科技還帶來行業(yè)領(lǐng)先的經(jīng)驗和知識,以在全球范圍內(nèi)提供 OEM/ODM 服務(wù)。此外,研揚科技與諸多城市和政府緊密合作,開發(fā)和部署智能城市生態(tài)系統(tǒng),提供個性化平臺和端到端解決方案。研揚科技與頂級芯片設(shè)計商緊密合作,提供穩(wěn)定、可靠的平臺,并被認可為 Intel物聯(lián)網(wǎng)解決方案聯(lián)盟的鈦金級成員。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39794

    瀏覽量

    301456
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50099

    瀏覽量

    265436
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3752

    瀏覽量

    52113
  • Open
    +關(guān)注

    關(guān)注

    0

    文章

    24

    瀏覽量

    11425
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    MIPS 推出軟件優(yōu)先的 S8200 RISC-V NPU,自主邊緣物理 AI

    MIPS S8200 NPU 現(xiàn)已向開發(fā)自主邊緣運輸、機器人及嵌入式平臺的主要客戶出樣 · MIPS 通用的端側(cè) AI 能力,支持現(xiàn)代模型以及具備業(yè)界領(lǐng)先的效率 2026****年
    的頭像 發(fā)表于 01-14 10:26 ?6.5w次閱讀
    MIPS 推出軟件優(yōu)先的 S8200 RISC-V NPU,<b class='flag-5'>賦</b><b class='flag-5'>能</b>自主<b class='flag-5'>邊緣</b>物理 <b class='flag-5'>AI</b>

    瑞芯微SOC智能視覺AI處理器

    。B2版本通常在功耗、穩(wěn)定性和部分外圍接口支持上有所優(yōu)化。NPU: 集成0.8 TOPS的NPU,支持INT8/INT16混合運算,滿足大多數(shù)邊緣側(cè)的輕量級AI推理需求(如分類、檢測、識別)。多媒體
    發(fā)表于 12-19 13:44

    工業(yè)視覺網(wǎng)關(guān):RK3576多路檢測與邊緣AI

    ~150ms6TOPS NPU 邊緣AI推理易對接 MES / 追溯系統(tǒng) 一、產(chǎn)線痛點:從“人看”到“機判”的轉(zhuǎn)變· 多工位/多角度同步:單機位覆蓋不足,典型項目需 8~12 路并發(fā),且畫面時序一致性要求高
    發(fā)表于 10-16 17:56

    AI6G與衛(wèi)星通信:開啟智能天網(wǎng)新時代

    需求?傳統(tǒng)網(wǎng)絡(luò)會因流量激增而擁堵,而AI的6G網(wǎng)絡(luò)則能提前預(yù)測流量模式,動態(tài)調(diào)整資源分配。 AI算法能夠?qū)崟r分析海量數(shù)據(jù),包括用戶位置、網(wǎng)絡(luò)負載、歷史流量模式等。在2025年上海世
    發(fā)表于 10-11 16:01

    此芯科技發(fā)布“合一”AI加速計劃,邊緣與端側(cè)AI創(chuàng)新

    產(chǎn)品組合,覆蓋從1.5B至32B參數(shù)規(guī)模的端側(cè)AI模型推理需求,滿足工業(yè)、消費電子、智能終端等多樣化場景的部署需求,推動AI技術(shù)從云端向邊緣高效落地?!昂弦弧?/div>
    的頭像 發(fā)表于 09-15 11:53 ?2011次閱讀
    此芯科技發(fā)布“合一”<b class='flag-5'>AI</b>加速計劃,<b class='flag-5'>賦</b><b class='flag-5'>能</b><b class='flag-5'>邊緣</b>與端側(cè)<b class='flag-5'>AI</b>創(chuàng)新

    AI 邊緣計算網(wǎng)關(guān):開啟智能新時代的鑰匙?—龍興物聯(lián)

    計算網(wǎng)關(guān)在本地實時分析,一旦檢測到盜竊、斗毆等異常行為,立即發(fā)出警報,極大提高了安防監(jiān)控的及時性和準確性,同時減輕了云端計算壓力,降低了網(wǎng)絡(luò)成本。? 豐富的人工智能算法應(yīng)用,是AI 邊緣計算網(wǎng)關(guān)
    發(fā)表于 08-09 16:40

    恩智浦i.MX 95系列MPU如何邊緣計算

    在本系列博文的第一部分,我探討了恩智浦i.MX 95系列如何將新功能安全技術(shù)應(yīng)用于工業(yè)環(huán)境、汽車領(lǐng)域及其他邊緣應(yīng)用。在接下來的文章中,我將進一步闡述i.MX 95系列如何邊緣計算,
    的頭像 發(fā)表于 07-30 11:08 ?2774次閱讀
    恩智浦i.MX 95系列MPU如何<b class='flag-5'>賦</b><b class='flag-5'>能</b><b class='flag-5'>邊緣</b>計算

    為何邊緣設(shè)備正成為AI的新重心

    人工智能 (AI) 正在以驚人的速度發(fā)展。企業(yè)不再僅僅是探索 AI,而是積極推動 AI 的規(guī)模化落地,從實驗性應(yīng)用轉(zhuǎn)向?qū)嶋H部署。隨著生成式模型日益精簡和高效,
    的頭像 發(fā)表于 07-30 09:12 ?874次閱讀

    邊緣AI實現(xiàn)的核心環(huán)節(jié):硬件選擇和模型部署

    邊緣AI實現(xiàn)原理是將人工智能算法和模型部署到靠近數(shù)據(jù)源的邊緣設(shè)備上,使這些設(shè)備能夠在本地進行數(shù)據(jù)處理、分析和決策,而無需將數(shù)據(jù)傳輸?shù)竭h程的
    的頭像 發(fā)表于 06-19 12:19 ?1395次閱讀
    <b class='flag-5'>邊緣</b><b class='flag-5'>AI</b><b class='flag-5'>實現(xiàn)</b>的核心環(huán)節(jié):硬件選擇和模型<b class='flag-5'>部署</b>

    STM32F769是否可以部署邊緣AI

    STM32F769是否可以部署邊緣AI
    發(fā)表于 06-17 06:44

    邊緣AI實現(xiàn)的核心環(huán)節(jié):硬件選擇和模型部署

    電子發(fā)燒友網(wǎng)綜合報道 邊緣AI實現(xiàn)原理是將人工智能算法和模型部署到靠近數(shù)據(jù)源的邊緣設(shè)備上,使這些設(shè)備能夠在本地進行數(shù)據(jù)處理、分析和決策,而
    發(fā)表于 05-26 07:09 ?1474次閱讀

    RAKsmart服務(wù)器如何AI開發(fā)與部署

    AI開發(fā)與部署的復(fù)雜性不僅體現(xiàn)在算法設(shè)計層面,更依賴于底層基礎(chǔ)設(shè)施的支撐能力。RAKsmart服務(wù)器憑借其高性能硬件架構(gòu)、靈活的資源調(diào)度能力以及面向AI場景的深度優(yōu)化,正在成為企業(yè)突破算力瓶頸、加速
    的頭像 發(fā)表于 04-30 09:22 ?793次閱讀

    Deepseek海思SD3403邊緣計算AI產(chǎn)品系統(tǒng)

    海思SD3403邊緣計算AI框架,提供了一套開放式AI訓(xùn)練產(chǎn)品工具包,解決客戶低成本AI系統(tǒng),針對差異化AI 應(yīng)用場景,自己采集樣本數(shù)據(jù),進
    發(fā)表于 04-28 11:05

    美格智能攜手高通啟動2025邊緣智能創(chuàng)新應(yīng)用大賽,端側(cè)AI革命

    前言:隨著5G-A與AIoT技術(shù)深度融合,邊緣智能正成為工業(yè)4.0、智慧城市、自動駕駛等領(lǐng)域的核心引擎。美格智能多年來與高通公司持續(xù)深入合作,搭載高通平臺的高算力模組已AR眼鏡、無人機、智能座艙
    的頭像 發(fā)表于 04-26 09:03 ?954次閱讀
    美格智能攜手高通啟動2025<b class='flag-5'>邊緣</b>智能創(chuàng)新應(yīng)用大賽,<b class='flag-5'>賦</b><b class='flag-5'>能</b>端側(cè)<b class='flag-5'>AI</b>革命

    Firefly 推出 NVIDIA Jetson 系列產(chǎn)品,邊緣計算行業(yè)

    如今在AI迅猛發(fā)展的浪潮中,大語言模型展現(xiàn)出強大的智能交互能力,但如何解決其部署邊緣設(shè)備所面臨算力、內(nèi)存和能耗等諸多挑戰(zhàn),成為了行業(yè)關(guān)注的重點。Firefly推出的NVIDIAJet
    的頭像 發(fā)表于 03-12 16:32 ?1402次閱讀
    Firefly 推出 NVIDIA Jetson 系列產(chǎn)品,<b class='flag-5'>賦</b><b class='flag-5'>能</b><b class='flag-5'>邊緣</b>計算行業(yè)