91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

TFRecorder已開源

Tensorflowers ? 來源:TensorFlow ? 作者:TensorFlow ? 2020-09-23 09:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在訓(xùn)練計(jì)算機(jī)視覺機(jī)器學(xué)習(xí)模型時(shí),數(shù)據(jù)加載是一種常見的性能瓶頸,可能導(dǎo)致 GPU 或 TPU 資源在等待數(shù)據(jù)加載到模型時(shí)得不到充分利用。以高效 TensorFlow Record (TFRecord)格式存儲(chǔ)數(shù)據(jù)集是解決這些問題的好方法,只不過,創(chuàng)建 TFRecords 往往需要大量的復(fù)雜代碼。

TensorFlow Record
https://tensorflow.google.cn/tutorials/load_data/tfrecord

我們上周開源了 TensorFlow Recorder 項(xiàng)目(也就是 TFRecorder),如此一來,數(shù)據(jù)科學(xué)家、數(shù)據(jù)工程師AI/ML 工程師只需幾行代碼即可創(chuàng)建基于圖像的 TFRecords。使用 TFRecords 對(duì)于創(chuàng)建高效 TensorFlow ML 流水線非常重要,而過去的創(chuàng)建方法非常繁瑣。在 TFRecorder 之前,要大規(guī)模創(chuàng)建 TFRecords,必須編寫一個(gè)數(shù)據(jù)流水線來解析結(jié)構(gòu)化數(shù)據(jù),從存儲(chǔ)中加載圖像并將結(jié)果序列化為 TFRecord 格式。TFRecorder 允許您直接從 Pandas dataframe 或 CSV 寫入 TFRecords,無需編寫任何復(fù)雜的代碼。

TensorFlow Recorder
https://github.com/google/tensorflow-recorder

以下是 TFRecoder 的示例,但我們先談?wù)?TFRecords 的一些特定優(yōu)勢(shì)。

TFRecords 如何提供幫助

TFRecord 文件格式可以將數(shù)據(jù)存儲(chǔ)在文件集中,每個(gè)文件都包含序列化為二進(jìn)制記錄的 Protocol Buffers 序列,可以非常高效地讀取,有助于減少上述數(shù)據(jù)加載瓶頸。

Protocol Buffers
https://developers.google.com/protocol-buffers/

在使用 TFRecord 格式的同時(shí)實(shí)現(xiàn)預(yù)提取和并行交錯(cuò),可以進(jìn)一步提高數(shù)據(jù)加載性能。當(dāng)模型在當(dāng)前步驟上執(zhí)行訓(xùn)練時(shí),使用 prefetch 可以提前獲取下一個(gè)訓(xùn)練步驟的數(shù)據(jù),從而縮短每個(gè)模型訓(xùn)練步驟的時(shí)間,Parallel interleave 允許您讀取多個(gè) TFRecords 分片(TFRecord 文件的一部分),并對(duì)這些交錯(cuò)的數(shù)據(jù)流進(jìn)行預(yù)處理。這能夠減少讀取訓(xùn)練批次所需的延遲,特別適用于從網(wǎng)絡(luò)讀取數(shù)據(jù)。

預(yù)提取和并行交錯(cuò)
https://tensorflow.google.cn/guide/data_performance

使用 TensorFlow Recorder

使用 TFRecorder 只需幾行代碼即可創(chuàng)建 TFRecord。工作原理如下。

import pandas as pd import tfrecorder df = pd.read_csv(...) df.tensorflow.to_tfrecord(output_dir="gs://my/bucket")

TFRecorder 目前預(yù)期數(shù)據(jù)與 Google AutoML Vision 格式相同。

AutoML Vision
https://cloud.google.com/vision/automl/docs/prepare

這種格式與 Pandas dataframe 或 CSV 格式類似:

split image_uri label
TRAIN gs://my/bucket/image1.jpg cat

其中:

split 可以取值 TRAIN、VALIDATION 和 TEST

image_uri 指定圖像文件的本地或 Google Cloud Storage 位置。

label 可以是將被整數(shù)化的基于文本的標(biāo)簽,也可以是一個(gè)整數(shù)

將來,我們希望進(jìn)一步擴(kuò)展 TensorFlow Recorder,支持所有格式的數(shù)據(jù)。

這個(gè)示例雖然能夠?qū)⑸锨€(gè)圖像順利轉(zhuǎn)換成 TFRecords,但擴(kuò)展到百萬計(jì)的圖像可能就難以處理。為了擴(kuò)展到龐大的數(shù)據(jù)集,TensorFlow Recorder 提供了與 Google Cloud Dataflow 的連接,后者是一款無服務(wù)器 Apache Beam 流水線運(yùn)行器。擴(kuò)展到 DataFlow 僅需要多一點(diǎn)配置。

Google Cloud Dataflow
https://cloud.google.com/dataflow
Apache Beam
https://beam.apache.org/

df.tensorflow.to_tfrecord( output_dir="gs://my/bucket", runner="DataFlowRunner", project="my-project", region="us-central1)

未來計(jì)劃

我們希望您愿意嘗試 TensorFlow Recorder。您可以從 GitHub 獲取,或者直接 pip 安裝 tfrecorder。

TensorFlow Recorder 剛剛面世,我們非常期待您的反饋、建議和 Pull Requests。

原文標(biāo)題:創(chuàng)建 TFRecords 的救星 — TensorFlow Recorder 現(xiàn)已開源!

文章出處:【微信公眾號(hào):TensorFlow】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5200

    瀏覽量

    135538
  • DPU
    DPU
    +關(guān)注

    關(guān)注

    0

    文章

    414

    瀏覽量

    27017
  • 計(jì)算機(jī)視覺
    +關(guān)注

    關(guān)注

    9

    文章

    1715

    瀏覽量

    47646
  • Record
    +關(guān)注

    關(guān)注

    0

    文章

    4

    瀏覽量

    6845

原文標(biāo)題:創(chuàng)建 TFRecords 的救星 — TensorFlow Recorder 現(xiàn)已開源!

文章出處:【微信號(hào):tensorflowers,微信公眾號(hào):Tensorflowers】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    瑞芯微就MPP開源合規(guī)問題致歉,整改全部完成

    近日,瑞芯微就其開源媒體框架MPP(Media?Processing?Platform)涉及的開源合規(guī)問題發(fā)布官方致歉公告,引發(fā)開源社區(qū)與行業(yè)的廣泛關(guān)注。 ? 事件的源頭可追溯到2024年2月23日
    的頭像 發(fā)表于 03-01 06:44 ?7132次閱讀
    瑞芯微就MPP<b class='flag-5'>開源</b>合規(guī)問題致歉,整改<b class='flag-5'>已</b>全部完成

    C-小智開源版,可二次開發(fā)(WIN32)#小智AI #開源 #二次開發(fā)

    開源
    不太正經(jīng)的攻城獅
    發(fā)布于 :2026年01月04日 19:31:14

    開源鴻蒙高級(jí)人才認(rèn)證共建會(huì)議圓滿舉辦

    高級(jí)人才認(rèn)證共建會(huì)議。通過人才共建,開源鴻蒙社區(qū)人才認(rèn)證數(shù)量不斷突破,截至2025年12月超10萬人獲得初級(jí)人才認(rèn)證證書。
    的頭像 發(fā)表于 12-31 10:32 ?586次閱讀

    NVIDIA 收購開源工作負(fù)載管理提供商 SchedMD

    供 Slurm 這一廠商中立的開源軟件,支持其在各種硬件和軟件環(huán)境中廣泛可用,并得到 HPC 和 AI 社區(qū)的支持。 NVIDIA 與 SchedMD 合作
    的頭像 發(fā)表于 12-16 18:24 ?1362次閱讀

    開源鴻蒙項(xiàng)目達(dá)成開源孵化目標(biāo)順利畢業(yè)

    11月21日,2025開放原子開發(fā)者大會(huì)在北京隆重啟幕。作為本次大會(huì)的重磅環(huán)節(jié)和核心焦點(diǎn)之一,在大會(huì)開幕式上,開源鴻蒙項(xiàng)目達(dá)成開源孵化目標(biāo)、順利畢業(yè),這是項(xiàng)目開源共建五年來最具意義的成果之一。
    的頭像 發(fā)表于 11-25 17:36 ?1175次閱讀

    開源鴻蒙和開源歐拉成為開放原子開源基金會(huì)首批畢業(yè)項(xiàng)目

    11月21日,在2025開放原子開發(fā)者大會(huì)開幕式上,開放原子開源基金會(huì)宣布旗下開源鴻蒙(OpenHarmony)與開源歐拉(openEuler)成為首批畢業(yè)項(xiàng)目。
    的頭像 發(fā)表于 11-25 17:22 ?855次閱讀

    開源鴻蒙6.0 Release版本重磅發(fā)布

    近日,在長沙國際會(huì)議中心舉辦的開源鴻蒙技術(shù)大會(huì)2025上,開放原子開源鴻蒙(即OpenAtom OpenHarmony,簡稱“開源鴻蒙”)項(xiàng)目群正式發(fā)布開源鴻蒙6.0 Release版
    的頭像 發(fā)表于 10-10 16:49 ?2897次閱讀

    開源主板全系列橫評(píng)!上官網(wǎng)查看更多參數(shù)!

    開源
    廣州靈眸科技有限公司
    發(fā)布于 :2025年08月29日 11:50:04

    共譜開源華章 | 匠芯創(chuàng)榮獲“開源生態(tài)戰(zhàn)略合作伙伴”獎(jiǎng)

    由嘉立創(chuàng)集團(tuán)主辦的第三屆開源硬件星火會(huì)在深圳福田四季酒店舉行。大會(huì)旨在搭建開源硬件領(lǐng)域交流合作的高水準(zhǔn)平臺(tái),匯聚產(chǎn)、學(xué)、研各界嘉賓,圍繞開源硬件設(shè)計(jì)、國產(chǎn)EDA、國產(chǎn)芯片等熱點(diǎn)議題深入探討。匠芯創(chuàng)
    的頭像 發(fā)表于 08-07 15:37 ?1395次閱讀
    共譜<b class='flag-5'>開源</b>華章 | 匠芯創(chuàng)榮獲“<b class='flag-5'>開源</b>生態(tài)戰(zhàn)略合作伙伴”獎(jiǎng)

    2025開放原子開源生態(tài)大會(huì)前瞻

    、降低成本、吸引人才、構(gòu)建差異化競爭優(yōu)勢(shì)的關(guān)鍵要素。從數(shù)據(jù)處理、模型訓(xùn)練到工具應(yīng)用,開源技術(shù)的身影無處不在,其影響力深深嵌入現(xiàn)代AI技術(shù)棧的各個(gè)層面。
    的頭像 發(fā)表于 07-21 17:47 ?1063次閱讀

    華為正式開源盤古7B稠密和72B混合專家模型

    關(guān)鍵舉措,推動(dòng)大模型技術(shù)的研究與創(chuàng)新發(fā)展,加速推進(jìn)人工智能在千行百業(yè)的應(yīng)用與價(jià)值創(chuàng)造。 盤古Pro MoE 72B模型權(quán)重、基礎(chǔ)推理代碼,正式上線開源平臺(tái)。 基于昇騰的超大規(guī)模MoE模型推理代碼,正式上線
    的頭像 發(fā)表于 06-30 11:19 ?1351次閱讀

    開源智聯(lián)·具身同行:機(jī)智云推出基于豆包的 OpenEmbodied AI技術(shù)、產(chǎn)品及開源方案

    6月11日機(jī)智云攜手火山引擎、扣子發(fā)起,聯(lián)合CSDN、GitCode、廣和通、奕斯偉、愛灣學(xué)院舉辦的“開源智聯(lián)·具身同行”字節(jié)豆包AIoT開源生態(tài)沙龍圓滿成功,正式推出基于豆包
    的頭像 發(fā)表于 06-13 19:19 ?1090次閱讀
    <b class='flag-5'>開源</b>智聯(lián)·具身同行:機(jī)智云推出基于豆包的 OpenEmbodied AI技術(shù)、產(chǎn)品及<b class='flag-5'>開源</b>方案

    開源鴻蒙應(yīng)用技術(shù)組件共建計(jì)劃啟動(dòng)

    通過兼容性測(cè)評(píng),覆蓋金融、交通、教育、醫(yī)療、航天等多個(gè)行業(yè)領(lǐng)域,已成為發(fā)展速度最快的開源操作系統(tǒng)之一。截至目前,開源鴻蒙累計(jì)發(fā)布 8 個(gè)大版本,共建共享15個(gè)技術(shù)域的1115款開源
    的頭像 發(fā)表于 06-05 14:33 ?1040次閱讀