半個多世紀(jì)前,浙江大學(xué)老校長竺可楨曾有兩個非常經(jīng)典的教育問題:“諸位在校,有兩個問題應(yīng)該自己問問,第一,到浙大來做什么?第二,將來畢業(yè)后做什么樣的人?”
半個多世紀(jì)后,以這位老校長名字命名的 “竺可楨學(xué)院” 求是科學(xué)班開啟了一位少年的求是之路。他就是本期采訪的主人公——彭靖田。
作為 5 月 25 日 - 5 月 27 日即將在杭州舉辦的 CTA 大會(官網(wǎng):https://dwz.cn/iSZ7BQUR)機(jī)器學(xué)習(xí)論壇演講嘉賓,彭靖田以谷歌技術(shù)專家的身份接受了 AI 科技大本營的采訪。
彭靖田,Google Developers Expert
谷歌技術(shù)專家(Google Developers Expert,GDEs)是這么定義的:來自全球各地經(jīng)驗(yàn)豐富的產(chǎn)品策略師、設(shè)計(jì)師、開發(fā)人員和營銷專家,積極支持開發(fā)人員、初創(chuàng)企業(yè)和公司以通過 web 應(yīng)用程序和移動應(yīng)用程序來改變這個社區(qū);面向 Android、Angular、Dart、Flutter、谷歌云平臺、IOT、機(jī)器學(xué)習(xí)、web 開發(fā)等多個技術(shù)方向。
這么說起來,彭靖田與谷歌、與機(jī)器學(xué)習(xí)的淵源由來已久。
編程始于興趣,終于成長
從中學(xué)時代的信息學(xué)奧林匹克競賽(OI)起,彭靖田就開始接觸編程和算法了。與絕大多數(shù)同齡人相比,這已經(jīng)非常早了,他卻自嘲:“我們班很多人小學(xué) 3 年級就開始編程,如今也在很多世界名校繼續(xù)攻讀 PhD”。相比起來,彭靖田在求是班反倒是接觸最晚的了。
彭靖田借用了一句老話,“興趣是最好的老師”。“可能我還是覺得 CS 這個學(xué)科本身比較有意思吧。高中階段帶給我啟蒙的主要是靠《算法導(dǎo)論》、 USACO 題庫、《浪潮之巔》,它們分別讓我窺見了算法、編程和行業(yè)歷史?!?/p>
光榮與夢想,偉大不是終點(diǎn)
大學(xué)畢業(yè)后,彭靖田順利拿到 Special Offer 進(jìn)入華為中央軟件研究院。期間,他主要參與了深度學(xué)習(xí)云服務(wù)的設(shè)計(jì)和實(shí)現(xiàn),當(dāng)時的主要需求是支撐分布式機(jī)器學(xué)習(xí)訓(xùn)練和在線推理服務(wù)。
他想,如果抽象 TensorFlow 為一種容器作業(yè),并基于 Kubernetes 在容器調(diào)度方面的優(yōu)勢,或許是一種實(shí)現(xiàn)路徑吧?說干就干,很快,彭靖田與同事一起開發(fā)了 DLKS (Deep Learning Kubernetes Scheduler)項(xiàng)目。
一年后,彭靖田加入當(dāng)時在容器技術(shù)領(lǐng)域頗有深耕的才云科技,主要負(fù)責(zé) AI 云業(yè)務(wù)線。但如何將容器集群管理技術(shù) Kubernetes 與深度學(xué)習(xí)框架 TensorFlow 結(jié)合也同樣存在不小的挑戰(zhàn)。2018 年初,彭靖田與 Google Cloud 一拍即合,決定參與到開源項(xiàng)目 Kubeflow 的推進(jìn)中來。
要知道,盡管在當(dāng)時 TensorFlow 已是主流深度學(xué)習(xí)框架之一,被廣泛應(yīng)用于國內(nèi)外科技企業(yè),但它也存在某些缺陷。作為 Google 在 2017 年推出的開源項(xiàng)目 Kubeflow,旨在支持多種機(jī)器學(xué)習(xí)框架如 TensorFlow、PyTorch、Caffe 運(yùn)行在 Kubernetes 之上。
“這個項(xiàng)目的使命更加遠(yuǎn)大,一開始我們就希望它能夠充分利用 Kubernetes 的優(yōu)勢,不僅支持 TensorFlow,還可以支持所有基于數(shù)據(jù)流圖(Dataflow)的機(jī)器學(xué)習(xí)框架?!?/p>
將機(jī)器學(xué)習(xí)革命推進(jìn)到底
2017 年下半年,一次偶然的機(jī)會,彭靖田開始了解到 Machine Learning GDE 這個項(xiàng)目?!澳菚簢鴥?nèi)應(yīng)該還沒有 ML GDE,才開始推廣。”
彼時,他正與林健、白小龍合作撰寫《深入理解 TensorFlow:架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)原理》這本書。抱著希望能夠跟 Google TensorFlow 和 Google Brain 團(tuán)隊(duì)有更多交流和聯(lián)系的想法,彭靖田申請了這個項(xiàng)目。
談起這段經(jīng)歷,他仍記憶猶新,“第一輪面試是法國的一位 ML GDE,第二輪是 Google Cloud 東京團(tuán)隊(duì)的 Kaz Sato,過程很順利?!?/p>
“不要總看模型準(zhǔn)確率有多高,分布式規(guī)模有多大,而是要先了解業(yè)務(wù)本身,再根據(jù)已有資源設(shè)計(jì)相應(yīng)的解決方案。”如今,不少企業(yè)正嘗試搭建自己的機(jī)器學(xué)習(xí)云平臺,在此過程中,卻又因缺乏人才而不免踩坑。
實(shí)際上,Google 一直在追求人工智能教育的普及,包括開放了 TensorFlow 這樣的高級項(xiàng)目。而如何幫助企業(yè)基于 Google 生態(tài)真正實(shí)現(xiàn)智能轉(zhuǎn)型升級,是彭靖田這樣的機(jī)器學(xué)習(xí)專家們正積極推動的事情。
以下為此次訪談實(shí)錄:
AI 科技大本營:從華為深度學(xué)習(xí)團(tuán)隊(duì)核心成員,到才云 Cloud AI 負(fù)責(zé)人,按照您核心技術(shù)路線的變遷角度來講,離不開基于 Kubernetes 作為機(jī)器學(xué)習(xí)部署平臺的思路。能否講講您是如何認(rèn)識到 Kubernetes 與 AI 結(jié)合的優(yōu)勢的?過去幾年,您認(rèn)為該項(xiàng)技術(shù)在落地應(yīng)用方面又發(fā)生了怎樣的顯著改變?
彭靖田:準(zhǔn)確來說,Kubernetes 之于 AI 不僅是部署,還是基礎(chǔ)設(shè)施(Infrastructure)。KDD 2017 年 收錄的《TFX: A TensorFlow- Based Production -Scale Machine Learning Platform》這篇論文給了我們一個很好的洞見。對于 Google 這樣擁有海量數(shù)據(jù)的公司來說,從 Mining 到 Learning,最后商業(yè)落地是一個順其自然的過程。不過,要想充分利用數(shù)據(jù)和模型,我們需要一個能夠支撐它的端到端機(jī)器學(xué)習(xí)平臺。
例如,Google 內(nèi)部多年以來使用 Borg(大型集群管理系統(tǒng)),基于 TensorFlow 打造這個平臺很穩(wěn)健,也很高效,但對于 Google 的外部用戶來說,我們認(rèn)為 Borg 可行的替代方案是 Kubernetes。事實(shí)證明,這條路還是可以走通的,雖然前路還有一些烏云。
跳出 AI 云或者機(jī)器學(xué)習(xí)平臺這個場景,云計(jì)算的技術(shù)變革趨勢已經(jīng)非常明朗,而 Kubernetes 的技術(shù)先進(jìn)性和生態(tài)使得我們現(xiàn)在可以更聚焦于應(yīng)用本身,而不再是基礎(chǔ)設(shè)施、軟件構(gòu)建和發(fā)布、網(wǎng)絡(luò)負(fù)載均衡等問題。現(xiàn)在已經(jīng)有很多企業(yè)在生產(chǎn)環(huán)境使用 Kubernetes,國內(nèi)規(guī)模最大的應(yīng)該是京東。
AI 科技大本營:目前,越來越多的企業(yè)開始在分布式機(jī)器學(xué)習(xí)云平臺上進(jìn)行相關(guān)部署,您認(rèn)為企業(yè)在做這一類的落地時需要注意哪些問題?如企業(yè)如何選擇適合業(yè)務(wù)的平臺和模型。
彭靖田:據(jù)我理解,應(yīng)該是越來越多企業(yè)在嘗試搭建自己的分布式機(jī)器學(xué)習(xí)云平臺,而不是部署。
談到落地,我覺得絕大部分的矛盾和分歧是 “需求沒有理清楚”?,F(xiàn)在這個行業(yè)最缺的就是既懂 AI 技術(shù),又清楚業(yè)務(wù)場景的人才。企業(yè)應(yīng)該多跟客戶聊一聊需求,而不是一味講“模型準(zhǔn)確率有多高,分布式規(guī)模有多大”??蛻舾嚓P(guān)心的是技術(shù)是否解決問題。因此,正如你說的,先了解業(yè)務(wù)本身,再根據(jù)已有資源設(shè)計(jì)解決方案(包括算法、端到端模型、平臺等)。
AI 科技大本營:據(jù)您的觀察,目前什么類型的企業(yè)最先搭建了自己的機(jī)器學(xué)習(xí)平臺?在這個過程中,會遇到哪些挑戰(zhàn)?利用分布式機(jī)器學(xué)習(xí)平臺會成為未來企業(yè)進(jìn)行技術(shù)部署的主流趨勢嗎?
彭靖田:擁有數(shù)據(jù)的大企業(yè),更確切的講,是希望挖掘數(shù)據(jù)背后價值,洞察客戶真實(shí)需求的大企業(yè),如 Google、Uber、華為、京東等最先搭建了自己的機(jī)器學(xué)習(xí)平臺。
挑戰(zhàn)是多方面的,搭建一個類似于 TFX 這樣的平臺,需要企業(yè)具備從硬到軟的技術(shù)實(shí)力。比如 Google 和華為都在研發(fā)自己的 AI 芯片、編譯器、框架和平臺,這其中的難度和挑戰(zhàn)不言而喻。
在我看來,IT 到 DT 一定是未來趨勢?;ヂ?lián)網(wǎng)浪潮下,我們能看到整個原子世界都在不斷被數(shù)字化。機(jī)器學(xué)習(xí)就是數(shù)據(jù)驅(qū)動的學(xué)科。未來所有的人和所有的行為都會被記錄下來,這背后的商業(yè)價值是巨大的。相信看過美國科幻電視劇《西部世界》的朋友會有這個洞察。
AI 科技大本營:您針對 TensorFlow 撰寫了相關(guān)著作,并開發(fā)了一個專門的視頻課程,您認(rèn)為相比于現(xiàn)有的其他框架 (如 PyTorch 等),TensorFlow 的優(yōu)勢在體現(xiàn)在哪里?深度學(xué)習(xí)框架之爭,最后會是什么結(jié)果?
彭靖田:TensorFlow 的優(yōu)勢主要體現(xiàn)在高性能、靈活、對大規(guī)模分布式訓(xùn)練的支持等。目前,TensorFlow 對于 Senior 用戶來說,足夠定制化,滿足了很多商業(yè)落地場景;但它也存在劣勢,學(xué)習(xí)曲線對 Junior 用戶不太友好,這也是 TensorFlow 2.0 要解決的重要問題。
現(xiàn)在談結(jié)果還為時尚早。AI 落地是未來三年里所有從業(yè)人努力的方向,而這也是真實(shí)需求定義框架的未來?;ヂ?lián)網(wǎng)(web 開發(fā))和移動互聯(lián)網(wǎng)(Android)的爆發(fā),我們看到 Java 找到了自己的路。
現(xiàn)在的爭斗都是暫時的,是學(xué)術(shù)圈和小部分產(chǎn)業(yè)界的存量博弈。在 AI 大規(guī)模落地前,我們不知道框架會走向何處。
AI 科技大本營:對于希望入門機(jī)器學(xué)習(xí)并使用 TensorFlow 的學(xué)習(xí)者,您有哪些入門和進(jìn)階的建議?
彭靖田:可以看看我在知乎 “ 如何高效地學(xué)習(xí) TensorFlow 代碼?” 問題的回答。(鏈接:
https://www.zhihu.com/question/41667903/answer/123150582)
簡單來講,還是搞清楚自身需求。你未來想成為做算法模型的、做平臺的、做落地應(yīng)用的,還是什么?當(dāng)這個問題明確,你就知道應(yīng)該深入了解 TensorFlow 的哪一層了。
AI 科技大本營:不久前竺可楨學(xué)院圖靈班也開始公布招收首批人工智能本科班,如何評價浙江大學(xué)在人工智能教育以及科研方面的優(yōu)勢地位?
彭靖田:據(jù)我了解竺院上一屆混合班 2/3 的學(xué)生選擇了 CS,浙大 CS 這一屆申請名校 PhD 的整體成績也不錯,看見母校越來越強(qiáng)很開心。談到優(yōu)勢,我個人認(rèn)為還是自由的學(xué)術(shù)氛圍和優(yōu)秀的教學(xué)資源吧。浙江大學(xué)里有很多院士帶領(lǐng)學(xué)生做前沿課題,也有諸如像 MOOC 中國著名網(wǎng)紅老師翁愷這樣的優(yōu)秀教學(xué)隊(duì)伍可以進(jìn)行一線教學(xué)指導(dǎo)。本科教學(xué)也一直緊跟美國名校的教學(xué)模式,相信浙大的同學(xué)都有體會。
AI 科技大本營:那么,在本次機(jī)器學(xué)習(xí)專場中,您會針對哪方面的內(nèi)容和大家進(jìn)行分享?
彭靖田:來 CTA,與我們一起聊聊 AI 的技術(shù)與落地。本次演講,我將向大家介紹如何使用 TensorFlow 2.0 Alpha 快速開發(fā)和部署機(jī)器學(xué)習(xí)模型。同時,我將介紹如何實(shí)現(xiàn) TensorFlow 1.x 和 2.0 模型之間的快速轉(zhuǎn)換。最后,我將介紹 TensorFlow 和 AI 為民服務(wù)的落地案例。
-
應(yīng)用程序
+關(guān)注
關(guān)注
38文章
3344瀏覽量
60276 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5599瀏覽量
124411 -
tensorflow
+關(guān)注
關(guān)注
13文章
334瀏覽量
62196
原文標(biāo)題:TensorFlow 2.0來了,為什么他卻說“深度學(xué)習(xí)框架之爭,現(xiàn)在談結(jié)果為時尚早”?
文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
強(qiáng)化學(xué)習(xí)會讓自動駕駛模型學(xué)習(xí)更快嗎?
LuatOS框架的使用(上)
機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中需避免的 7 個常見錯誤與局限性
穿孔機(jī)頂頭檢測儀 機(jī)器視覺深度學(xué)習(xí)
【團(tuán)購】獨(dú)家全套珍藏!龍哥LabVIEW視覺深度學(xué)習(xí)實(shí)戰(zhàn)課(11大系列課程,共5000+分鐘)
【團(tuán)購】獨(dú)家全套珍藏!龍哥LabVIEW視覺深度學(xué)習(xí)實(shí)戰(zhàn)課程(11大系列課程,共5000+分鐘)
如何深度學(xué)習(xí)機(jī)器視覺的應(yīng)用場景
請問STM32如何移植Audio框架?
如何在機(jī)器視覺中部署深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)
深度學(xué)習(xí)對工業(yè)物聯(lián)網(wǎng)有哪些幫助
自動駕駛中Transformer大模型會取代深度學(xué)習(xí)嗎?
大模型時代的深度學(xué)習(xí)框架
百度飛槳框架3.0正式版發(fā)布
為什么他卻說“深度學(xué)習(xí)框架之爭,現(xiàn)在談結(jié)果為時尚早”?
評論