關(guān)于Google發(fā)布AutoML的幾點看法

1 評論 8878 瀏覽 11 收藏 10 分鐘

文章為作者對AutoML的幾點思考,希望能夠給你帶來一些啟發(fā)。

我曾拋出過一個問題:

有沒有這樣的模型,可以對應用環(huán)境做出實時反饋,動態(tài)重構(gòu)整套模型?例如:前一秒還是深度神經(jīng)網(wǎng)絡(luò),接受刺激后,就立馬坍縮成一個SVM。

當時得到的一個回答是Alpha Zero,這不是我期待的答案,但在大方向上比較接近。

提出這種疑問,是因為人類對事物的認知也是實時重構(gòu)的。人腦的神經(jīng)網(wǎng)絡(luò)有一種在同經(jīng)驗的對話交流中重新串聯(lián)它們自己的能力。每當人看到一個模式,那些認識這個模式的神經(jīng)網(wǎng)絡(luò)連接會長得更強大,直到認識變成某種自動反應。如果模式改變了,那么我們用來感知它的能力也會慢慢改變,直到我們自己的大腦重新串聯(lián)來認識這個新模式。

若將人腦的這種學習機制放到AI領(lǐng)域,就是遷移學習,一種對變化環(huán)境的適應能力。

今天,Google發(fā)布了Cloud AutoML,能夠通過增強學習自動完成模型選擇+超參數(shù)優(yōu)化。它一定程度上再現(xiàn)了Alpha Zero的設(shè)計理念,也比Zero更直觀。

人工神經(jīng)網(wǎng)絡(luò)已經(jīng)實現(xiàn)了學習模型的自編碼,還需要人來訓練。而AutoML更進一步,實現(xiàn)了訓練過程的自編碼,通過類似Axure的拖拽方式就能完成對話操作。部分場景的訓練效果可能比AI工程師還好,提高了開發(fā)效率,也降低了準入門檻。

下面是本人對AutoML的幾點思考,還不太成熟,歡迎指正。

AI工程師是否將被取代?

目前只會刺激更多人投身到AI領(lǐng)域,估計很快就會有《零基礎(chǔ)1小時創(chuàng)建機器學習模型》這類教學視頻出現(xiàn)。至于取代工程師?未來不好說,目前AutoML還遠沒有那么強大,優(yōu)秀的AI工程師依然是爭搶的對象。

AutoML對AI產(chǎn)品經(jīng)理意味著什么?

它像一款制作Demo的工具,可以幫PM理解端到端學習的應用邊界。大部分PM(尤其轉(zhuǎn)型中的)并不具備AI工程師的實操能力,這是個真實存在的痛點。以后若要驗證新的場景思路,可以先做個Demo試試。解放出更多精力,分攤到分析場景、獲取數(shù)據(jù)、設(shè)計方案、推進落地上。

頂尖企業(yè)是否會用AutoML?

有AI基因的頂尖企業(yè)會選擇自研ML訓練平臺,比如BAT、華為、訊飛會將AutoML作為參考和過渡,不會依賴。這類云服務(wù)有很好的商業(yè)前景,估計國內(nèi)很快就會有類似的平臺上線,并借助自研的平臺高效為產(chǎn)業(yè)賦能。

非頂尖企業(yè)是否會用AutoML?

這取決于Google的功能迭代和售后服務(wù),能否滿足企業(yè)日益增長的細分場景需求。若AutoML能支撐更多場景,用真實數(shù)據(jù)打消中小型企業(yè)對黑盒訓練的顧慮,就可以幫助互聯(lián)網(wǎng)企業(yè)省掉大量研發(fā)成本。傳統(tǒng)企業(yè)也可通過招募工程師或外包團隊,借助AutoML搞定簡單場景。

AutoML后續(xù)的迭代方向有哪些?

a)無監(jiān)督、半監(jiān)督學習

目前只支持監(jiān)督學習,解決了設(shè)計模型、調(diào)參兩大痛點。其實相對于訓練模型,有時候標注數(shù)據(jù)的問題更令人頭疼。后續(xù)肯定可以支撐半監(jiān)督學習,將部分標簽數(shù)據(jù)做為參考,對剩余數(shù)據(jù)自動打標。

b)增強學習

連AutoML本身都是增強學習的產(chǎn)物,沒道理不支持。想想也蠻有意思,用增強學習來自動擬合增強學習模型,這就像師父教了個徒弟,然后徒弟再去教自己的徒弟。

c)NLP、CV、ASR、翻譯

第一版本只開放了圖像識別,也是最成熟的一塊,其他標準模型的支撐不會太遠。

d)從模型延伸到應用

能否進一步降低門檻,將模型對通用場景生成API,甚至直接生成AI應用呢?

例如一家小型超市,想知道如何調(diào)整商品擺放、商品品類、進貨量、促銷活動等來實現(xiàn)更高收益,他們雇不起工程師。這樣的超市還有很多,AutoML將來能否滿足類似的需求?

e)應用即訓練

目前大部分模型的訓練過程與應用部署是分開的,當然也看具體場景和終端的容量。小米的防盜鎖,每次指紋識別都會增加下一次的識別速度、準確度,越用越爽。

AutoML能否在云端實現(xiàn)應用場景下的實時訓練呢?相信會有這樣的需求,比如在線醫(yī)療成像診斷,實時獲取N家醫(yī)院的診斷數(shù)據(jù),通過動態(tài)的訓練使診斷正確率持續(xù)提升。

f)共享模型/應用

數(shù)據(jù)是戰(zhàn)略資源,共享數(shù)據(jù)(尤其打標好的)的阻力很大,但共享訓練好的模型并非沒有可能。若AutoML支持共享行業(yè)解決方案,會受到很多企業(yè)的青睞,尤其是冷啟動的創(chuàng)業(yè)項目。這樣企業(yè)就不用再愁訓練數(shù)據(jù),只要支付云服務(wù)費就獲得現(xiàn)成的模型或應用。

g)通用能力

估計企業(yè)最關(guān)心的就是通用能力了,如果不支撐復雜場景、長尾場景,就有一大批企業(yè)無法靠AutoML訓練出想要的模型。

AutoML對國內(nèi)巨頭意味著什么?

Google大方地公布Tensorflow、AutoML的源碼,不僅因為開放的基因和格局,更因為它手里掌握著核心競爭力與撒手锏,具備降維打擊的能力。它正在汲取群眾的智慧來完善自己,把更多敵人變?yōu)榕笥选?/p>

我覺得未來AI公司的競爭,拼的是這3方面:

  • 以區(qū)塊鏈、遷移學習、AI芯片為代表的技術(shù)突破
  • 下探到行業(yè)將場景落地的能力
  • 持續(xù)自我迭代的進化能力

這三方面在AutoML上均有體現(xiàn)。不難想象,國內(nèi)巨頭們可能已經(jīng)將自研類似的產(chǎn)品納入到戰(zhàn)略規(guī)劃了。它在自編碼、場景遷移的方向上擁有巨大潛力,這種向內(nèi)生長的可能性比云服務(wù)本身更有價值。

在探索未來的道路上,Google是走的最遠的那一個。我們有理由相信,AutoML只是道開胃小菜,后面會有一大波滿漢全席靠近,不知國內(nèi)巨頭如何抵擋。

AutoML的局限有哪些?

AutoML降低了準入門檻,但目前的深度學習體系本就是殘缺的,例如:抽象的層次太淺、無視因果關(guān)系、黑盒、基于統(tǒng)計。DNN還不夠優(yōu)雅,缺乏生機,這是我作為一名產(chǎn)品經(jīng)理感受。

無論NLP還是遷移學習,瓶頸都在于機器意識、知識圖譜的突破,我的思路是:

  • 從認知學、腦科學、神經(jīng)學尋找靈感
  • 結(jié)合最先進的機器學習和區(qū)塊鏈技術(shù),做模型間的深度耦合,在算法層面持續(xù)推演
  • 量子計算芯片的突破,新的底層架構(gòu)一定會催生出顛覆性的應用思路
  • 對知識圖譜的思維轉(zhuǎn)變,需要有更復雜的描述框架。相信未來的知識圖譜不會是簡單的存儲結(jié)構(gòu),而是包含計算力和算法的動態(tài)體系,就像人和地球一樣。

 

作者:于長弘,公眾號:AI小宇宙(ID:AI_endless)

本文由 @于長弘 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自 Unsplash ,基于 CC0 協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!