一份AI公司應(yīng)聘指南: AI 從業(yè)人員如何在面試中引起注意?
這篇文章是專門為那些想利用人工智能解決有趣問題的人寫的。
過去 8 個(gè)月里,我參加了谷歌 DeepMind、Wadhwani 人工智能研究所、微軟、Ola、Fractal Analytics 等多家公司的面試,應(yīng)聘數(shù)據(jù)科學(xué)家、軟件工程師和研究工程師等職位。在這個(gè)過程中,我不僅有機(jī)會與許多厲害的人物打交道,還能審視自己,了解面試官在面試過程中真正想要什么。我相信,如果我以前有這方面的知識,就可以避免許多錯(cuò)誤,并以更好的方式做好準(zhǔn)備,這也是我撰寫此文的動機(jī),希望本文能夠幫助別人找到理想的工作。
畢竟,如果人生(至少)三分之二的時(shí)間都在工作,那么最好找一份值得的吧。
本文的靈感源于我和一個(gè)三年級學(xué)生的討論,他認(rèn)為從事 AI 的人很難通過校園招聘找到滿意的工作機(jī)會。此外,我在為面試做準(zhǔn)備的時(shí)候,發(fā)現(xiàn)人們使用了大量資源,但根據(jù)過去幾個(gè)月的經(jīng)驗(yàn),我認(rèn)為對于大多數(shù) AI 從業(yè)人員,很多基本資源都是不必要的,文末列出了所需資源的最簡清單。本文首先介紹如何在面試中引起注意,然后我提供了一份可以申請的企業(yè)和初創(chuàng)公司名單,接著是如何在面試中取得成功。我根據(jù)個(gè)人經(jīng)驗(yàn),增加了一個(gè)我們應(yīng)該為何努力工作的部分。最后是準(zhǔn)備工作所需的最少資源。
注意:對于那些在等校園招聘的人,我想補(bǔ)充兩點(diǎn):首先,我要說的大部分內(nèi)容(可能除了最后一點(diǎn))都與你無關(guān)。但是,第二點(diǎn)是,正如我之前提到過的,校園招聘的工作機(jī)會大多是軟件工程崗,與人工智能沒有交集。所以,這篇文章是專門為那些想利用人工智能解決有趣問題的人寫的。此外,我還想補(bǔ)充一點(diǎn),我并沒有通過所有面試,但我想這就是失敗的意義——它是最偉大的老師。本文提到的事情可能并非全都有用,但這些都是我的經(jīng)驗(yàn),我不知道還有什么辦法能讓它變得更有說服力。
一、如何在面試中引起注意
老實(shí)說,這一步最重要。讓社會招聘變得如此艱難和疲憊的原因是如何讓招聘人員在收到的眾多申請中仔細(xì)查看你的個(gè)人資料。與公司內(nèi)部人員建立聯(lián)系可以讓你很容易地獲得推薦,但一般而言,這一步可細(xì)分為三個(gè)關(guān)鍵步驟:
1. 做好相關(guān)準(zhǔn)備
即準(zhǔn)備好領(lǐng)英檔案、Github 檔案、個(gè)人網(wǎng)站以及一份精心打造的簡歷等材料。首先,你的簡歷應(yīng)該非常整潔和精煉??梢愿鶕?jù)?Resume Revamp?來規(guī)劃簡歷,它包含我想說的所有有關(guān)簡歷的內(nèi)容,我自己也一直用它作為參考。至于簡歷模板,Overleaf 上提供的一些格式很不錯(cuò)。我個(gè)人使用?deedy-resume,以下是預(yù)覽:
如上圖所示,一頁可以有很多內(nèi)容。但是,如果你要寫的內(nèi)容不止于此,那么上述格式的直接效果不會太好。你可以在這里找到多頁格式:https://latexresu.me/。下一個(gè)要點(diǎn)是你的 GitHub 資料。很多人僅僅因?yàn)樗幌?LinkedIn 那樣具備「誰看過你的資料」選項(xiàng),而低估了它的重要性。人們真的會看你的 GitHub,因?yàn)檫@是驗(yàn)證你 CV 中提及項(xiàng)目的唯一方式,鑒于人們現(xiàn)在在自己的職業(yè)資料中添加了很多與各種流行詞相關(guān)的噪聲。尤其是對于數(shù)據(jù)科學(xué)來說,開源意味著把使用的很多工具、實(shí)現(xiàn)的不同算法、各種學(xué)習(xí)資源都開放出來了。我在之前的文章里談過開源的益處和如何從頭開始創(chuàng)建自己的 GitHub。最低要求是:
- 創(chuàng)建一個(gè) GitHub 賬號;
- 為自己做過的項(xiàng)目創(chuàng)建一個(gè) repo;
- 添加關(guān)于如何運(yùn)行代碼的清晰文檔說明;
- 為每個(gè)提及函數(shù)作用、參數(shù)意義、格式和腳本的單個(gè)文件添加說明文檔。
第三步是大部分人缺少的,即在招聘網(wǎng)站上展示自己的經(jīng)歷和個(gè)人項(xiàng)目。制作個(gè)人職業(yè)資料表示你非常嚴(yán)肅地考慮進(jìn)入某領(lǐng)域,在真實(shí)性上加了很多分。此外,履歷(CV)通常會有空間限制,可能會缺失一些重要細(xì)節(jié)。你可以在個(gè)人職業(yè)資料中深入介紹這些細(xì)節(jié),推薦對項(xiàng)目/思路進(jìn)行某種形式的可視化或其他展示。創(chuàng)建一份職業(yè)資料非常簡單,有很多免費(fèi)平臺,通過拖放功能就可以實(shí)現(xiàn)這一過程。我個(gè)人使用 Weebly,這是個(gè)廣泛使用的工具。開頭有 reference 更好。有很多不錯(cuò)的例子,不過我參考了 Deshraj Yadav 的個(gè)人網(wǎng)站,制作了我自己的:
最后,很多招聘者和創(chuàng)業(yè)公司開始使用領(lǐng)英作為招聘平臺,領(lǐng)英上有大量好工作。除了招聘者之外,擔(dān)任有影響力職務(wù)的人在領(lǐng)英上也很活躍。因此,如果你可以吸引他們的注意力,你就有機(jī)會進(jìn)入面試。
此外,維護(hù)個(gè)人資料也是必要的,這樣人們更有意愿與你聯(lián)系。領(lǐng)英的一個(gè)重要部分是搜索工具,如果你想被看到,那么你的資料中必須有相關(guān)關(guān)鍵詞。我更改了很多次,進(jìn)行了多次評估,才有了一份不錯(cuò)的個(gè)人資料。你還應(yīng)該請同事或領(lǐng)導(dǎo)為你的技能背書、寫推薦語。所有這些都會提高你被注意到的幾率。領(lǐng)英和 Github 個(gè)人資料指南,可參考:https://career-resource-center.udacity.com/linkedin-github-profiles。
這看起來太多了,但是記住,你不必要一天內(nèi)或者一周、一個(gè)月內(nèi)完成。這是一個(gè)過程,一個(gè)不會結(jié)束的過程。起初設(shè)置好一切肯定需要你付出精力和時(shí)間,但是一旦完成,你就只需要定期更新條目就可以了,這種方法不僅容易,而且還可以隨時(shí)隨地談?wù)撟约海挥每桃鉁?zhǔn)備,因?yàn)槟銓ψ约阂呀?jīng)有了清晰的認(rèn)知。
2. 確保真實(shí)性
我見過很多人犯下這樣的錯(cuò)誤,他們的個(gè)人資料出現(xiàn)在多個(gè)不同的職位之外。我認(rèn)為,更好的做法是先確定自己真正感興趣、樂意做的事情,再尋找相關(guān)機(jī)會,而不是反過來。AI 人才供不應(yīng)求的現(xiàn)狀給你提供了機(jī)會?;ㄒ恍r(shí)間按上述做法定期更新資料能夠使你對自己有一個(gè)全面的認(rèn)知,幫助你及早確定方向。此外,你無需對面試中可能被問的不同問題準(zhǔn)備答案。大部分答案在你談?wù)撟约赫嬲裏釔鄣氖虑闀r(shí)會自然而然地出現(xiàn)。
3. 人際關(guān)系網(wǎng)
完成 a 和 b 之后,人際關(guān)系網(wǎng)將真正幫助你達(dá)到目的。如果你不和別人溝通,那么你可能錯(cuò)過很多好機(jī)會。每天聯(lián)系新的人是很重要的,如果不能面見,那就在領(lǐng)英上溝通,這樣過些時(shí)候,你就擁有了強(qiáng)大的大型人際網(wǎng)絡(luò)。
人際關(guān)系不是聯(lián)系別人為你寫推薦信。我最初經(jīng)常犯這個(gè)錯(cuò)誤,直到讀了 Mark Meloon《Climbing the Relationship Ladder to Get a Data Science Job》一文,他在這篇文章中談?wù)摿送ㄟ^率先提供幫助來構(gòu)建真實(shí)聯(lián)系的重要性。構(gòu)建人際關(guān)系過程中另一個(gè)重要的步驟是展示自己。比如,如果你擅長某事,在博客中寫出來,然后在 Facebook 和 LinkedIn 上分享這篇博客。這樣不僅能夠幫助到別人,還能幫助到自己。
一旦你擁有了足夠強(qiáng)大的人際關(guān)系網(wǎng),那么你被人看到的幾率將大大提升。你不會知道你關(guān)系網(wǎng)中的一個(gè)人是否喜歡、如何評價(jià)你的博客,這或許可以幫助你接觸到更廣泛的受眾,包括尋找像你這樣具備某方面專業(yè)知識的人才。
二、可以申請的企業(yè)及初創(chuàng)公司名單
我將按字母順序呈現(xiàn)該列表,避免帶來優(yōu)先性方面的誤解。但是,我會在我個(gè)人推薦的那些公司上面加上*。本推薦列表基于以下因素:使命陳述、人員、人際互動、學(xué)習(xí)范圍。多于一個(gè)的*是完全基于第 2 和第 3 個(gè)因素而加的。
- Adobe Research
- *AllinCall(由印度理工學(xué)院孟買分校校友會創(chuàng)建)
- *Amazon
- Arya.ai
- *Facebook AI Research: AI Residency Program
- *Fractal Analytics(以及 Cuddle.ai、**Qure.ai)
- **谷歌(Brain/DeepMind/X):AI Residency Program
- 高盛
- Haptik.ai
- **HyperVerge——由印度理工學(xué)院馬德拉斯分校校友會創(chuàng)建,他們正在與世界各地的客戶合作,為現(xiàn)實(shí)問題開發(fā)人工智能解決方案,創(chuàng)始人包括在該校創(chuàng)立著名計(jì)算機(jī)視覺小組的人
- IBM Research
- *Intel AI labs(強(qiáng)化學(xué)習(xí))
- **Jasmine.ai——由在密歇根大學(xué)獲得博士學(xué)位的印度理工學(xué)院馬德拉斯分校校友會創(chuàng)辦,他們致力于會話智能研究。而且他們的資金很充足。他們正在尋找能盡快加入班加羅爾辦事處的人:https://docsend.com/view/xff9hwr
- 摩根大通;
- *Microsoft Research:印度實(shí)驗(yàn)室 1 到 2 年研究員職位,AI Residency Program
- MuSigma
- Next Education
- niki.ai
- *Niramai:由之前在施樂研究公司的員工組成,致力于使用熱成像技術(shù)進(jìn)行乳腺癌早期篩查
- Ola
- *OpenAI
- *PathAI
- Predible Health
- Qualcomm
- *SalesForce
- Samsung Research
- *SigTuple
- *Suki:為醫(yī)生設(shè)計(jì)的 AI 語音助手。近期,它籌集到大量資金,可能很快會在印度開設(shè)辦事處
- *Swayatt Robotics:開發(fā)適應(yīng)印度交通條件的自動駕駛汽車
- **Wadhwani AI:由億萬富翁 Romesh Wadhwani 和 Sunil Wadhwani 資助,他們的目標(biāo)是成為 AI 領(lǐng)域的第一個(gè)社會公益組織
- *Uber AI Labs & Advanced Technologies Group:AI Residency Program
- *Umbo CV:使用計(jì)算機(jī)視覺的安全性
- Uncanny Vision
- Zendrive
三、 如何贏得面試
從你走進(jìn)房間的那一刻起,面試就已經(jīng)開始了。從那一刻到進(jìn)行自我介紹之前可能會發(fā)生很多事——你的肢體語言及微笑問候起著很大的作用,尤其是當(dāng)你去一家初創(chuàng)公司面試時(shí),他們非常關(guān)心這一點(diǎn)。你要知道,盡管對于你來說面試官是陌生人,但對于他/她來說你也是陌生人。所以他們可能和你一樣緊張。
把面試看作是你和面試官之間的對話,這點(diǎn)非常重要。你們倆都在尋找對雙方都有利的結(jié)果(mutual fit)——你在尋找一個(gè)優(yōu)秀的工作場所,而面試官在尋找一個(gè)優(yōu)秀的共事者。所以,確保你對自己感覺良好,同時(shí)保證對話的開場令人愉悅。要做到這一點(diǎn),最簡單的方法就是微笑。
面試主要有兩種類型——一種是面試官帶著準(zhǔn)備好的問題來面試,不管你的個(gè)人資料如何,他/她都會問你這些問題;另一種面試基于你的簡歷。我從第二種面試開始解釋。
第二種面試的開場白通常是“可以簡單介紹下自己嗎”。關(guān)于這個(gè)問題的回答有兩個(gè)大忌——談?wù)撃阍诖髮W(xué)的 GPA 或詳細(xì)介紹自己的項(xiàng)目。理想的回答應(yīng)該控制在一兩分鐘左右,簡要說明你做過些什么,內(nèi)容并不局限于學(xué)術(shù)。可以談?wù)勀愕膼酆?,比如讀書、運(yùn)動、冥想等,也就是談?wù)撊魏斡兄诙x你的東西。然后面試官會把你在自我介紹里談到的一些東西作為他下一個(gè)問題的引子,開啟面試的技術(shù)部分。這種面試的目的是為了檢驗(yàn)?zāi)銓懺诤啔v上的內(nèi)容是否真實(shí):
任何一個(gè)真正解決了某個(gè)問題的人都能夠從多個(gè)層面來回答它。他們能夠進(jìn)入黃銅軌道,不然就會卡住——Elon Musk
這個(gè)過程中會出現(xiàn)很多問題,比如可以采取什么不同的做法,是否可以用「X」代替「Y」,會發(fā)生什么情況等。此時(shí),了解在實(shí)現(xiàn)過程中通常做出的權(quán)衡很重要,例如,如果面試官說使用更復(fù)雜的模型會取得更好的結(jié)果,那么你可以說實(shí)際上需要處理的數(shù)據(jù)較少,這會導(dǎo)致過擬合。在一次面試中,面試官給了我一個(gè)案例研究,涉及為一個(gè)真實(shí)用例設(shè)計(jì)算法。我注意到,面試官非常喜歡我以下面的流程來展開討論:
問題 > 1 至 2 個(gè)之前的解決方案 > 我的解決方案 > 結(jié)果 > 直覺
另一種面試其實(shí)只是為了測試你的基本知識。不要擔(dān)心問題太難。但它們肯定會涉及你應(yīng)該掌握的所有基本知識,主要基于線性代數(shù)、概率、統(tǒng)計(jì)、優(yōu)化、機(jī)器學(xué)習(xí)和/或深度學(xué)習(xí)。「你需要準(zhǔn)備的背景知識」一節(jié)中提到的資源應(yīng)該夠用了,但請確保不要遺漏其中的任何一點(diǎn)。這里的關(guān)鍵是你回答這些問題所花的時(shí)間。因?yàn)樗鼈兒w了基礎(chǔ)知識,所以面試官希望你最好能夠立即作答。所以,請做好相應(yīng)的準(zhǔn)備。
在整個(gè)過程中,對你知道和不知道的事保持自信和誠實(shí)是很重要的一點(diǎn)。如果某個(gè)問題你確定不知道,直接說不知道,而不是發(fā)出“啊”“嗯”的聲音。如果某個(gè)概念真的很重要,但你覺得很難回答,面試官通常會很樂意給你提示或指導(dǎo)你找到正確的解決方案(這取決于你在面試開始階段表現(xiàn)如何)。正確理解面試官的提示并據(jù)此找到合適的解決方案是一個(gè)很大的加分項(xiàng)。盡量不要緊張,避免緊張的最佳方法就是微笑。
現(xiàn)在我們來到面試結(jié)尾,即面試者問你是否有什么問題。人們很容易認(rèn)為面試結(jié)束了,并回答沒有問題要問。我知道很多人被拒絕,就是因?yàn)檫@最后一個(gè)問題。如前所述,被面試者不只你自己。你也在探索你與這家公司雙方是否都適合。因此很明顯,如果你真的想加入一家公司,你肯定對公司文化或他們對你的期望角色等有疑問,甚至只是簡單地對面試者感到好奇。你總是能從身邊的事物中學(xué)習(xí)到東西,你要確保給面試者留下你對他們團(tuán)隊(duì)真的感興趣的印象。我對面試者提出的問題是他們對我的反饋。這給了我很大幫助,我仍然記得每一個(gè)反饋,并真的融入到日常生活中。
以上?;谖业慕?jīng)驗(yàn),如果你坦誠、具備相應(yīng)能力、真正關(guān)心面試的公司,并具備合適的思維模式,那么你應(yīng)該適合所有要求,很快拿到 offer。
四、我們應(yīng)該為什么而努力工作
我們處于一個(gè)充滿機(jī)會的時(shí)代,可以做自己喜歡的事情。你只需要努力成為該領(lǐng)域最優(yōu)秀的人,就會找到一種實(shí)現(xiàn)它的方法。正如 Gary Vaynerchuk 所說:
對 AI 研究來說,這是一個(gè)偉大的時(shí)代。如果你真的對此充滿激情,那么你可以做的事情有很多很多。你可以賦予那些被忽略的人力量。我們一直抱怨身邊的問題,而從來沒有一個(gè)時(shí)代像現(xiàn)在這樣普通人也可以做為此做些什么,而不是僅僅抱怨。Jeffrey Hammerbacher 有一句名言:
我們這一代最杰出的頭腦都在拼命思考如何吸引人點(diǎn)擊廣告。
利用 AI 能做的事情遠(yuǎn)超我們的想象。有很多非常棘手的問題,需要像你這樣極其聰明的人來解決。你可以讓很多人的生活變得更美好。是時(shí)候放棄「酷」的事情,或「看起來不錯(cuò)」的事情了,認(rèn)真思考,做出明智的選擇。
五、你需要準(zhǔn)備的背景知識
所有數(shù)據(jù)科學(xué)面試中會出現(xiàn)的問題基本上都包含在四個(gè)大類中:計(jì)算機(jī)科學(xué)、數(shù)學(xué)、統(tǒng)計(jì)學(xué)和機(jī)器學(xué)習(xí)。
計(jì)算機(jī)科學(xué):
- 算法和數(shù)據(jù)結(jié)構(gòu)
- InterviewBit
- NPTEL IIT Delhi 的課程
操作系統(tǒng):
- https://medium.com/the-aspiring-programmer-journal/the-10-operating-system-concepts-software-developers-need-to-remember-480d0734d710
- 《Operating System Concepts》的三、四、五、七章?
- GeekForGeeks 上的操作系統(tǒng):
- 面向?qū)ο缶幊蹋耗銜粏柤叭绾卧O(shè)計(jì)一個(gè)系統(tǒng),例如一個(gè)鐵路售票系統(tǒng)。此時(shí)你需要和面試者討論他們的需求,需要創(chuàng)建多少個(gè)類,每個(gè)類包含哪些變量與方法,如何使用繼承(如 Engineer 和 Scientist 類都是 Employee 類派生的)等等。這些知識來源于實(shí)踐。你可以在這里找到一些基本術(shù)語的解釋:https://medium.com/dot-net-tutorial/oops-interview-questions-with-answers-for-freshers-b2a568ed364b
數(shù)學(xué)和統(tǒng)計(jì)
如果你不了解深度學(xué)習(xí)背后的數(shù)學(xué)知識,你要找一些學(xué)習(xí)資源。
參考內(nèi)容
- 谷歌與 MIT 聯(lián)袂巨著:《計(jì)算機(jī)科學(xué)的數(shù)學(xué)》開放下載
- 從入門到高階,讀懂機(jī)器學(xué)習(xí)需要哪些數(shù)學(xué)知識(附網(wǎng)盤)
- 這是一份文科生都能看懂的線性代數(shù)簡介
當(dāng)然,Ian Goodfellow 等人的《深度學(xué)習(xí)》中第二、三和四章的數(shù)學(xué)已經(jīng)足以應(yīng)對面試中這類理論問題了。如果你沒有時(shí)間,我也對其中的一些章節(jié)概念進(jìn)行了總結(jié);
如果你已經(jīng)學(xué)習(xí)了有關(guān)概率的課程,數(shù)學(xué)問題應(yīng)該不在話下了。有關(guān)統(tǒng)計(jì)學(xué)的問題可以參考:https://www.quora.com/How-should-I-prepare-for-statistics-questions-for-a-data-science-interview-What-topics-should-I-brush-up-on/answer/Dima-Korolev?share=ac534713&srid=oEqx
機(jī)器學(xué)習(xí)
在這里,問題的種類完全取決于你面試的崗位。如果你遇到了傳統(tǒng)型的機(jī)器學(xué)習(xí)面試。那么有關(guān)機(jī)器學(xué)習(xí)的基礎(chǔ)知識就必不可少,下面的一些課程可能對你有所幫助:
吳恩達(dá)的 CS229 課程:?http://cs229.stanford.edu/
加州理工教授 Yaser Abu-Mostafa 的機(jī)器學(xué)習(xí)課程:https://work.caltech.edu/telecourse.html
重要的話題包括:監(jiān)督學(xué)習(xí)(分類、回歸、支持向量機(jī)、決策樹、隨機(jī)森林、邏輯回歸、多層感知機(jī)、參數(shù)估計(jì)、貝葉斯決策規(guī)則),無監(jiān)督學(xué)習(xí)(K-means 聚類、高斯混合模型),降維(PCA)。
如果你申請的職位更加高級,那很可能會被問到有關(guān)深度學(xué)習(xí)的問題。在這種情況下,你需要非常了解卷積神經(jīng)網(wǎng)絡(luò)(CNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)及其變體。想要明白這些,你需要對深度學(xué)習(xí)的基礎(chǔ)知識有所了解,CNN/RNN 是如何工作的,目前存在哪些架構(gòu),以及這些架構(gòu)改進(jìn)背后的動機(jī)都是什么。在這一方面,我們沒有捷徑——必須花時(shí)間了解它們。對于 CNN,我推薦斯坦福大學(xué)的 CS231N 課程,RNN 推薦 CS224N 課程。
Hugo Larochelle 的神經(jīng)網(wǎng)絡(luò)課程也很有意思,適合快速上手;
走出校門后,你的職業(yè)生涯將是一個(gè)自我實(shí)現(xiàn)的漫長過程。希望這篇文章能給你帶來一些啟發(fā),并幫助你以更好的方式為下一次數(shù)據(jù)科學(xué)面試做好準(zhǔn)備。
原文作者:Aman Dalmia
原文選自:Medium
編譯:機(jī)器之心
譯文地址:微信公眾號“機(jī)器之心”(ID:almosthuman2014)?
本文由 @機(jī)器之心 授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。
題圖來自 Pixabay,基于 CC0 協(xié)議
- 目前還沒評論,等你發(fā)揮!