“Coursera 成立的初衷并不是為了改變線下教育的現(xiàn)狀,而是為了解決高等教育的延續(xù)性的問(wèn)題?!卑俣仁紫茖W(xué)家 Andrew Ng說(shuō)道,本篇文章還將介紹他對(duì)在線教育的愿景,對(duì)未來(lái)大數(shù)據(jù)和深度學(xué)習(xí)的看法。
編者按:在去采訪 Andrew 的路上,心里特別的沒(méi)底氣。總擔(dān)心自己無(wú)法和學(xué)術(shù)大牛高智商怪獸級(jí)別的人物順暢溝通,在前一天晚上還嘗試看了一遍 Andrew 關(guān)于COTS HPC 系統(tǒng)論文... 的摘要部分。但另一方面又有種異樣的親切感,終于可以在 Coursera 教學(xué)視頻外,與現(xiàn)實(shí)生活中的 Prof. Ng 交流。Andrew 身上的有著斯坦福教授,Google 大腦創(chuàng)始人,百度首席科學(xué)家等等各種光環(huán),但是在光環(huán)的背后,我看到是其實(shí)是一個(gè)親切,謙遜,有著篤定信念的學(xué)者,一個(gè)甚為可愛(ài)的丈夫。Andrew 總是能保持著對(duì)未知事物的好奇心,在采訪前拿著我的米 3 把玩了很久;Andrew 講話聲音不大,給人娓娓道來(lái)的平靜感;下面,我們就來(lái)和 Andrew 一起,聊聊他對(duì)在線教育的愿景,聊聊他作為百度首席科學(xué)家,對(duì)未來(lái)大數(shù)據(jù)和深度學(xué)習(xí)的看法。
Q:Coursera 如今是在線教育全球性的品牌, 超過(guò) 700 萬(wàn)的注冊(cè)用戶和 12 種語(yǔ)言的課程教學(xué)。有著科學(xué) / 工程背景的人都傾向于規(guī)?;厝ソ鉀Q一個(gè)問(wèn)題。所以當(dāng)年成立 Coursera 的使命是為了更好的規(guī)?;靥峁┰诰€教育體驗(yàn)(scale up online education experience),還是要通過(guò)科技改變線下教育的現(xiàn)狀呢(shake up the status quo of offline education)?
A:Coursera成立的初衷并不是為了改變線下教育的現(xiàn)狀,而是為了解決高等教育的延續(xù)性的問(wèn)題。從 2007 年開(kāi)始,我和我的團(tuán)隊(duì)成員都在嘗試不同的在線教育體驗(yàn),譬如早期的OpenClassroom。我們一直想要做的都是可以讓所有人都獲得免費(fèi)的高等教育資源,但是并不是要取代線下教育。線下教育可以有很好的及時(shí)交互(instant interaction),線上教育更多的是點(diǎn)播式的(on demand)。線下教育對(duì)學(xué)生的深度理解和啟發(fā)是線上教育無(wú)法取代的,線上教育的靈活性也是線下教育無(wú)法取代的。所以二者更多的是一種互補(bǔ)關(guān)系而非競(jìng)爭(zhēng)關(guān)系,我們的團(tuán)隊(duì)也從來(lái)沒(méi)有考慮過(guò)要改變甚至取代線下教育體驗(yàn)。
Q:但是我們注意到了 Rick 作為耶魯大學(xué)任期最長(zhǎng)的校長(zhǎng)加盟 Coursera,人們不可避免地會(huì)聯(lián)想到,這是不是 Coursera 要向傳統(tǒng)高等教育市場(chǎng)進(jìn)軍一個(gè)信號(hào)?畢竟如今美國(guó)社會(huì)最需要顛覆的,一個(gè)是醫(yī)療市場(chǎng),另一個(gè)就是教育市場(chǎng)。如今美國(guó)高等教育平均學(xué)費(fèi)(私立大學(xué))約 4.5 萬(wàn)一年,基本和美國(guó)中產(chǎn)家庭年收入相當(dāng)。在高昂的學(xué)費(fèi)壓力下,顛覆傳統(tǒng)高等教育難道不是 Coursera 未來(lái)的方向么?
A:顛覆傳統(tǒng)高等教育并不是我們的目的。首先,大學(xué)本科的教育我個(gè)人覺(jué)得非常重要,而且是在線教育無(wú)法取代的,至少現(xiàn)在的技術(shù)還沒(méi)有達(dá)到那個(gè)程度。假設(shè)你被加州理工大學(xué)錄取,同時(shí)加州理工提供本科在線教育,你在糾結(jié)選擇哪一個(gè),我會(huì)毫無(wú)疑問(wèn)建議你去傳統(tǒng)的線下大學(xué)教育而不是線上。其次,我們的定位不是18 到 21 歲的目標(biāo)人群,我們要做的是解決高等教育延續(xù)性的問(wèn)題。Coursera 的平均用戶年齡是 35 歲,并且 75% 的用戶已經(jīng)擁有學(xué)士學(xué)位。我們認(rèn)為高等基礎(chǔ)教育是無(wú)法取代的,在有了線下高等教育基礎(chǔ)后,對(duì)于那些需要繼續(xù)學(xué)習(xí)或者擴(kuò)展知識(shí)面的專業(yè)人士,Coursera 上的課程才是更好的選擇。所以我們更多定位是在高等再教育或者研究生課程,因此在 Coursera 上的課程一般專業(yè)性的要求都相對(duì)要高。我們這樣做的目的是,對(duì)于所有的像你和我這樣的職業(yè)從業(yè)者,我們需要繼續(xù)學(xué)習(xí)保持競(jìng)爭(zhēng)力,但是我們沒(méi)有整塊的時(shí)間或者條件去大學(xué)課堂進(jìn)行再教育,這個(gè)時(shí)候 Coursera 就是一個(gè)很好的選擇。
Q:如今有了 Rick 的加入,Andrew 你會(huì)繼續(xù)為 Coursera 發(fā)展添磚加瓦么?
A:那是當(dāng)然的。首先我成立了 Coursera,出于一個(gè)很簡(jiǎn)單的想法。而且我在 Coursera 上教課,我是 Coursera 上 800 多位教授的其中一員。我比任何人都希望未來(lái) Cousera 能做的更好,未來(lái)我也會(huì)不遺余力地為 Coursera 的發(fā)展做貢獻(xiàn)的。
Q:能和我們聊聊對(duì)硅谷最近幾年炙手可熱的大數(shù)據(jù)浪潮有什么看法么? “大數(shù)據(jù)” 是在 2011 年之后開(kāi)始有了指數(shù)增長(zhǎng)的關(guān)注度,我甚至覺(jué)得這個(gè)標(biāo)簽已經(jīng)是被過(guò)度濫用了,因?yàn)榇髷?shù)據(jù)太泛且太不明確(too broad and too undefined)。有無(wú)數(shù)公司有了自己的 Hadoop 集群,就號(hào)稱自己是大數(shù)據(jù)企業(yè),或者隨便一個(gè)什么和機(jī)器學(xué)習(xí)沾邊的產(chǎn)品,都號(hào)稱自己是大數(shù)據(jù)產(chǎn)品,你對(duì)這個(gè) " 大數(shù)據(jù) " 現(xiàn)象怎么看?你覺(jué)得真正的大數(shù)據(jù)產(chǎn)品應(yīng)該是如何定義呢?
上圖為 Big Data 在 Google 的搜索熱度趨勢(shì)
A:“大數(shù)據(jù)”是在兩種趨勢(shì)的發(fā)展下催生的產(chǎn)物。第一個(gè)趨勢(shì)隨著我們進(jìn)入數(shù)字化社會(huì),我們?cè)絹?lái)越多的行為是在數(shù)字世界中進(jìn)行的,隨之而來(lái)是大量數(shù)據(jù)的產(chǎn)生,特別是由人們行為產(chǎn)生的機(jī)器數(shù)據(jù)(Machine generated data as a result of human behavior)。第二個(gè)趨勢(shì)是數(shù)據(jù)存儲(chǔ)以及計(jì)算的成本降低讓我們有能力去存儲(chǔ)和處理這些數(shù)據(jù)。百度在北京的大數(shù)據(jù)實(shí)驗(yàn)室做的就是如何能在同一時(shí)間計(jì)算 / 處理更多的數(shù)據(jù)量,并且使用這些數(shù)據(jù)去做更好的預(yù)測(cè)。我認(rèn)為所有可以有效利用這種海量數(shù)據(jù)進(jìn)行預(yù)測(cè)和功能優(yōu)化的產(chǎn)品,都是大數(shù)據(jù)產(chǎn)品。
Q:很多人說(shuō)到大數(shù)據(jù)都會(huì)自動(dòng)和 Hadoop 聯(lián)系起來(lái),但是 Hadoop 只是大數(shù)據(jù)基礎(chǔ)架構(gòu)的一種(infrastructure)。在大數(shù)據(jù)的應(yīng)用層面上你認(rèn)為未來(lái)可能的突破點(diǎn)會(huì)有哪些呢?
A:我們現(xiàn)在在百度的策略,是先把基礎(chǔ)建設(shè)以及算法層面的技術(shù)難點(diǎn)攻破,然后再去考慮有什么可以產(chǎn)品化的應(yīng)用。產(chǎn)品不是難點(diǎn),技術(shù)瓶頸一旦突破產(chǎn)品化是分分鐘鐘的事情。有許多商業(yè)化的應(yīng)用,譬如電子商務(wù)里的圖像識(shí)別,都是因?yàn)榧夹g(shù)層面的精準(zhǔn)度達(dá)不到要求而無(wú)法很好的進(jìn)行應(yīng)用。雖然我們?cè)谔剿饕恍┛赡芸梢援a(chǎn)品化的應(yīng)用,但是我們現(xiàn)在沒(méi)有任何可以對(duì)外公布的產(chǎn)品。譬如圖像識(shí)別,語(yǔ)音識(shí)別,深度學(xué)習(xí)和人工智能,這些都是基礎(chǔ)層面的技術(shù)需要我們進(jìn)一步去加強(qiáng)和改進(jìn),只有基礎(chǔ)層面的技術(shù)成熟了之后,我們才能進(jìn)行應(yīng)用層面的選擇和開(kāi)發(fā)。譬如當(dāng)年我在 Google Brain,我們團(tuán)隊(duì)也是利用我們的深度學(xué)習(xí)技術(shù)大大改善了 Google Now 語(yǔ)音識(shí)別的表現(xiàn)。其他應(yīng)用還有譬如 Google Keep,這些都是產(chǎn)品化的例子。
Q:關(guān)于人工智能,許多人都覺(jué)得是一門非常深?yuàn)W且科幻的學(xué)科。我很好奇你當(dāng)年是如何選擇了人工智能這個(gè)研究方向,因?yàn)楹苡锌赡苓@個(gè)領(lǐng)域在你有生之年都沒(méi)有重大突破,也許在 50 年后這個(gè)領(lǐng)域和你設(shè)想的 1% 都沒(méi)有達(dá)到,那么是什么動(dòng)力驅(qū)動(dòng)你在人工智能領(lǐng)域不斷前行呢?
A:其實(shí)我的想法很簡(jiǎn)單,就是如果能讓計(jì)算機(jī)聰明些,那么人類社會(huì)的潛力是無(wú)窮大的。人工智能其實(shí)早已在我們?nèi)粘I钪杏辛藦V泛的應(yīng)用,不是只有科幻電影里的那些才叫人工智能。譬如最簡(jiǎn)單的數(shù)碼相機(jī)的笑臉捕捉,那個(gè)就是人工智能。還有電子商務(wù)里的推薦引擎,那個(gè)也是人工智能。還有電子郵件,如果沒(méi)有 spam filter,估計(jì)電子郵件完全就成了垃圾信箱,這也是人工智能的功勞。這些都是讓計(jì)算機(jī)變的更聰明,從而改變?nèi)祟惿畹睦?。還有許多應(yīng)用的現(xiàn)階段瓶頸就是人工智能,譬如農(nóng)業(yè)上的自動(dòng)化收割,我要摘櫻桃,怎么分辨好的和不好的?這個(gè)就是計(jì)算機(jī)視覺(jué)可以解決的問(wèn)題。但是現(xiàn)在人工智能還有很長(zhǎng)的路要走才能達(dá)到實(shí)現(xiàn)這些應(yīng)用的高度。我早年花了很大的精力在解決人工智能硬件層面的架構(gòu)問(wèn)題,現(xiàn)在是時(shí)候進(jìn)一步提高技術(shù)的可用性了。
Q:我們很多人都想知道,為什么是百度。硅谷這么多企業(yè),為什么最終選擇了百度呢?
A:硅谷確實(shí)有很多在這個(gè)領(lǐng)域做的很好的企業(yè),但是百度的優(yōu)勢(shì)不僅僅是在于他的資源,技術(shù)側(cè)重點(diǎn),更多是在于它的強(qiáng)大的執(zhí)行力(Baidu is unusual in different aspects, and it‘s not just its resources, focus, but also the nimbleness to excute)。百度作為一個(gè)如此大的企業(yè),對(duì)于科技的強(qiáng)大執(zhí)行力是讓我非常吃驚的。我在百度的好朋友余凱(余凱為百度深度學(xué)習(xí)研究院常務(wù)副院長(zhǎng)),決定要在百度建 GPU 集群,執(zhí)行速度快的出乎我的意料。這種執(zhí)行力在許多大企業(yè)來(lái)說(shuō)非常難得的。百度一個(gè)最大的優(yōu)勢(shì)就在于,對(duì)于想法的快速迭代和產(chǎn)品化。我知道中國(guó)國(guó)內(nèi)對(duì)百度,騰訊和阿里巴巴的評(píng)價(jià),許多人覺(jué)得百度近幾年甚少創(chuàng)新。但是很多技術(shù)創(chuàng)新并不是用戶可見(jiàn)的,特別是對(duì)于人工智能或者深度學(xué)習(xí)這種后端技術(shù)。某個(gè)算法精準(zhǔn)度提高了 1%,用戶不會(huì)有切身的體驗(yàn)。百度的強(qiáng)項(xiàng)絕對(duì)是在于后端技術(shù),這個(gè)是著眼未來(lái) 10 年,甚至 20 年的布局,并非短期內(nèi)的效益??萍歼@個(gè)東西很有意思,往往最好的技術(shù)都是不可見(jiàn)的(the best technology is always invisible)。如果有人說(shuō)這幾年百度什么都沒(méi)有做,那我看到的完全不是這樣。另外你要知道,核心技術(shù)是非常難,門檻非常高的一項(xiàng)資產(chǎn),而且非常難被模仿復(fù)制或者超越,這些都是百度在技術(shù)端的優(yōu)勢(shì)所在。我覺(jué)得我加入百度,能最好地為人工智能事業(yè)做貢獻(xiàn),百度有強(qiáng)大的執(zhí)行力,技術(shù)支撐,以及人工智能研究所需的大量數(shù)據(jù)和資本,綜合這些因素,百度是我最好的選擇。
?。ˋndrew 這個(gè)時(shí)候看了看手表,滿臉歉意的對(duì)著我說(shuō) “I really have to take off at 6 o‘clock. I have been late for home everyday and I promise my wife will be home early today”. 老婆大人在家等,果然是比神馬都重要啊!于是我們下面邊走邊閑聊了一下 Andrew 的婚后生活,經(jīng) Andrew 同意可以和大家一起分享~)
簡(jiǎn)單介紹一下 Andrew 的妻子 Carol Reiley. Carol 是約翰·霍普金斯大學(xué)的醫(yī)學(xué)博士以及在讀計(jì)算機(jī)博士,研究方向是生物醫(yī)學(xué)方向的機(jī)器人應(yīng)用。Andrew 結(jié)婚這事兒還上了 IEEE 主頁(yè)..."Robots Bring Couple Together"
Q:覺(jué)得已婚生活怎么樣?我們都很好奇兩個(gè)計(jì)算機(jī)科學(xué)家在家里都會(huì)討論什么樣的話題。
A:貌似從來(lái)沒(méi)有人問(wèn)過(guò)我這個(gè)問(wèn)題哈哈。我們的婚后生活很美好。很多人之前在我們約會(huì)的時(shí)候和我說(shuō),如果你已經(jīng)有了一個(gè)很穩(wěn)定的關(guān)系,結(jié)婚之后的生活不會(huì)有什么改變。但我個(gè)人覺(jué)得不是這么回事。我結(jié)婚以后,回到家見(jiàn)到 Carol," 這是我的妻子 ",這種感覺(jué)非常溫暖。
Q:你們是更互補(bǔ)呢?還是更相似?你們?cè)诩沂遣皇且怖^續(xù)在討論機(jī)器學(xué)習(xí)的學(xué)術(shù)問(wèn)題,感覺(jué)是一個(gè)非常學(xué)術(shù)的家庭呢。
上圖為 Carol Reiley 在 MAKE 雜志的封面
A:我們幾乎無(wú)所不談,學(xué)術(shù)性的,社會(huì)性的,各種話題。我們更多的是討論很多高層面的東西,譬如科技未來(lái)發(fā)展的趨勢(shì),機(jī)器人應(yīng)用策略等,實(shí)現(xiàn)細(xì)節(jié)不會(huì)怎么聊。其實(shí)有時(shí)候很酷,我一回家發(fā)現(xiàn) Carol 在家里經(jīng)常會(huì)折騰些她做的小玩意,各種各樣瘋狂的機(jī)器人設(shè)備,或者在網(wǎng)上買的某個(gè)新型傳感器,有些東西也讓我大開(kāi)眼界。她有次還登上了 MAKE 雜志的主頁(yè),是個(gè)女超人的形象,把我樂(lè)壞了(上圖)。我們平時(shí)周末最好的休閑時(shí)光就是一起去一家安靜的咖啡館,在那里閱讀,工作。"Carol is a wonderful woman"