“Coursera 成立的初衷并不是為了改變線下教育的現(xiàn)狀,而是為了解決高等教育的延續(xù)性的問題?!卑俣仁紫茖W家 Andrew Ng說道,本篇文章還將介紹他對在線教育的愿景,對未來大數(shù)據(jù)和深度學習的看法。
編者按:在去采訪 Andrew 的路上,心里特別的沒底氣??倱淖约簾o法和學術大牛高智商怪獸級別的人物順暢溝通,在前一天晚上還嘗試看了一遍 Andrew 關于COTS HPC 系統(tǒng)論文... 的摘要部分。但另一方面又有種異樣的親切感,終于可以在 Coursera 教學視頻外,與現(xiàn)實生活中的 Prof. Ng 交流。Andrew 身上的有著斯坦福教授,Google 大腦創(chuàng)始人,百度首席科學家等等各種光環(huán),但是在光環(huán)的背后,我看到是其實是一個親切,謙遜,有著篤定信念的學者,一個甚為可愛的丈夫。Andrew 總是能保持著對未知事物的好奇心,在采訪前拿著我的米 3 把玩了很久;Andrew 講話聲音不大,給人娓娓道來的平靜感;下面,我們就來和 Andrew 一起,聊聊他對在線教育的愿景,聊聊他作為百度首席科學家,對未來大數(shù)據(jù)和深度學習的看法。
Q:Coursera 如今是在線教育全球性的品牌, 超過 700 萬的注冊用戶和 12 種語言的課程教學。有著科學 / 工程背景的人都傾向于規(guī)?;厝ソ鉀Q一個問題。所以當年成立 Coursera 的使命是為了更好的規(guī)模化地提供在線教育體驗(scale up online education experience),還是要通過科技改變線下教育的現(xiàn)狀呢(shake up the status quo of offline education)?
A:Coursera成立的初衷并不是為了改變線下教育的現(xiàn)狀,而是為了解決高等教育的延續(xù)性的問題。從 2007 年開始,我和我的團隊成員都在嘗試不同的在線教育體驗,譬如早期的OpenClassroom。我們一直想要做的都是可以讓所有人都獲得免費的高等教育資源,但是并不是要取代線下教育。線下教育可以有很好的及時交互(instant interaction),線上教育更多的是點播式的(on demand)。線下教育對學生的深度理解和啟發(fā)是線上教育無法取代的,線上教育的靈活性也是線下教育無法取代的。所以二者更多的是一種互補關系而非競爭關系,我們的團隊也從來沒有考慮過要改變甚至取代線下教育體驗。
Q:但是我們注意到了 Rick 作為耶魯大學任期最長的校長加盟 Coursera,人們不可避免地會聯(lián)想到,這是不是 Coursera 要向傳統(tǒng)高等教育市場進軍一個信號?畢竟如今美國社會最需要顛覆的,一個是醫(yī)療市場,另一個就是教育市場。如今美國高等教育平均學費(私立大學)約 4.5 萬一年,基本和美國中產(chǎn)家庭年收入相當。在高昂的學費壓力下,顛覆傳統(tǒng)高等教育難道不是 Coursera 未來的方向么?
A:顛覆傳統(tǒng)高等教育并不是我們的目的。首先,大學本科的教育我個人覺得非常重要,而且是在線教育無法取代的,至少現(xiàn)在的技術還沒有達到那個程度。假設你被加州理工大學錄取,同時加州理工提供本科在線教育,你在糾結選擇哪一個,我會毫無疑問建議你去傳統(tǒng)的線下大學教育而不是線上。其次,我們的定位不是18 到 21 歲的目標人群,我們要做的是解決高等教育延續(xù)性的問題。Coursera 的平均用戶年齡是 35 歲,并且 75% 的用戶已經(jīng)擁有學士學位。我們認為高等基礎教育是無法取代的,在有了線下高等教育基礎后,對于那些需要繼續(xù)學習或者擴展知識面的專業(yè)人士,Coursera 上的課程才是更好的選擇。所以我們更多定位是在高等再教育或者研究生課程,因此在 Coursera 上的課程一般專業(yè)性的要求都相對要高。我們這樣做的目的是,對于所有的像你和我這樣的職業(yè)從業(yè)者,我們需要繼續(xù)學習保持競爭力,但是我們沒有整塊的時間或者條件去大學課堂進行再教育,這個時候 Coursera 就是一個很好的選擇。
Q:如今有了 Rick 的加入,Andrew 你會繼續(xù)為 Coursera 發(fā)展添磚加瓦么?
A:那是當然的。首先我成立了 Coursera,出于一個很簡單的想法。而且我在 Coursera 上教課,我是 Coursera 上 800 多位教授的其中一員。我比任何人都希望未來 Cousera 能做的更好,未來我也會不遺余力地為 Coursera 的發(fā)展做貢獻的。
Q:能和我們聊聊對硅谷最近幾年炙手可熱的大數(shù)據(jù)浪潮有什么看法么? “大數(shù)據(jù)” 是在 2011 年之后開始有了指數(shù)增長的關注度,我甚至覺得這個標簽已經(jīng)是被過度濫用了,因為大數(shù)據(jù)太泛且太不明確(too broad and too undefined)。有無數(shù)公司有了自己的 Hadoop 集群,就號稱自己是大數(shù)據(jù)企業(yè),或者隨便一個什么和機器學習沾邊的產(chǎn)品,都號稱自己是大數(shù)據(jù)產(chǎn)品,你對這個 " 大數(shù)據(jù) " 現(xiàn)象怎么看?你覺得真正的大數(shù)據(jù)產(chǎn)品應該是如何定義呢?
上圖為 Big Data 在 Google 的搜索熱度趨勢
A:“大數(shù)據(jù)”是在兩種趨勢的發(fā)展下催生的產(chǎn)物。第一個趨勢隨著我們進入數(shù)字化社會,我們越來越多的行為是在數(shù)字世界中進行的,隨之而來是大量數(shù)據(jù)的產(chǎn)生,特別是由人們行為產(chǎn)生的機器數(shù)據(jù)(Machine generated data as a result of human behavior)。第二個趨勢是數(shù)據(jù)存儲以及計算的成本降低讓我們有能力去存儲和處理這些數(shù)據(jù)。百度在北京的大數(shù)據(jù)實驗室做的就是如何能在同一時間計算 / 處理更多的數(shù)據(jù)量,并且使用這些數(shù)據(jù)去做更好的預測。我認為所有可以有效利用這種海量數(shù)據(jù)進行預測和功能優(yōu)化的產(chǎn)品,都是大數(shù)據(jù)產(chǎn)品。
Q:很多人說到大數(shù)據(jù)都會自動和 Hadoop 聯(lián)系起來,但是 Hadoop 只是大數(shù)據(jù)基礎架構的一種(infrastructure)。在大數(shù)據(jù)的應用層面上你認為未來可能的突破點會有哪些呢?
A:我們現(xiàn)在在百度的策略,是先把基礎建設以及算法層面的技術難點攻破,然后再去考慮有什么可以產(chǎn)品化的應用。產(chǎn)品不是難點,技術瓶頸一旦突破產(chǎn)品化是分分鐘鐘的事情。有許多商業(yè)化的應用,譬如電子商務里的圖像識別,都是因為技術層面的精準度達不到要求而無法很好的進行應用。雖然我們在探索一些可能可以產(chǎn)品化的應用,但是我們現(xiàn)在沒有任何可以對外公布的產(chǎn)品。譬如圖像識別,語音識別,深度學習和人工智能,這些都是基礎層面的技術需要我們進一步去加強和改進,只有基礎層面的技術成熟了之后,我們才能進行應用層面的選擇和開發(fā)。譬如當年我在 Google Brain,我們團隊也是利用我們的深度學習技術大大改善了 Google Now 語音識別的表現(xiàn)。其他應用還有譬如 Google Keep,這些都是產(chǎn)品化的例子。
Q:關于人工智能,許多人都覺得是一門非常深奧且科幻的學科。我很好奇你當年是如何選擇了人工智能這個研究方向,因為很有可能這個領域在你有生之年都沒有重大突破,也許在 50 年后這個領域和你設想的 1% 都沒有達到,那么是什么動力驅動你在人工智能領域不斷前行呢?
A:其實我的想法很簡單,就是如果能讓計算機聰明些,那么人類社會的潛力是無窮大的。人工智能其實早已在我們?nèi)粘I钪杏辛藦V泛的應用,不是只有科幻電影里的那些才叫人工智能。譬如最簡單的數(shù)碼相機的笑臉捕捉,那個就是人工智能。還有電子商務里的推薦引擎,那個也是人工智能。還有電子郵件,如果沒有 spam filter,估計電子郵件完全就成了垃圾信箱,這也是人工智能的功勞。這些都是讓計算機變的更聰明,從而改變?nèi)祟惿畹睦印_€有許多應用的現(xiàn)階段瓶頸就是人工智能,譬如農(nóng)業(yè)上的自動化收割,我要摘櫻桃,怎么分辨好的和不好的?這個就是計算機視覺可以解決的問題。但是現(xiàn)在人工智能還有很長的路要走才能達到實現(xiàn)這些應用的高度。我早年花了很大的精力在解決人工智能硬件層面的架構問題,現(xiàn)在是時候進一步提高技術的可用性了。
Q:我們很多人都想知道,為什么是百度。硅谷這么多企業(yè),為什么最終選擇了百度呢?
A:硅谷確實有很多在這個領域做的很好的企業(yè),但是百度的優(yōu)勢不僅僅是在于他的資源,技術側重點,更多是在于它的強大的執(zhí)行力(Baidu is unusual in different aspects, and it‘s not just its resources, focus, but also the nimbleness to excute)。百度作為一個如此大的企業(yè),對于科技的強大執(zhí)行力是讓我非常吃驚的。我在百度的好朋友余凱(余凱為百度深度學習研究院常務副院長),決定要在百度建 GPU 集群,執(zhí)行速度快的出乎我的意料。這種執(zhí)行力在許多大企業(yè)來說非常難得的。百度一個最大的優(yōu)勢就在于,對于想法的快速迭代和產(chǎn)品化。我知道中國國內(nèi)對百度,騰訊和阿里巴巴的評價,許多人覺得百度近幾年甚少創(chuàng)新。但是很多技術創(chuàng)新并不是用戶可見的,特別是對于人工智能或者深度學習這種后端技術。某個算法精準度提高了 1%,用戶不會有切身的體驗。百度的強項絕對是在于后端技術,這個是著眼未來 10 年,甚至 20 年的布局,并非短期內(nèi)的效益。科技這個東西很有意思,往往最好的技術都是不可見的(the best technology is always invisible)。如果有人說這幾年百度什么都沒有做,那我看到的完全不是這樣。另外你要知道,核心技術是非常難,門檻非常高的一項資產(chǎn),而且非常難被模仿復制或者超越,這些都是百度在技術端的優(yōu)勢所在。我覺得我加入百度,能最好地為人工智能事業(yè)做貢獻,百度有強大的執(zhí)行力,技術支撐,以及人工智能研究所需的大量數(shù)據(jù)和資本,綜合這些因素,百度是我最好的選擇。
?。ˋndrew 這個時候看了看手表,滿臉歉意的對著我說 “I really have to take off at 6 o‘clock. I have been late for home everyday and I promise my wife will be home early today”. 老婆大人在家等,果然是比神馬都重要啊!于是我們下面邊走邊閑聊了一下 Andrew 的婚后生活,經(jīng) Andrew 同意可以和大家一起分享~)
簡單介紹一下 Andrew 的妻子 Carol Reiley. Carol 是約翰·霍普金斯大學的醫(yī)學博士以及在讀計算機博士,研究方向是生物醫(yī)學方向的機器人應用。Andrew 結婚這事兒還上了 IEEE 主頁..."Robots Bring Couple Together"
Q:覺得已婚生活怎么樣?我們都很好奇兩個計算機科學家在家里都會討論什么樣的話題。
A:貌似從來沒有人問過我這個問題哈哈。我們的婚后生活很美好。很多人之前在我們約會的時候和我說,如果你已經(jīng)有了一個很穩(wěn)定的關系,結婚之后的生活不會有什么改變。但我個人覺得不是這么回事。我結婚以后,回到家見到 Carol," 這是我的妻子 ",這種感覺非常溫暖。
Q:你們是更互補呢?還是更相似?你們在家是不是也繼續(xù)在討論機器學習的學術問題,感覺是一個非常學術的家庭呢。
上圖為 Carol Reiley 在 MAKE 雜志的封面
A:我們幾乎無所不談,學術性的,社會性的,各種話題。我們更多的是討論很多高層面的東西,譬如科技未來發(fā)展的趨勢,機器人應用策略等,實現(xiàn)細節(jié)不會怎么聊。其實有時候很酷,我一回家發(fā)現(xiàn) Carol 在家里經(jīng)常會折騰些她做的小玩意,各種各樣瘋狂的機器人設備,或者在網(wǎng)上買的某個新型傳感器,有些東西也讓我大開眼界。她有次還登上了 MAKE 雜志的主頁,是個女超人的形象,把我樂壞了(上圖)。我們平時周末最好的休閑時光就是一起去一家安靜的咖啡館,在那里閱讀,工作。"Carol is a wonderful woman"