我有一個(gè)好想法,就差一個(gè) AI 了
今天我特別想跟大家分享一下,人工智能產(chǎn)品在「演進(jìn)」上的一些體會(huì)。
人工智能產(chǎn)品一個(gè)核心特點(diǎn)就是「演進(jìn)」。也就是說(shuō)「你很難一下子達(dá)到那個(gè)地方」,這可能是與傳統(tǒng)的互聯(lián)網(wǎng)產(chǎn)品很不一樣的地方。
互聯(lián)網(wǎng)已經(jīng)存在很多年了,在產(chǎn)品經(jīng)理的人才積累上大概已經(jīng)過(guò) 10 萬(wàn)的數(shù)量級(jí)了吧。對(duì)比國(guó)內(nèi)人工智能的導(dǎo)師儲(chǔ)備也不過(guò)數(shù)百人,國(guó)內(nèi)人工智能相關(guān)專業(yè)出來(lái)的研究生可以估算不會(huì)太多。這里面又有多少會(huì)成為人工智能工程師呢?而人工智能產(chǎn)品經(jīng)理就更少了。
所以,在中國(guó)現(xiàn)在做人工智能的產(chǎn)品,跟我們以前做互聯(lián)網(wǎng)的產(chǎn)品很不一樣。單從人才供給來(lái)說(shuō),無(wú)論是產(chǎn)品經(jīng)理、工程師,還是往上一層的架構(gòu)層面的人,都只是傳統(tǒng)互聯(lián)網(wǎng) 1/10 到 1/100 這樣的數(shù)量級(jí)。
工程領(lǐng)域有一個(gè)原則,任何系統(tǒng)的架構(gòu)你設(shè)計(jì)得再好,當(dāng)系統(tǒng)面對(duì)的問(wèn)題規(guī)模的數(shù)量級(jí)上升,或者下降,這個(gè)架構(gòu)就會(huì)出問(wèn)題。那么,我們互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)上的產(chǎn)品設(shè)計(jì)經(jīng)驗(yàn)是為過(guò)去的規(guī)模的問(wèn)題所設(shè)計(jì)的,我們現(xiàn)在碰到了新問(wèn)題,還可以用原來(lái)的方法來(lái)做嗎?我覺(jué)得肯定是不一樣的。今天就來(lái)探討幾個(gè)不一樣的地方。
現(xiàn)在很多人在談這種焦慮感——人工智能要顛覆這個(gè)、要顛覆那個(gè)。我昨天看到微軟 AI 負(fù)責(zé)人沈向陽(yáng)老師在說(shuō)計(jì)算機(jī)視覺(jué)識(shí)別系統(tǒng)要在 10 年之內(nèi)識(shí)別所有的東西。過(guò)去我們常說(shuō)「我有一個(gè)好想法,就缺一個(gè)程序員/產(chǎn)品經(jīng)理了」,今年大家都改口「我的想法就缺 AI 了」。
但人工智能對(duì)社會(huì)的顛覆其實(shí)還沒(méi)有發(fā)生,并且這個(gè)顛覆也是沒(méi)那么容易發(fā)生的。因?yàn)槿斯ぶ悄艿馁Y源是很稀缺的。稀缺資源造成現(xiàn)在組建一個(gè)人工智能團(tuán)隊(duì),就一個(gè)字——「貴」�,F(xiàn)在一個(gè)北清畢業(yè)的博士的入門價(jià)格 BAT 能給他開到 60萬(wàn)*。過(guò)去我有看過(guò)其他人的團(tuán)隊(duì)預(yù)算,十個(gè)人的機(jī)器學(xué)習(xí)團(tuán)隊(duì),初期需要投入上千萬(wàn)。由于人才的稀缺,決定了這個(gè)風(fēng)險(xiǎn)不但來(lái)自于業(yè)務(wù)更來(lái)自于團(tuán)隊(duì)本身,少了任何一個(gè)人都很填上這個(gè)坑。(編者注:具體數(shù)字有待考據(jù))
理解人工智能的局限性
其實(shí),目前的 AI 技術(shù)并不是那么靠譜,還是不成熟的。人工智能已經(jīng)經(jīng)歷了兩次大型 AI 寒冬了,小的冬天不計(jì)其數(shù),我就經(jīng)歷過(guò)其中兩次小寒冬(神經(jīng)網(wǎng)絡(luò)和語(yǔ)義網(wǎng))。這次的熱潮還會(huì)不會(huì)有冬天?有人說(shuō)不會(huì),但我已經(jīng)被咬兩次了,我不敢這么樂(lè)觀。
因?yàn)槿斯ぶ悄墁F(xiàn)在還是“人工智障 ”的成分居多。我們做產(chǎn)品,更多是從人工智障開始做的。
2000 年,我在MIT研究期間的導(dǎo)師 Tim Berners-Lee(注:英國(guó)計(jì)算機(jī)科學(xué)家、萬(wàn)維網(wǎng)的發(fā)明者,南安普頓大學(xué)與 MIT 教授) 曾告訴大家,未來(lái)會(huì)是語(yǔ)義網(wǎng)的。當(dāng)時(shí)實(shí)驗(yàn)室成果讓大家很樂(lè)觀地認(rèn)為可能 10 年之內(nèi)就能在消費(fèi)者領(lǐng)域?qū)崿F(xiàn)語(yǔ)義網(wǎng)。2001 年他在 《科學(xué)美國(guó)人》相關(guān)領(lǐng)域中的描述的產(chǎn)品就很像是 Siri,但當(dāng)我們做了 10 年以后,我們發(fā)現(xiàn)我們遠(yuǎn)遠(yuǎn)低估了這個(gè)開發(fā)難度�,F(xiàn)在 16 年過(guò)去了,我們還是沒(méi)有達(dá)到他描述的對(duì)話機(jī)器人的技術(shù)水準(zhǔn)。
編者注:語(yǔ)義網(wǎng)是對(duì)未來(lái)網(wǎng)絡(luò)的一個(gè)設(shè)想,現(xiàn)在與 Web 3.0 這一概念結(jié)合在一起,作為 3.0 網(wǎng)絡(luò)時(shí)代的特征之一。簡(jiǎn)單地說(shuō),語(yǔ)義網(wǎng)是一種智能網(wǎng)絡(luò),它不但能夠理解詞語(yǔ)和概念,而且還能夠理解它們之間的邏輯關(guān)系,可以使交流變得更有效率和價(jià)值。語(yǔ)義網(wǎng)核心是:通過(guò)給萬(wàn)維網(wǎng)上的文檔 (如:HTML文檔、XML文檔)添加能夠被計(jì)算機(jī)所理解的語(yǔ)義「元數(shù)據(jù)」(外語(yǔ):Meta data),從而使整個(gè)互聯(lián)網(wǎng)成為一個(gè)通用的信息交換媒介。
所以,我們今天看到的很多的事情,比如知識(shí)圖譜、深度學(xué)習(xí),從一開始的一個(gè)想法,到工程上、到產(chǎn)品上,最后落地到商業(yè)上是一個(gè)很漫長(zhǎng)的歷程,通常需要 30 到 40 年。所以當(dāng)我們看到一些實(shí)驗(yàn)性的成果,我們應(yīng)該把自己的興奮壓一壓,因?yàn)檫@中間有很多不靠譜的坑。
人工智能的技術(shù)瓶頸不是要代替智人作為動(dòng)物的那一部分,而在于代替我們最近幾千年發(fā)展起來(lái)的那些認(rèn)知能力,也就是我們有了符號(hào)思維能力之后的智能。在學(xué)術(shù)上體現(xiàn)在,深度學(xué)習(xí)這種算法在不同領(lǐng)域上起到的改變是不一樣的,它可以讓語(yǔ)音和圖像的識(shí)別能力前進(jìn)了一大步,但是在自然語(yǔ)言處理或是知識(shí)圖譜這方面的提高只有 1-2%。比如說(shuō),假設(shè)傳統(tǒng)的自然語(yǔ)言分詞算法可以達(dá)到 88% 的正確率,那么深度學(xué)習(xí)算法在準(zhǔn)確率上可能做到 89-90%。但是深度學(xué)習(xí)可以把視覺(jué)識(shí)別的準(zhǔn)確率提升了 10-20%。
為什么會(huì)有這種區(qū)別呢?
原因是「識(shí)別」這件事情是哺乳動(dòng)物的智能,不僅僅限于人類。你家的小貓小狗會(huì)識(shí)別出你跟別人不一樣。深度學(xué)習(xí)可以在這種自然能力的處理上有很不錯(cuò)的表現(xiàn)。但是語(yǔ)言和文字這種符號(hào)思考能力是近幾千年歷史上發(fā)展出來(lái)的,跟傳統(tǒng)的信號(hào)處理能力非常不一樣。
所以,現(xiàn)在的算法是有局限性的,我們?cè)跇?gòu)建人工智能系統(tǒng)的時(shí)候要理解它的局限性。
關(guān)注路徑,而非直奔目標(biāo)
移動(dòng)時(shí)代互聯(lián)網(wǎng)產(chǎn)品經(jīng)理培養(yǎng)的直覺(jué)是:剛需、極致。但是在人工智能領(lǐng)域,這樣直奔主題的直覺(jué)未必能成功。人工智能產(chǎn)品由于其復(fù)雜性,其設(shè)計(jì)核心是其中間路徑而非最終目標(biāo)。
我們移動(dòng)互聯(lián)網(wǎng)時(shí)代在制定項(xiàng)目的時(shí)候,常會(huì)先有一個(gè)明確的目標(biāo)。但是怎么完成一個(gè)項(xiàng)目不是由目標(biāo)所決定的,是路徑?jīng)Q定的。
一群老鼠開會(huì)要做風(fēng)控,貓來(lái)抓老鼠之前做一個(gè)預(yù)警。怎么做呢?大家定了一個(gè)明確的目標(biāo),在貓脖子上系鈴鐺。問(wèn)題是,哪只老鼠來(lái)做這件事呢?怎么做呢?
這就是路徑。
路徑有很多層含義。
別人的目標(biāo)不是你應(yīng)該效仿的終點(diǎn),別人的路徑更不是你要效仿的路徑。BAT 的終點(diǎn)不是你的終點(diǎn)。我剛開始創(chuàng)業(yè)的時(shí)候,特別喜歡看別的架構(gòu)師的那些架構(gòu),認(rèn)真地做筆記,但當(dāng)我開始認(rèn)真搭建自己項(xiàng)目的架構(gòu)時(shí),我還是不知道這個(gè)邏輯是什么,為什么這么搭。因?yàn)檎麄(gè)項(xiàng)目的演進(jìn)過(guò)程中,最重要的事情不是最終公布出來(lái)的那些,而是沒(méi)有被公布出來(lái)的。你最終學(xué)習(xí)到的都是一些切片,無(wú)論是他的終點(diǎn)、還是所謂的路徑,其實(shí)都是他 90% 預(yù)想的路徑被否定之后的一些切片。
榜單收錄、高管收錄、融資收錄、活動(dòng)收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報(bào)生成中...