來(lái)源:微科技
我們不禁好奇,為什么是OpenAI這樣名不見(jiàn)經(jīng)傳的小公司,而不是谷歌這種大公司創(chuàng)造了ChatGPT?OpenAI有何獨(dú)特的工作方法論?
(資料圖)
目前國(guó)內(nèi)大模型創(chuàng)業(yè)如火如荼,但不得不承認(rèn),各家產(chǎn)品與ChatGPT-4相比還有很大差距,為什么在技術(shù)創(chuàng)新方面我們總是慢人一步?
為此,商隱社專訪了肯尼斯·斯坦利(Kenneth Stanley),他此前在OpenAI領(lǐng)導(dǎo)了一個(gè)開(kāi)放式研究小組。在此之前,他是中佛羅里達(dá)大學(xué)計(jì)算機(jī)科學(xué)專業(yè)的教授。
通過(guò)這次對(duì)話,我們得以窺見(jiàn)OpenAI崛起的底層邏輯。這些思維方式不僅關(guān)乎人工智能創(chuàng)新,也關(guān)乎我們?nèi)绾螕碛懈杂傻娜松?/p>
以下文字根據(jù)我們與肯尼斯·斯坦利教授的談話內(nèi)容,以及他的新書(shū)《為什么偉大不能被計(jì)劃》整理而成。
一、放棄對(duì)目標(biāo)的神話
或許你該升個(gè)職、跳個(gè)槽、減減肥、找個(gè)對(duì)象、賺個(gè)幾百萬(wàn)、買個(gè)房子。
上述社會(huì)追求的背后,存在這樣一個(gè)設(shè)想:任何值得追求的社會(huì)成就,最好先將其設(shè)定為目標(biāo),再堅(jiān)定不移地朝著這個(gè)目標(biāo)努力。
這不禁讓人發(fā)問(wèn):這世界上是否存在不需要設(shè)定目標(biāo)就能完成的事情?
縱觀大部分行業(yè),答案似乎是“沒(méi)有”。
我們已經(jīng)太習(xí)慣于通過(guò)“目標(biāo)”來(lái)界定所有的努力,甚至忘了我們可以去質(zhì)疑目標(biāo)的價(jià)值。
目標(biāo)提供了一種安全感,當(dāng)我們感到迷惘時(shí),機(jī)械地逐步推進(jìn)目標(biāo),起碼可以讓我們擁有一種固定且可靠的生活。
因?yàn)椤霸O(shè)定目標(biāo)”這一行為本身,暗含著一種可能性假設(shè):只要你用心去做,便有可能事成。只要目標(biāo)明確,努力和付出必有回報(bào)。
某些時(shí)候,目標(biāo)確實(shí)能為我們提供生活的意義或方向。但它同樣限制了我們的自由,成為禁錮我們探索欲望的牢籠。
我們常常因過(guò)分執(zhí)迷于目標(biāo)而錯(cuò)失良多。目標(biāo)論導(dǎo)致我們只關(guān)注終點(diǎn)的收獲,而忽視了每一條探索道路本身的特殊性和獨(dú)特性價(jià)值。
我們的世界充斥著為了獲得成功而設(shè)置的各種目標(biāo),這使我們的生活變得機(jī)械化,壓抑了我們的生活熱情。
但事實(shí)上,若想實(shí)現(xiàn)更多所謂的豐功偉業(yè),目標(biāo)往往會(huì)成為絆腳石,比如與探索發(fā)現(xiàn)、創(chuàng)造力、發(fā)明或創(chuàng)新,或者找到真正的幸福。
這是因?yàn)?,如果將我們所做的每件事,看作?shí)現(xiàn)一個(gè)或另一個(gè)目標(biāo)的踏腳石,那么探索任何復(fù)雜問(wèn)題的過(guò)程都將是充斥無(wú)數(shù)欺騙性的踏腳石。
欺騙性往往是目標(biāo)不能帶來(lái)偉大成就的關(guān)鍵原因。如果目標(biāo)具有欺騙性,那么設(shè)定目標(biāo),并以此為努力方向的做法對(duì)實(shí)現(xiàn)目標(biāo)沒(méi)有什么幫助。
因此,實(shí)現(xiàn)遠(yuǎn)大目標(biāo)的最佳方式就是放棄對(duì)目標(biāo)的神話,進(jìn)而忽略目標(biāo)。
聽(tīng)起來(lái)不可思議,但OpenAI確實(shí)如此。這家公司成立的前15個(gè)月,都沒(méi)有一個(gè)明確的研究目標(biāo)。
2016年5月,時(shí)任谷歌首席AI研究員參觀OpenAI,對(duì)其工作方式相當(dāng)困惑。他詢問(wèn)OpenAI的目標(biāo)是什么,沒(méi)想到難倒了OpenAI:“我們現(xiàn)在的目標(biāo),就是....做點(diǎn)好事。”
然而數(shù)月之后,這位研究員卻毅然辭職加入了OpenAI,他想一起做點(diǎn)好事。
二、尋找一塊可能成功的踏腳石
放棄目標(biāo)的困難之處在于,意味著放棄“存在正確道路”的想法。但如果目的地本就不存在,那么所謂的正確道路也不應(yīng)該存在。
其實(shí),改變世界的神奇公式并不存在。偉大的成就并沒(méi)有所謂的成功腳本,它們往往沒(méi)有經(jīng)過(guò)周密的計(jì)劃便誕生。
通往成功的踏腳石,往往是未知的。因此,當(dāng)進(jìn)入一個(gè)充滿不確定性的世界時(shí),對(duì)未知的機(jī)會(huì)秉持開(kāi)放和靈活的態(tài)度,有時(shí)候比明確地知道自己要做什么更重要。
所有人都應(yīng)該開(kāi)始尋找可能通往成功的踏腳石,且無(wú)需事先設(shè)定任何特定的終點(diǎn)。
你必須先找到一塊正確的踏腳石來(lái)站穩(wěn)腳跟,再加上足夠的運(yùn)氣和頭腦,才有可能發(fā)現(xiàn)通向目標(biāo)的道路。
在AI研究的眾多方向中,AGI(通用人工智能),便是OpenAI找到的一塊踏腳石。
所謂AGI,即“超級(jí)智能”,接近科幻電影中萬(wàn)能的人工智能。與之形成對(duì)比的是人臉識(shí)別、翻譯、下圍棋等只能完成單一任務(wù)的人工智能。
但以那時(shí)候的科研基礎(chǔ)而言,談?wù)揂GI,就像談?wù)撊绾伍L(zhǎng)生不老一樣荒謬。
科學(xué)家all in AGI,賭贏,可以在教科書(shū)里比肩牛頓;賭輸,則成為美版知乎Quaro的民科代表。
但企業(yè)all in AGI,大概率會(huì)成為先烈。龐大的資本支出,讓無(wú)論是相信“專家算法”的IBM,還是“深度學(xué)習(xí)”的谷歌、百度,巨頭們的一切AI研究,都為產(chǎn)業(yè)化服務(wù)。
愿意成為這個(gè)冤大頭的,只有OpenAI一家。
很多時(shí)候,盲目地堅(jiān)持最初的目標(biāo)并不會(huì)帶來(lái)偉大的成就。恰恰因?yàn)閹?lái)最偉大成果的踏腳石是未知的,所以不試圖尋找特定的東西,往往會(huì)帶來(lái)最令人興奮的發(fā)現(xiàn)。
踏腳石不一定意味著通往最終的目的地,它自身也無(wú)關(guān)對(duì)錯(cuò),只涉及探索的過(guò)程和無(wú)限的可能性。
我們需要接受的現(xiàn)實(shí)是:很多事情,是無(wú)法單純地通過(guò)努力實(shí)現(xiàn)的。
只有在明確的目標(biāo)被忽視、探索的韁繩被徹底松開(kāi)時(shí),我們才有可能征服最遙遠(yuǎn)的未知邊界。
三、順著有趣和新奇的方向前進(jìn)
事實(shí)上,與其追求某個(gè)最終目標(biāo),不如轉(zhuǎn)而尋求新奇的事物。因?yàn)楹笳叩幕貓?bào),將是一連串的、無(wú)窮無(wú)盡的踏腳石,即一項(xiàng)新奇事物的產(chǎn)生,將帶來(lái)更多的新奇事物。
這樣一來(lái),未來(lái)就不再是某個(gè)特定的終點(diǎn),而是一條沒(méi)有盡頭、未被定義、潛力無(wú)限的道路。
新奇事物的重要性在于,它們往往可以成為踏腳石探測(cè)器,因?yàn)槿魏涡缕娴臇|西,都是催生更新奇事物的潛在踏腳石。
換句話說(shuō),新奇性是識(shí)別趣味性的一條“簡(jiǎn)單粗暴”的捷徑,而有趣的想法往往能夠開(kāi)辟全新的可能性。
新奇有趣的想法不僅遠(yuǎn)非微不足道,而且往往還會(huì)帶來(lái)新的思維方式,進(jìn)而觸發(fā)更偉大的創(chuàng)新和發(fā)現(xiàn)。
更重要的一點(diǎn)是,通過(guò)不斷地使新事物成為可能,新奇性以及趣味性能隨著時(shí)間的推移產(chǎn)生聚合效應(yīng)。
但追逐新奇性往往意味著一種漫無(wú)目的的不確定性,我們又該怎么知道要去哪里?
這其實(shí)就是關(guān)鍵所在。最偉大的創(chuàng)新過(guò)程之所以會(huì)成功,正是因?yàn)樗鼈儾⒉辉噲D去往任何特定的地方。
按照這個(gè)邏輯,我們需要放棄目標(biāo)帶來(lái)的虛假安全感,轉(zhuǎn)而去擁抱未知的、瘋狂的可能性。
當(dāng)然,我們?nèi)匀挥欣碛蓳?dān)心,這種對(duì)新奇性的探索令人不踏實(shí),甚至可能有點(diǎn)聽(tīng)天由命。
但事實(shí)并非如此。新奇性的概念不要求我們依賴一個(gè)具有欺騙性的指南針,只要求我們將當(dāng)前的位置與過(guò)去進(jìn)行比較。
與其擔(dān)心我們不知道要去什么地方,不如將我們現(xiàn)在所處的位置,與我們?cè)?jīng)到過(guò)的位置進(jìn)行比較。
與未來(lái)不同的是,過(guò)去不存在模糊性或欺騙性。這種比較不會(huì)讓我們判斷自己朝向目標(biāo)的進(jìn)展如何,但可以讓我們判斷在多大程度上擺脫了過(guò)去事物的束縛。
這種比較將問(wèn)題從“我們正在接近什么”,變成“我們正在逃離什么”。
而逃離過(guò)去的有趣之處在于,它能夠開(kāi)啟全新的可能性。
雖然人類的直覺(jué)和預(yù)感往往促使我們朝著沒(méi)有任何目標(biāo)的方向前行,但我們最終依然能發(fā)現(xiàn)一些與眾不同或有趣的東西。
因此,在討論新奇性時(shí),趣味性的概念會(huì)自然而然地出現(xiàn),這并不是巧合。當(dāng)一個(gè)想法真正讓人感到新奇時(shí),它就足以讓我們產(chǎn)生好奇心。
如果我們選擇了一條有趣的道路,它可能會(huì)通往重要的目的地,盡管我們可能并不知道這個(gè)目的地確切在哪里。
鮮有人知的是,在OpenAI不斷迭代升級(jí)的過(guò)程中,電子游戲也曾發(fā)揮過(guò)舉足輕重的作用。
早期的OpenAI 曾在2019年打造出名為OpenAI Five的游戲AI,并成功擊敗了兩屆DOTA2國(guó)際邀請(qǐng)賽的世界冠軍OG戰(zhàn)隊(duì)。
這并非不務(wù)正業(yè)。
盡管當(dāng)時(shí)的人工智能已經(jīng)在“聽(tīng)、說(shuō)、看”等方面取得了一定突破,而且基于強(qiáng)化學(xué)習(xí)的Alpha Go也剛剛擊敗了人類圍棋世界冠軍。
但在OpenAI團(tuán)隊(duì)看來(lái),這些突破依舊沒(méi)有跳出“弱人工智能”的范疇,并不具備理解問(wèn)題和解決問(wèn)題的能力。
OpenAI團(tuán)隊(duì)認(rèn)為,要想讓人工智能具備這種能力,就必須將其置于更為廣泛和復(fù)雜的環(huán)境中進(jìn)行訓(xùn)練,這樣才能讓人工智能發(fā)展出可以有效遷移復(fù)用的知識(shí)和解決問(wèn)題的策略,而電子游戲就是這個(gè)“訓(xùn)練環(huán)境”的絕佳選擇。
而以規(guī)則復(fù)雜、要素眾多、環(huán)境多變,同時(shí)也是全球擁有超高人氣的電子游戲DOTA 2,順理成章地成為了OpenAI的首選。
正如OpenAI團(tuán)隊(duì)所言:“相比標(biāo)準(zhǔn)的開(kāi)發(fā)環(huán)境,DOTA 2顯得更加有趣,也更加困難。但是,如果一個(gè)AI能在像DOTA這樣復(fù)雜的游戲里超越人類,那這個(gè)AI本身就是一個(gè)里程碑?!?/p>
相較于AI之前在國(guó)際象棋和圍棋里取得的成就,像DOTA 2這類復(fù)雜的游戲能更好地捕捉現(xiàn)實(shí)世界中的混亂和連續(xù)性,使其訓(xùn)練出的AI能夠擁有更好的通用性,從而更有可能應(yīng)用于游戲之外的人類社會(huì)。
最終,OpenAI在DOTA 2上的嘗試,為AI強(qiáng)化學(xué)習(xí)效率提升提供了方向,這些都成為了ChatGPT的養(yǎng)分。
可以說(shuō),正是OpenAI團(tuán)隊(duì)順著有趣的方向探索,才獲得了ChatGPT這樣創(chuàng)新的產(chǎn)品。
許多參與ChatGPT 創(chuàng)立的人并沒(méi)有想到它會(huì)成為一個(gè)世界性的產(chǎn)品,引起如此大規(guī)模的反應(yīng)。相反,他們只是覺(jué)得聊天很有趣,因?yàn)榱奶焓且环N很自然地與智能進(jìn)行交互的方式。所以這不是計(jì)劃好的,純粹是一個(gè)意外。
但這并不等于說(shuō)“偉大的發(fā)現(xiàn)都來(lái)自偶然”。這種說(shuō)法的謬誤之處在于將偶然性看成一種意外。
如果偶然性發(fā)現(xiàn)純屬意外事件,那就意味著沒(méi)有任何特殊的教育背景或智力水平的人,也能夠得出同樣的發(fā)現(xiàn)。
我們或許會(huì)假設(shè),凌亂無(wú)序或瘋狂甚至是開(kāi)啟偉大發(fā)現(xiàn)之旅的最佳方式。但在現(xiàn)實(shí)世界中,情況似乎并非如此。
大多數(shù)重大的偶然性發(fā)現(xiàn),都不是外行人的瘋狂想法推動(dòng)的。事實(shí)上,這些偉大的發(fā)現(xiàn),大多數(shù)都出自智力超群、受過(guò)良好教育,且在各自行業(yè)內(nèi)頗有建樹(shù)的人之手。
在任何偶然性發(fā)現(xiàn)的背后,幾乎總有一位心態(tài)開(kāi)放的思想家,他們對(duì)怎樣會(huì)產(chǎn)生最有趣的結(jié)果往往有著強(qiáng)烈的直覺(jué)。
歸根結(jié)底,我們必須獲得某種知識(shí),才能繼續(xù)創(chuàng)造新奇事物,這就意味著新奇性探索是一種信息收集器,用于不斷積累關(guān)于世界的知識(shí)。
探索的時(shí)間越長(zhǎng),最終積累的信息越多,就越容易創(chuàng)新。
四、成為一個(gè)尋寶者
創(chuàng)新并非少數(shù)人的專利。對(duì)許多人來(lái)說(shuō),創(chuàng)新是可能的,因?yàn)槲覀兌加胁煌I(lǐng)域的經(jīng)驗(yàn),在任何你有經(jīng)驗(yàn)的領(lǐng)域,你都可以創(chuàng)新。例如,你會(huì)找到一種創(chuàng)新的方式來(lái)裝飾你的家。
然而,不是每個(gè)人都需要或者應(yīng)該創(chuàng)新。人們應(yīng)該做他們想做的事情。如果你喜歡安全的適度的目標(biāo),過(guò)著沒(méi)有風(fēng)險(xiǎn)的生活,那也可以是一種美好的生活。
如果你更喜歡探險(xiǎn)冒險(xiǎn)和不確定的目標(biāo),那也是一條合理的道路,只要你接受它可能走不通的風(fēng)險(xiǎn)。簡(jiǎn)而言之,就個(gè)人而言,每個(gè)人應(yīng)該有選擇自己喜歡的道路的自由。
對(duì)于后者而言,我們需要從目標(biāo)的“一招鮮,吃遍天”的虛妄幻想中解放出來(lái),繼而擁抱現(xiàn)實(shí),讓自己成為一名擁有“即便沒(méi)有目標(biāo),也能發(fā)現(xiàn)意外之喜”這種強(qiáng)大能力的“尋寶者”。
在漫無(wú)目標(biāo)的新奇性探索中,你不一定能找到心中想要的寶藏,反而可能發(fā)現(xiàn)許多意料之外的寶藏,這將使整個(gè)過(guò)程充滿驚喜。
本質(zhì)上,尋寶者又可以說(shuō)是秉持機(jī)會(huì)主義的探險(xiǎn)家,他們致力于尋找任何有價(jià)值的東西,而不在乎這些東西具體是什么。
要想成為一名合格的尋寶者,我們就必須盡可能多地積累踏腳石,因?yàn)槲覀冇肋h(yuǎn)不知道哪塊踏腳石可能通往有價(jià)值的地方。
也就是說(shuō),我們需要保持多樣化的思維。因?yàn)橐恍囊灰獾刈非竽硞€(gè)特定目標(biāo)太有欺騙性,所以我們應(yīng)該盡可能保留不同選擇的可能性,以防一開(kāi)始看起來(lái)最靠譜的路徑,到后來(lái)反而行不通。
這種看法聽(tīng)起來(lái)或許很悲哀,因?yàn)槿祟悰](méi)有關(guān)于未來(lái)的確切指南針。我們?yōu)閯?chuàng)造確定性和有目標(biāo)的努力所做的一切,都可能是徒勞無(wú)功的。
但我們完全不必失望,也許探索和發(fā)現(xiàn)本身就不應(yīng)該專注于具體的目標(biāo),而是應(yīng)著眼于一些更偉大的東西。
很反常識(shí)的一點(diǎn)是,達(dá)成共識(shí)并不是尋寶者的工作方式。有時(shí)候通往創(chuàng)造性想法的最佳路徑,就是遵循個(gè)人喜好,而無(wú)需任何共識(shí)和目標(biāo)。
事實(shí)上,沒(méi)人能對(duì)2022年ChatGPT的爆發(fā)胸有成竹。過(guò)去5年,30多名中高層離開(kāi)OpenAI,各自開(kāi)辟AI創(chuàng)業(yè)項(xiàng)目。
他們的創(chuàng)業(yè)項(xiàng)目清單里,囊括了語(yǔ)言理解、計(jì)算機(jī)視覺(jué)、視覺(jué)搜索引擎、計(jì)算機(jī)任務(wù)自動(dòng)化、太空技術(shù)、人工智能安全等AI各個(gè)領(lǐng)域,既包括AI大模型的底層技術(shù),也有中間層和具體的應(yīng)用層。
這無(wú)疑都是推動(dòng)AI發(fā)展的有益探索。
OpenAI創(chuàng)始人薩姆·阿爾特曼曾篤定地表示:在公司內(nèi)部,即使是管理層,也不一定有工程師了解這個(gè)300多人的團(tuán)隊(duì)。
OpenAI作為平臺(tái)給這些工程師提供充分的自由和自信,包括他們?cè)陔x開(kāi)公司后獨(dú)立創(chuàng)業(yè),也得益于OpenAI長(zhǎng)期形成的公司文化。
OpenAI內(nèi)部研究小組之間的“不團(tuán)結(jié)”,有時(shí)候反而可以推動(dòng)進(jìn)步。這樣一來(lái),“不團(tuán)結(jié)”的力量,可以幫助更好地組織科學(xué)探索和其他創(chuàng)造性的工作。
五、總結(jié)
當(dāng)探索的目的地變得未知,我們必須放下對(duì)最終目的地的執(zhí)念。
這就是“踏腳石原則”,即一個(gè)好的想法會(huì)帶來(lái)另一個(gè)好的想法;一處寶藏會(huì)指向更多的寶藏,在可能發(fā)現(xiàn)的無(wú)限的踏腳石上,形成源源不斷的連鎖和分支。因此,你需要做的,就是成為一個(gè)熟練的尋寶者。
如果你想成為一名行事無(wú)須設(shè)置特定目標(biāo)的尋寶者,那么就要遵循一種特殊的線索,即當(dāng)某些東西讓你感覺(jué)有趣時(shí),尋寶的旅程就可以開(kāi)啟。
“踏腳石原則”反映在工作中,就是讓我們更有信心跟隨自己的直覺(jué),僅僅是因?yàn)樗鼈兛雌饋?lái)很有趣,即使不確定回報(bào)會(huì)是什么。
實(shí)際上,目標(biāo)驅(qū)動(dòng)的公司往往因?yàn)樵趲啄陜?nèi)沒(méi)有推出創(chuàng)新的產(chǎn)品而萎靡不振。在人工智能的商業(yè)化領(lǐng)域,充斥著不少雄心勃勃的公司,它們最后不得不降低自己的期望值。還有很多公司陷入到了爭(zhēng)分奪秒的軍備競(jìng)賽中,數(shù)據(jù)積累和技術(shù)耐心成為難以避免的犧牲品。
成功的人往往會(huì)問(wèn)的是——我們能夠從這里走到哪里,而不是我們?nèi)绾文軌虻诌_(dá)遙遠(yuǎn)的那里。他們并沒(méi)有將精力浪費(fèi)在遙遠(yuǎn)而宏偉的愿景上,而是專注于當(dāng)前可能發(fā)生的前沿事件。
根據(jù)當(dāng)前所處的位置,決定應(yīng)該去哪里,往往比根據(jù)想要去哪里,來(lái)決定前進(jìn)的方向要更明智。
本文來(lái)自微信公眾號(hào):商隱社 (ID:shangyinshecj),采訪及整理:阿空,對(duì)話嘉賓:肯尼斯·斯坦利
關(guān)鍵詞:
國(guó)家發(fā)改委等部門(mén):賦予民營(yíng)企業(yè)職稱評(píng)審權(quán),允許技術(shù)實(shí)力較強(qiáng)的規(guī)模以上民營(yíng)企業(yè)單獨(dú)或聯(lián)合組建職稱評(píng)審委員會(huì),開(kāi)展自主評(píng)審
金融界8月1日消息,國(guó)家發(fā)展改革委等部門(mén)發(fā)布關(guān)于實(shí)施促進(jìn)民營(yíng)經(jīng)濟(jì)發(fā)展
慶“八一”主題共建活動(dòng)開(kāi)展
日前,和平區(qū)總工會(huì)勞模協(xié)會(huì)組織勞動(dòng)模范及部分社區(qū)學(xué)生來(lái)到武警天津市
《精忠報(bào)國(guó)》2023特別版,致敬人民軍隊(duì)
“我是家園的盾牌,愿做祖國(guó)鋒利的長(zhǎng)矛?!卑艘唤ㄜ姽?jié),一曲特別版《精
女足世界杯丨綜合消息:澳大利亞奇跡大勝 日本威震西班牙
新華社澳大利亞阿德萊德7月31日電(記者樹(shù)文、肖世堯、岳東興)澳大利
法眼|民企內(nèi)部人背信損企肥私,如何設(shè)置入刑門(mén)檻?
民營(yíng)企業(yè)工作人員背信“損企肥私”,亦將遭受刑罰。正在向社會(huì)征求意見(jiàn)
關(guān)于我們 加入我們 聯(lián)系我們 商務(wù)合作 粵ICP備2022077823號(hào)
創(chuàng)氪網(wǎng) www.www.and1marketing.com 版權(quán)所有 技術(shù)支持:廣州中創(chuàng)互聯(lián)網(wǎng)信息服務(wù)有限公司
投稿投訴聯(lián)系郵箱:317 493 128 @qq.com