記者 周丹旎
最近,OpenAI推出的文生視頻大模型Sora引爆全網(wǎng),因其模擬逼真場景的強大能力,被視為“顛覆性”的存在。
作為一名持續(xù)追蹤人工智能技術(shù)演進的人文社科學(xué)者,華東政法大學(xué)人工智能與大數(shù)據(jù)指數(shù)研究院院長高奇琦在接受記者采訪時表示,自己對此“并不是太意外”。他認為,未來人工智能發(fā)展速度會越來越快,通用人工智能大突破的時代可能會大大提前,這是無可阻擋的大趨勢。技術(shù)狂飆突進之下,當(dāng)務(wù)之急是盡快形成全球共識,使技術(shù)發(fā)展在一定規(guī)則之下運行,使其符合人類社會的整體利益。
“世界模擬器”令人震撼
記者:ChatGPT和Sora兩款大模型產(chǎn)品,有何區(qū)別與內(nèi)在關(guān)聯(lián)?
高奇琦:從ChatGPT到Sora,是一個從單一文本到文本、圖片、音頻、視頻多模態(tài)進階的過程。
雖然形態(tài)上有區(qū)別,但其本質(zhì)都是通用人工智能拼圖中的一部分,是實現(xiàn)通用人工智能前的一些小目標(biāo),具有內(nèi)在連貫性。OpenAI接下來可能會把這幾個項目結(jié)合起來,實現(xiàn)文字、圖片、音頻和視頻的多模態(tài)交互。
記者:Sora被稱作“世界模擬器”。相比去年的ChatGPT,Sora帶來的震撼和沖擊似乎更為劇烈,這是為什么?
高奇琦:Sora讓人耳目一新,是因為它做的事情是比較難的。它能生成60秒的長視頻,而同類競品Pika和Runway只能生成幾秒或十幾秒。我們?nèi)粘I钪?,可能覺得60秒的視頻算短的。但是對AI模型來說,越長就越涉及高度復(fù)雜的細節(jié),考驗它對真實物理世界的理解能力。
為什么說它是“世界模擬器”?因為它需要理解畫面當(dāng)中出現(xiàn)的東西代表了什么,以及它們在現(xiàn)實世界中運行的規(guī)律。舉個例子,自動駕駛為什么長期突破不了,離不開人的干預(yù)?根本原因就在于機器不理解這個世界,不理解圖像中實體和實體之間的關(guān)系,以及實體之間關(guān)系所代表的現(xiàn)實意義——這向來是人的能力。但是今天的Sora能理解了,可以做出一些推理和判斷了,這是它的震撼所在。
顛覆性創(chuàng)新會越來越多
記者:有人將Sora視為走向通用人工智能的重要里程碑,您怎么看?
高奇琦:所謂通用人工智能,簡單地講,就是可以像人類一樣完成幾乎所有任務(wù)。過去的人工智能如AlphaGo,只能完成專用任務(wù),充其量只能算弱人工智能、窄人工智能。而Sora理解世界的精準(zhǔn)度、承擔(dān)任務(wù)的復(fù)雜度,雖然還沒有完全達到人的水平,但已經(jīng)非常高了,可以說相當(dāng)接近通用人工智能了。
毋庸置疑,Sora讓我們看到,通用人工智能大突破的時代可能會大大提前。
記者:毫無疑問,人工智能技術(shù)正在加速度發(fā)展。未來,類似Sora這樣顛覆傳統(tǒng)認知的技術(shù)創(chuàng)新,是否會越來越多?所謂的人工智能奇點真的會來嗎?
高奇琦:一個不爭的事實是,人工智能體的發(fā)展速度會越來越快,未來出現(xiàn)任何新的顛覆性創(chuàng)新,我可能都不會太吃驚。
所謂的人工智能奇點,是雷·庫茲韋爾提出的,可以理解為機器智能超越人類智能的一種可能性。如果放在十年前,很多人可能覺得這一天還很遙遠,許多專家把這個時間周期定在50—100年。ChatGPT誕生后,人們認為這個周期可能要縮短到5—20年。今天Sora來了,更多人意識到,通用人工智能無限接近甚至超越人類,可能不再是“天方夜譚”。
深度神經(jīng)網(wǎng)絡(luò)提出者、圖靈獎獲得者杰弗里·辛頓在接受媒體采訪時就多次說過,過去他覺得談?wù)撨@一天還“為時過早”,但現(xiàn)在不這么認為了,“我們應(yīng)該認真考慮如何阻止這些東西對我們的控制”。
警惕“知識泡沫”的沖擊
記者:新興技術(shù)的發(fā)展同時帶來“創(chuàng)造性的破壞”。具體來說,以Sora為代表的技術(shù),將給人類社會帶來哪些潛在風(fēng)險和挑戰(zhàn)?
高奇琦:技術(shù)本身是與社會緊密聯(lián)系在一起的。以ChatGPT、Sora等為代表的通用大模型技術(shù),其潛在的失業(yè)、失序和失控效應(yīng),可能會對人類社會產(chǎn)生很大沖擊。
一是失業(yè)。在工業(yè)化發(fā)展過程中,也會不斷出現(xiàn)結(jié)構(gòu)性失業(yè),但人們通過技能再培訓(xùn)往往就能獲得新工作崗位。然而,通用大模型技術(shù)所產(chǎn)生的替代效應(yīng)針對的是知識類工作者。人類歷史之前的經(jīng)驗表明,知識類工作是相對可靠、穩(wěn)定和受到保障的,但大模型技術(shù)會給內(nèi)容創(chuàng)作相關(guān)的職業(yè)帶來巨大沖擊。
二是失序。通用大模型技術(shù)會打破傳統(tǒng)的知識秩序,大量的人工智能生成物進入人們的現(xiàn)實世界,會沖擊人類傳統(tǒng)的知識創(chuàng)造。人們可能很難再相信“真相”,因為所有的信息都可以被虛擬制造。這種“知識泡沫”的巨大沖擊會將人類社會傳統(tǒng)的知識秩序完全打破,而人類社會的其他重要秩序(如政治秩序、經(jīng)濟秩序等)都是建立在知識秩序基礎(chǔ)之上的。
三是失控。Sora還未正式向公眾開放,但此前的GPT-4已經(jīng)表現(xiàn)出部分失控的特征,例如機器會帶有某種情緒性,表現(xiàn)出某些類人意識的特征。我們需要未雨綢繆,為人工智能體發(fā)展設(shè)定一整套全新的規(guī)制框架。
科技是非常復(fù)雜的雙刃劍
記者:人工智能技術(shù)加速迭代演進,該如何展開科學(xué)治理?
高奇琦:必須承認,沒有人能夠阻止技術(shù)的進步??萍际且话逊浅?fù)雜的雙刃劍,如果社會制度的演進速度嚴重落后于技術(shù)的變革速度,那么新技術(shù)就有可能引起社會的一系列不良反應(yīng)。為了使技術(shù)的發(fā)展符合人類社會的整體利益,需要對其進行相應(yīng)限制,并使其在一定的規(guī)則之中運行。
從企業(yè)角度說,由于相關(guān)技術(shù)開發(fā)會產(chǎn)生巨大而廣泛的社會效應(yīng),OpenAI需要承擔(dān)起相應(yīng)的社會責(zé)任,比如開放相關(guān)的技術(shù)細節(jié)。
從政府角度說,要將社會各個部門整體動員起來以建立一種新的規(guī)則。例如,針對龐雜的人工智能生成物,建立一系列知識創(chuàng)新規(guī)則,在一定程度上保障其知識產(chǎn)權(quán),避免知識的無序狀態(tài),并在創(chuàng)新過程中產(chǎn)生新的秩序。
從全球來看,主要國家需要盡快在大模型技術(shù)發(fā)展問題上形成共識。各國可以設(shè)立一些試驗區(qū),充分觀察這些技術(shù)可能產(chǎn)生的破壞性效應(yīng),并盡可能將破壞性效應(yīng)降到最低。國際組織也需要將OpenAI這一類頭部企業(yè)的社會責(zé)任履行和信息技術(shù)細節(jié)公開等列為重要治理議題。
人工智能技術(shù)狂飆突進的當(dāng)下,巨大的社會轉(zhuǎn)型才剛剛開始。我喜歡把人工智能發(fā)展與核能利用作類比:核能的特點是在瞬間產(chǎn)生巨大的能量,和平利用核能的關(guān)鍵是調(diào)控核能輸出的速度,將核能爆炸產(chǎn)生的巨大能量緩慢地輸出,這樣就能使核能產(chǎn)生的巨大能量為人類社會服務(wù)。我想,可以將這樣的思維引入到人工智能發(fā)展的過程當(dāng)中,最終導(dǎo)向人類理想的未來。