原標(biāo)題:今天的“非共識”探索可能會(huì)成為未來引領(lǐng)性技術(shù) 真正的AGI或?qū)⒄Q生于大語言模型外
在驚喜與擔(dān)憂之間,人們正學(xué)著接納和擁抱人工智能(AI),惴惴不安地揣測著通用人工智能(AGI)何時(shí)到來。然而,在業(yè)內(nèi)專家看來,作為本輪AI熱潮的主角,大語言模型還只是一個(gè)探路者,離真正的AGI仍相距甚遠(yuǎn),甚至根本不是通達(dá)AGI的正途。
昨天開幕的首屆浦江AI學(xué)術(shù)年會(huì)“非共識研究與創(chuàng)新”專題論壇上,專家表示,在大語言模型及其尺度定律(Scaling Law)之外,人工智能還有著廣闊的發(fā)展空間。
大模型能找到“自己的DNA”嗎
“如果在兩年前,我會(huì)堅(jiān)定地參加主流共識的論壇討論,而我現(xiàn)在卻更想探討‘非共識’!毕愀壑形拇髮W(xué)副教授、上海人工智能實(shí)驗(yàn)室領(lǐng)軍科學(xué)家成宇提到,如今風(fēng)生水起的機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò),在幾十年前都屬于非主流研究,今天的“非共識”探索,或許會(huì)成為未來一飛沖天的引領(lǐng)性技術(shù)。他相信,純靠數(shù)據(jù)“喂養(yǎng)”,現(xiàn)今大模型的智能水平不可能再提升一個(gè)級別,“我們一定需要探索新的編碼結(jié)構(gòu)”。
經(jīng)濟(jì)學(xué)中,菲利普斯曲線發(fā)現(xiàn)了通脹率和失業(yè)率之間的關(guān)聯(lián)性,然而當(dāng)它不斷被修正后,反而不再被各國制定政策時(shí)參考采信。而生命科學(xué)中的孟德爾遺傳定律,至今仍發(fā)揮著重要作用。
同樣源于大量數(shù)據(jù),為何這兩條“經(jīng)驗(yàn)性”理論會(huì)走向截然不同的結(jié)局?上海財(cái)經(jīng)大學(xué)助理教授滕佳燁認(rèn)為,一個(gè)理論的形成要經(jīng)歷“從數(shù)據(jù)中來—普適性驗(yàn)證—完善理論—普適性實(shí)踐”四步,上述兩條理論正是在第三步分道揚(yáng)鑣——DNA的發(fā)現(xiàn)使孟德爾遺傳定律找到了更根本而堅(jiān)實(shí)的基礎(chǔ)。
目前,來源于神經(jīng)網(wǎng)絡(luò)模型的尺度定律,為大語言模型奠定了基礎(chǔ)!叭绻鼙荛_不斷被修正、直到面目全非的陷阱,像孟德爾定律一樣找到‘自己的DNA’,未來將可能在更多地方開枝散葉!彪褵钫J(rèn)為,目前尺度理論只是在Transformer模型上獲得了成功,探討其適用邊界,即它在何時(shí)成立,也是一個(gè)極有意義的課題。
下一代AI離不開“腦啟發(fā)”
能耗過高、推理不行、智力欠缺……盡管大語言模型展現(xiàn)了空前強(qiáng)大的機(jī)器智能,卻仍被AI專家各種“鄙夷”,究其根本,是因?yàn)橛腥四X智能這種完美的存在。
與人腦相比,目前AI的“性價(jià)比”實(shí)在欠佳。中國科學(xué)院自動(dòng)化研究所研究員李國齊說,人腦中神經(jīng)元也就千億級別,功耗不過20瓦,而現(xiàn)在大語言模型的參數(shù)規(guī)模已經(jīng)萬倍于這個(gè)數(shù)量,耗能更是超出人腦,但其所實(shí)現(xiàn)的智能水平遠(yuǎn)不及人腦!斑@說明,人腦一定有可借鑒之處!
例如,神經(jīng)元雖然數(shù)量有限,但每個(gè)細(xì)胞內(nèi)部卻有豐富的動(dòng)力學(xué)結(jié)構(gòu)——如果用機(jī)器神經(jīng)元模擬,需要用到幾十個(gè)、上百個(gè)常微分方程。李國齊認(rèn)為,目前大語言模型的每個(gè)單元都非常單一,“大模型的外部規(guī)模不可能無限擴(kuò)大,或許增加每個(gè)單元的內(nèi)生復(fù)雜性,將會(huì)是大幅提升AI性能、降低總體能耗的一條重要路徑”。
在清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系副教授崔鵬看來,目前的大語言模型只是在數(shù)據(jù)與算力上“摸天花板”,而AI智力的天花板在何處,尚未觸及!皩W(xué)術(shù)界應(yīng)為AI探索更聰明的學(xué)習(xí)方式,比如機(jī)器智能是否有更強(qiáng)的舉一反三能力,能否用更少的數(shù)據(jù)達(dá)到更高的智力水平!贝搦i認(rèn)為,人類對自身的智能產(chǎn)生過程還知之甚少,AI發(fā)展之路還相當(dāng)漫長。
北京大學(xué)人工智能研究院陳寶權(quán)教授則對機(jī)器智能抱有相當(dāng)?shù)木次分!叭说纳邢,而機(jī)器壽命無限,這意味其知識可以不斷積累”。同時(shí),未來量子計(jì)算加持下的AI智能將如何發(fā)展,或許完全超出想象。
多模態(tài)“解鎖”具身智能復(fù)雜動(dòng)作
多模態(tài)與跨具身智能,同樣是“非共識”前沿探討的熱門話題。
“大模型也會(huì)有‘右利手’‘左撇子’,我們想通過平衡訓(xùn)練實(shí)現(xiàn)‘雙手并用’,從而更充分地利用數(shù)據(jù)!敝袊嗣翊髮W(xué)副教授胡迪發(fā)現(xiàn),當(dāng)同時(shí)訓(xùn)練不同模態(tài)的兩個(gè)模型時(shí),一個(gè)會(huì)越來越占優(yōu)勢,用到更多數(shù)據(jù),而另一個(gè)則會(huì)偏弱。于是,他帶領(lǐng)團(tuán)隊(duì)探索出一套平衡策略,讓兩個(gè)模型能夠均衡發(fā)展,結(jié)果發(fā)現(xiàn)其合作的結(jié)果可使整體效能更強(qiáng)大。
在此基礎(chǔ)上,胡迪團(tuán)隊(duì)將這一成果用于多模態(tài)AI模型。例如,通過視覺、聲音、觸覺的多種模態(tài)智能模型的合作,讓機(jī)械臂完成往杯子里注水的動(dòng)作。他們驚喜地發(fā)現(xiàn),機(jī)器人學(xué)會(huì)了在不同階段調(diào)用不同模態(tài)信息,來控制動(dòng)作。“用多模態(tài)控制復(fù)雜動(dòng)作,過去在具身智能中并不受關(guān)注,但未來可能發(fā)揮重要作用!焙险f。
“人形機(jī)器人雖然更容易復(fù)制人類行為,但其硬件成本高、電機(jī)力矩不足,很難完全模擬人手的功能。”即將赴新加坡國立大學(xué)任教的劉星昱正在研究如何通過跨具身形態(tài)的策略遷移,將人手與機(jī)械手在機(jī)械結(jié)構(gòu)上盡可能實(shí)現(xiàn)統(tǒng)一。
“人形機(jī)器人會(huì)后空翻,卻從未演示過攀巖,這是因?yàn)槭茈姍C(jī)部件限制,它們的仿真手無法像真正的人手那樣發(fā)力。”劉星昱通過一系列的微調(diào)策略,根據(jù)需要將人手“變形”到目標(biāo)機(jī)械手,這樣就能得到算法簡潔、可擴(kuò)展性強(qiáng)、適用于不同任務(wù)、不同機(jī)器人的仿真手,讓機(jī)械人既方便制造與控制,又能實(shí)現(xiàn)更強(qiáng)功能。
(本報(bào)記者 許琦敏 《文匯報(bào)》2024-12-14 )