《科學》刊文稱AI某些領(lǐng)域的核心研究一直停滯不前
人工智能核心創(chuàng)新觸及天花板?
“目前人工智能論文數(shù)量激增,泥沙俱下,導致部分論文質(zhì)量不高,但這并不能說明人工智能發(fā)展停滯不前,而是表明目前有更多的研究人員投入到了這個火熱的研究方向。”
最近幾年,在人工智能領(lǐng)域,從基礎(chǔ)算法到落地應用研究成果不斷涌現(xiàn),其中致力于人工智能落地的應用成果尤其突出,目前人工智能許多子領(lǐng)域的系統(tǒng)在性能上已經(jīng)滿足了具體應用場景的落地要求。
但這能說明人工智能領(lǐng)域的核心創(chuàng)新存在明顯進步嗎?近日,《科學》雜志刊登的一篇標題為《人工智能某些領(lǐng)域的核心進展一直停滯不前》的文章,對目前人工智能的研究成果提出了質(zhì)疑。作者馬修·赫特森指出,研究員聲稱的核心創(chuàng)新只是對原算法的微改進,新技術(shù)與多年前的舊算法在性能上相差不大。
近幾年人工智能領(lǐng)域快速發(fā)展,其應用場景不斷拓寬,為何該論文卻認為人工智能某些領(lǐng)域的核心進展停滯不前?當前人工智能的核心創(chuàng)新是否已經(jīng)觸及了“天花板”?就此,科技日報記者采訪了有關(guān)專家。
AI核心研究是否取得突破進展存爭議
具體來說,《科學》雜志上刊登的這篇文章指出的現(xiàn)象主要有哪些呢?
該文章引用了近期在神經(jīng)網(wǎng)絡推薦算法、對抗性訓練、自然語言模型等領(lǐng)域的批判性論文,指出這些年來一些人工智能算法發(fā)展中面臨的問題。
作者馬修·赫特森認為,當前部分子領(lǐng)域算法核心的改進并未取得突破進展。同時,當前多數(shù)論文傾向于提出新算法而不是在舊算法上調(diào)優(yōu),這樣做的主要原因是更容易發(fā)表論文,盡管在舊算法上調(diào)優(yōu)的效果和新算法的效果相差無幾。
“目前人工智能論文數(shù)量激增,泥沙俱下,導致部分論文質(zhì)量不高,選題跟風甚至論文灌水的現(xiàn)象確實存在,但這并不能說明人工智能發(fā)展停滯不前,而是表明目前有更多的學者和研究人員投入到了這個火熱的研究方向。”微眾銀行人工智能首席科學家范力欣在接受科技日報記者采訪時表示。
范力欣強調(diào),尤其需要指出的是,年輕學子中的佼佼者,包括博士、學士甚至高中生,都有了登上人工智能頂會頂刊嶄露頭角的機會。面對這樣的形勢,以偏概全地以“核心研究停滯不前”來總結(jié)是不合適的。
事實上,近幾年,人工智能某些領(lǐng)域的創(chuàng)新,包括算法核心創(chuàng)新,還是取得了較為明顯的進步。
如在自然語言處理領(lǐng)域,《科學》雜志這篇報道中提到的長短期記憶網(wǎng)絡(LSTM)是1997年提出的,而當前,Transformer架構(gòu)在速度和性能方面,比長短期記憶網(wǎng)絡要更優(yōu)越;預訓練模型方面,以BERT為代表的預訓練模型不僅在很多任務上獲得成功,更帶來了自然語言處理研究和應用范式的變化。更重要的是這些改進已經(jīng)在相對比較公認的數(shù)據(jù)集上測試過,有的還在實際的產(chǎn)業(yè)應用中獲得成功。
對此,南京大學人工智能學院教授俞揚也指出,近幾年人工智能國際頂級會議的投稿數(shù)量持續(xù)上漲,如近期神經(jīng)信息處理系統(tǒng)大會會議的投稿接近一萬篇,其中技術(shù)“催熟”、審稿隨機的現(xiàn)象確實存在。同時,革新性的工作往往容易遭受質(zhì)疑,在海量投稿中真正的技術(shù)進步也容易被淹沒。
核心創(chuàng)新要瞄準“痛點”
當前,在人工智能領(lǐng)域“洶涌”的浪潮中,研究人員的成果如何稱得上核心創(chuàng)新、突破進展?
“能夠克服以往的局限,在我看來就是突破。克服的局限越關(guān)鍵、越深刻、越普適,突破就越巨大。”俞揚舉例說,例如,以往在國際象棋上戰(zhàn)勝人類的搜索算法,無法擴展到搜索空間更加巨大的圍棋上,而廣為人知的阿爾法圍棋便利用機器學習技術(shù)減少了巨大的搜索空間,從而取得成功。
范力欣認為,雖然人工智能領(lǐng)域的研究很火熱,但該領(lǐng)域現(xiàn)在仍然處于積累實踐觀察的初級階段。現(xiàn)在的核心創(chuàng)新, 就是通過觀察與分析新的現(xiàn)象,不斷提升現(xiàn)有方法的實際性能,并收集數(shù)據(jù)、證據(jù)。長期大量的觀測后,真正有價值的是無數(shù)小的觀察結(jié)果。
那對算法進行創(chuàng)新需要哪些條件?“首先是要找準問題,特別是關(guān)注制約算法性能的‘瓶頸’問題,這也是目前人工智能算法改進最難的。”廈門大學人工智能系副教授陳毅東說。
找到問題之后,需要提出合適的應對方法。一方面,新方法可以來源于對目標任務領(lǐng)域知識的結(jié)合,這需要研究者對目標任務和相關(guān)領(lǐng)域知識有全面的把握;另一方面,新方法還可以來源于其他學科,仿生技術(shù)就是常用的方式,這需要研究者對跨學科知識有一定的涉獵。
“除此以外,由于現(xiàn)實條件的限制,如數(shù)據(jù)、算力等,算法改進要成功還需要根據(jù)現(xiàn)實條件進行各種折中和裁剪。這又需要研究者具有相當?shù)墓こ棠芰蛯嵺`經(jīng)驗。”陳毅東說。
科技日報記者了解到,2015年誕生的阿爾法圍棋組成部分中,搜索樹方法發(fā)表于2006年,策略梯度強化學習發(fā)表于2000年,卷積神經(jīng)網(wǎng)絡的提出則更早。“科學發(fā)展常常是證偽的過程,而不是一次性提出一個開創(chuàng)性的新理論。只有集量變?yōu)橘|(zhì)變, 才能為即將到來的理論突破打下堅實可靠的基礎(chǔ)。”范力欣說。
“人工智能基礎(chǔ)研究要取得突破,很有可能需要做長期并且有爭議的工作。”俞揚指出,如何為這樣的研究工作、研究者提供足夠的生存空間,對熱點之外的研究方向有獨立清晰的判斷力,尤其是在人工智能熱浪一波接一波的環(huán)境下保持對基礎(chǔ)研發(fā)的投入,可能是為推動人工智能基礎(chǔ)研發(fā)、產(chǎn)生原創(chuàng)性基礎(chǔ)成果需要考慮的重要問題。
還無法做到全領(lǐng)域創(chuàng)新評價標準統(tǒng)一
根據(jù)上述論文的觀察,不少研究工作都夸大了其改進的效果,而其中的根源問題之一,是當前人工智能相關(guān)領(lǐng)域的創(chuàng)新評價標準不統(tǒng)一,那么目前有無解決措施?
事實上,當前有不少解決途徑,如代碼開源、公開模型、公開實驗結(jié)果等手段,都能夠加強研究工作的可復現(xiàn)性和可對比性。
不過,作為一個還在不斷發(fā)展變化的領(lǐng)域,新問題、新領(lǐng)域、新現(xiàn)象、新關(guān)注點層出不窮,全領(lǐng)域范圍要做到評價標準統(tǒng)一十分困難。但在一些已經(jīng)成形的領(lǐng)域,有組織地制定統(tǒng)一評價標準是有可能而且很必要的。
陳毅東認為,首先制定評測標準需要一定站位高度,也面臨相當?shù)碾y度和工作量,還需要根據(jù)研究前沿的變化不斷進行調(diào)整更新。因此,必須有組織地開展,建議可以由相關(guān)學會的專委會、學術(shù)與產(chǎn)業(yè)聯(lián)盟有組織地引導領(lǐng)域?qū)W者、產(chǎn)業(yè)界研究人員來共同完成。
“其次,真實的場景和數(shù)據(jù)往往來源于產(chǎn)業(yè)界,建議學術(shù)界和產(chǎn)業(yè)界更加密切地配合,共同研討相關(guān)領(lǐng)域的前沿動態(tài)、發(fā)展方向和應用痛點,制定相應的標準數(shù)據(jù)集、搭建平臺,并面向科研開放數(shù)據(jù)、接口甚至計算資源。”陳毅東說。
從應用的角度看,當前人工智能技術(shù)仍然處于積累實踐觀察的初級階段,面臨著在許多實際環(huán)境條件下無法奏效的困境。
近期的學術(shù)會議在論文的評價標準上,也越來越強調(diào)研究工作的可復現(xiàn)性。俞揚建議,要把基礎(chǔ)研究與國內(nèi)的實際生產(chǎn)需求結(jié)合,一方面在特別的需求牽引下容易產(chǎn)生原創(chuàng)成果;另一方面,來自實際需求的正反饋容易形成閉環(huán)激勵,有利于不斷創(chuàng)新,形成自主技術(shù)體系。
“實踐是檢驗真理的唯一標準,任何算法是否是真正的創(chuàng)新都要接受實踐的檢驗。堅持不懈就會收獲美好的結(jié)果, 我個人是持樂觀態(tài)度的。文章作者其實也認同這一點, 提出各種方法必須經(jīng)過嚴格的驗證, 只是文章中沒有全面反映現(xiàn)在人工智能發(fā)展的總體態(tài)勢,存在以偏概全誤導公眾的可能。”范力欣說。 (記者 謝開飛 馬愛平 通 訊 員 歐陽桂蓮)