當(dāng)前位置: 首頁 » 技術(shù)前沿 » 創(chuàng)新技術(shù) » 正文

沈向洋院士在2024年外灘大會(huì)上的演講全文：大模型時(shí)代的機(jī)遇和挑戰(zhàn)——技術(shù)融合產(chǎn)業(yè)躍遷

字體：

發(fā)布日期：2024-09-10 來源：智能超參數(shù) 瀏覽次數(shù)：2246

編者按：這篇文章是香港科技大學(xué)校董會(huì)主席、美國國家工程院外籍院士沈向洋(Harry Shum)在2024年9月5日開幕的2024年外灘大會(huì)上的演講實(shí)錄。在題為《大模型時(shí)代的機(jī)遇和挑戰(zhàn)——技術(shù)融合產(chǎn)業(yè)躍遷》的演講中，沈向洋院士分享了他對算力、數(shù)據(jù)、大模型、以及AI Agent、AI 治理等話題的思考。

精彩觀點(diǎn)：

摩爾說我們18個(gè)月漲一倍算力，現(xiàn)在GPU算力是一年漲四倍。如果18個(gè)月只是漲一倍，那么十年下來大概上漲100倍。一年漲四倍，那么十年下來就是100萬倍。我再強(qiáng)調(diào)一遍，100萬倍。

如果大家關(guān)注大模型，都知道大模型整個(gè)模型越來越大，參數(shù)量越來越大。所以算力要求，隨著參數(shù)的增長，實(shí)際上還不僅僅是線性增長，更加像是一個(gè)平方向的增長。

真正做大模型的公司，如果你一萬張卡都沒有，你就根本不要講自己是在干大模型的公司了。

GPT-5出來的時(shí)候，到底會(huì)用多少數(shù)據(jù)？我們現(xiàn)在只能猜一猜，我猜大概會(huì)是200個(gè)T的數(shù)據(jù)。

今天你要做通用大模型，那肯定至少是萬張卡，而且再向前走，1萬張A卡都不行了，要一萬張H卡。行業(yè)大模型需要千卡級別的資源。每家企業(yè)要做企業(yè)大模型，可能需要百卡訓(xùn)練。

我覺得接下來，人工智能的發(fā)展很重要的一點(diǎn)，從各個(gè)國家、全球的角度來講，一定要做主權(quán)人工智能，所謂的Sovereign AI。主權(quán)人工智能背后一定需要有個(gè)主權(quán)云Sovereign cloud，來支持Sovereign AI的發(fā)展。

GPT-3出來了以后，大家講有個(gè)東西叫做智能，有個(gè)東西叫做智能涌現(xiàn)。但實(shí)際上，為什么涌現(xiàn)出來，什么時(shí)候涌現(xiàn)出來，是什么方式涌現(xiàn)出來，都是講不清楚的。

以下是“智能超參數(shù)”根據(jù)演講視頻整理而來的演講實(shí)錄，enjoy：

大家早上好，非常高興又回到美麗的上海，跟大家一起分享一下最近在人工智能的科研方面、產(chǎn)業(yè)方面的一些心得和體會(huì)。今天我講的題目是《大模型時(shí)代的機(jī)遇和挑戰(zhàn)——技術(shù)融合產(chǎn)業(yè)躍遷》。

我們今天大會(huì)的主題是科技的發(fā)展和未來可持續(xù)發(fā)展。其實(shí)我們應(yīng)該首先看一看人類歷史的發(fā)展。它實(shí)際上從頭到尾就是一個(gè)技術(shù)發(fā)展的歷史，推動(dòng)了人類整體發(fā)展。

如果我們聚焦到最近，就不要講以前發(fā)明的火、發(fā)明了輪子，那么現(xiàn)在最近這些年的這樣的一個(gè)發(fā)展，大家可以看得到整個(gè)科研的發(fā)展，科技的發(fā)展的話，它實(shí)際上整體是在加速的。剛才Kevin Kelly的三個(gè)觀點(diǎn)里面也提到了一個(gè)加速的發(fā)展。

現(xiàn)在這個(gè)階段，今天我們在這里，主要討論的實(shí)際上是人工智能的發(fā)展。人工智能的發(fā)展也非常有趣。就是剛才Michael講的，這樣一些跟人工智能有關(guān)的字，Cybermetics、AI等。

最近這些年，對普羅大眾來講，大家對人工智能的理解，我覺得可能有三件事情是非常家喻戶曉的。第一個(gè)事情當(dāng)然就是ChatGPT，實(shí)際上是從文生成文；第二個(gè)實(shí)際上是 DALL-E，就是所謂的文生成圖；第三個(gè)是 Sora，是文生成視頻。

很神奇的事情，這三件事情，首先都是由OpenAI這樣一個(gè)初創(chuàng)公司首先推出來的。當(dāng)然接下來很多公司在競爭，做非常類似的東西。比如ChatGPT，我今天來外灘大會(huì)來演講，沒有什么思路，我就問問ChatGPT——我到外灘大會(huì)來演講，到底應(yīng)該講些什么東西？

今天早上我們香港科大謝源教授跟我講，今天晚上要不要一起看足球，中國對日本，我也問了問ChatGPT或者類似的一些產(chǎn)品，說今天晚上中國對日本有沒有戲？現(xiàn)在這些人工智能可以回答得非常好，洋洋灑灑講了半天，大概率是沒啥希望，說不定還是可以爆冷的。

中間這個(gè)例子，實(shí)際上我非常喜歡的。這是人類歷史上第一次一張人工智能生成的照片，成為一張雜志的封面，有史以來第一次。也就兩年前，有一個(gè)數(shù)字藝術(shù)家Karen Cheng，用DALL-E系統(tǒng)，給了一段話提示符，說在浩瀚的星空中，一個(gè)女宇航員在火星上昂首闊步走向一個(gè)廣角鏡頭。那么人工智能的這種生成能力，實(shí)際上已經(jīng)相當(dāng)驚人。更不要講今年早些時(shí)候出來的Sora文生視頻，可以生成 60秒鐘的高清視頻。

到了今天這個(gè)時(shí)刻，我們應(yīng)該怎么樣去思考大模型，特別是對產(chǎn)業(yè)方面，到底有什么樣的一些深入影響？

前面的演講者也都提到了，實(shí)際上整個(gè)人工智能的發(fā)展，特別是過去這段時(shí)間深度學(xué)習(xí)的發(fā)展，最重要的事情，實(shí)際上是三件事情——算法，算力、數(shù)據(jù)。我接下來跟大家分享一下最近這段時(shí)間自己的一些思考。

第一個(gè)思考——算力是門檻。今天做大模型，做深度學(xué)習(xí)，首先最重要的事情實(shí)際上你要有算力。這里畫了一張圖。從2010、2012年開始，包括Geoffrey Hinton的學(xué)生做AlexNet，從那時(shí)候開始，所有這些大模型每年需要的算力是以一個(gè)什么樣的規(guī)模向前成長。

開始幾年的話，有六七倍的成長，最近這幾年穩(wěn)定下來，大概每年有一個(gè)四倍的成長。每年四倍的成長是什么概念？大家平時(shí)不想這個(gè)問題，我先留一個(gè)題目給大家。你現(xiàn)在先想一想，待會(huì)我再問你。每年漲四倍，十年漲幾倍？

算力這樣一個(gè)增長，很重要的一件事情，就是今天大家要大模型。如果大家關(guān)注大模型，都知道大模型整個(gè)模型越來越大，參數(shù)量越來越大。所以算力要求，隨著參數(shù)的增長，實(shí)際上還不僅僅是線性增長，更加像是一個(gè)平方向的增長。為什么呢？因?yàn)槟Ｐ痛罅艘院螅氵€要有更多數(shù)據(jù)來去訓(xùn)練大模型。所以整體對算力的要求，過去這些年是非常非常的大。英偉達(dá)股票之所以這樣高舉不下，這是最重要的一個(gè)原因。

這幾年我演講，講了一句話叫做——講卡傷感情，沒卡沒感情。今天如果復(fù)旦的教授問校長，我是個(gè)人才嗎？其實(shí)很簡單了，你就問校長給不給我100張卡。

你一定要去弄個(gè)公司做大模型，不要說做大模型，（就是）做行業(yè)模型，就要跟投資人講，你能保證給我錢買1000張卡嗎。真正做大模型的公司，如果你一萬張卡都沒有，你就根本不要講自己是在干大模型的公司了。所以我就講——講卡傷感情，沒卡沒感情。

但沒卡以后，沒錢以后最大的一個(gè)問題是什么呢？就是貧窮。以前講叫貧窮限制了我們的想象力，我覺得現(xiàn)在是貧窮扭曲了我們的想象力，就不敢去想這樣可以有突破性的一些問題。

講起卡，這個(gè)必須要講一講整個(gè)計(jì)算機(jī)芯片行業(yè)的發(fā)展。從原來的摩爾定律，已經(jīng)變成了黃氏定律。以前CPU的增長，大家都知道英特爾非常了不起。摩爾說我們18個(gè)月漲一倍算力，現(xiàn)在GPU算力是一年漲四倍。如果18個(gè)月只是漲一倍，那么十年下來大概也就是上漲100倍。一年漲四倍，那么十年下來那就是100萬倍。我再強(qiáng)調(diào)一遍，100萬倍。

剛才王院士也講了，1000倍就是一個(gè)什么樣的進(jìn)展。那么100萬倍是什么樣一個(gè)情況？為什么會(huì)這樣呢？

這是我的第二個(gè)思考，就是這里面數(shù)據(jù)的重要性。給大家看一個(gè)關(guān)于數(shù)據(jù)的數(shù)據(jù)。GPT-3出來的時(shí)候，兩個(gè)T的token。GBT-4的時(shí)候，從外面看到的數(shù)據(jù)，當(dāng)時(shí)大概是 12個(gè)T左右的數(shù)據(jù)。那么它后來還在不斷加數(shù)據(jù)，我們猜的話，現(xiàn)在GPT-4大概是20T的數(shù)據(jù)。

今天大家望穿秋水，天天在等GPT-5什么時(shí)候會(huì)出來？那么GPT-5出來的時(shí)候，到底會(huì)用多少數(shù)據(jù)？我們現(xiàn)在只能猜一猜，我猜大概會(huì)是 200個(gè)T的數(shù)據(jù)。實(shí)際上你在互聯(lián)網(wǎng)上挖來挖去，挖不出200T的數(shù)據(jù)了。這200T的數(shù)據(jù)怎么出來的？實(shí)際上你還要再想其他辦法。

當(dāng)GPT-3出來的時(shí)候，GPT-4出來的時(shí)候，這個(gè)給我的非常大的震撼，實(shí)際上是好像我們互聯(lián)網(wǎng)40年，天天大家急急忙忙的，今天寫個(gè)網(wǎng)站，明天弄個(gè)東西搬到網(wǎng)上去，激動(dòng)的不得了。首先是（數(shù)據(jù)）被Google利用了，弄來做搜索。然后今天再想想，可能最主要的是積累了這個(gè)東西，就是用來做ChatGPT，就是為了這樣一個(gè)AI的時(shí)刻。

做到今天了，下一步到底要干什么？我講就是非常清晰的，就是這樣一條思路，特別是最近DALL-E、Sora實(shí)際上也給大家指明了一個(gè)方向。就是從原來的語言模型、文本，接下來要做多模態(tài)，我們仔細(xì)做computer vision的同學(xué)們，就有用武之地了。

未來再向前走，Sora模型雖然做的非常好了，大家也可以看得到，實(shí)際上這樣一個(gè)多模態(tài)Sora模型，它還不是那么強(qiáng)大。實(shí)際上這里面的物理性質(zhì)是不能保證的，做不到世界模型。未來肯定是要往具身智能走，一定要往機(jī)器人走。機(jī)器人這件事情，當(dāng)然這里面的一個(gè)特別的形態(tài)，實(shí)際上就是自動(dòng)駕駛。

技術(shù)上來講，肯定是要走一條生成和理解綜合起來的一條道路，這樣一個(gè)AGI。當(dāng)然大家有不同的看法，比如（王）小川，一直覺得不需要視頻，不需要視覺，也是有希望走向AGI的。

這里就介紹一下我?guī)讉€(gè)學(xué)生做的一個(gè)公司階躍星辰，這樣一個(gè)多模態(tài)可能是今年大模型公司里面做的最好的一個(gè)多模態(tài)的工作了。

今天不舉其他例子，就講一個(gè)最左邊這個(gè)例子。比如，你把一張圖上傳到躍問這個(gè)APP上面去，你問他為什么圖中這個(gè)行為被稱之為無效技能？你看一下也搞不清楚為什么叫無效技能。這個(gè)APP會(huì)告訴你，為什么叫無效技能呢？因?yàn)樾∨笥烟稍诮稚洗驖L，他媽媽無動(dòng)于衷，一直繼續(xù)看手機(jī)，所以小孩這個(gè)技能叫做無效技能。當(dāng)然視頻分析現(xiàn)在也可以做的很好，圖片分析都可以做的很好。

第四個(gè)思考，毫無疑問大模型現(xiàn)在只是對整個(gè)行業(yè)的影響，剛才王院士也講到了，AI+有很多很多機(jī)會(huì)。

那么我再回到對算力的需求。今天你要做通用大模型，那肯定至少是萬張卡，而且再向前走，1萬張A卡都不行了，要一萬張H卡。行業(yè)大模型需要千卡級別的資源。自己一家公司，每家企業(yè)要做企業(yè)大模型，可能需要百卡訓(xùn)練。

但是我自己特別激動(dòng)人心的事情，實(shí)際上是個(gè)人大模型?，F(xiàn)在像聯(lián)想、微軟在推的AIPC，蘋果所謂的apple intelligence，都是朝著personal intelligence這個(gè)方向向前發(fā)展。

這里我給大家分享一個(gè)數(shù)據(jù)，到7月底，中國備案大模型一共是197個(gè)。197個(gè)備案的大模型里面，可以看得到，大概是30%是通用大模型，70%是行業(yè)大模型，未來肯定是越來越多的行業(yè)大模型。

這里我簡單給大家看一個(gè)例子。這個(gè)是財(cái)躍公司做的一個(gè)“財(cái)躍”大模型，可以對整個(gè)金融行業(yè)進(jìn)行一個(gè)分析。比如說英偉達(dá)的財(cái)報(bào)出來了，然后很快可以做出一些非常好的結(jié)果。

第五個(gè)分享，大家都在講大模型出來，人工智能時(shí)代真正了不起的超級應(yīng)用是什么？實(shí)際上超級應(yīng)用一直存在，就是大家干不出來。實(shí)際上，超級應(yīng)用就是AI Agent。

ChatGPT雖然很了不起，很強(qiáng)大，但是還遠(yuǎn)遠(yuǎn)沒有到agent的一個(gè)地步。整個(gè)agent這件事情，實(shí)際上是把人的生產(chǎn)力提高到了一個(gè)非常大的高度。從進(jìn)來到出去，整個(gè)一個(gè)工作。

今天大家都知道，在公司里面，工作上整個(gè)工作流是非常之復(fù)雜的。GPT到今天，基本上還是相對比較單點(diǎn)的突破。真正向前走的話，要把整個(gè)工作流弄起來。今天時(shí)間關(guān)系，我就不展開講了，就是你要把這個(gè)行業(yè)進(jìn)行一個(gè)分析，從大模型應(yīng)用框架，到平臺(tái)，到知識技能、任務(wù)、對話全部要接起來，才可以做到這樣的結(jié)果。

這是非常簡單的一個(gè)例子，比如說讓AI顧問為您定制健康美麗方案。

演示視頻對話內(nèi)容：

“您好，我是您的健康美麗顧問，非常高興為您服務(wù)。請告訴我您的需求，我將為您量身定制個(gè)性化的方案，祝你煥發(fā)自信和活力。

給我推薦一個(gè)好用的洗面奶吧。

當(dāng)然可以。在為您推薦洗面奶之前，我想了解一下您的年齡、性別和膚質(zhì)，這樣我才能更準(zhǔn)確的為您推薦適合您的產(chǎn)品。

我是混合干皮。

小西馬上幫您進(jìn)行查詢，了解了您的膚質(zhì)，我可以為您推薦一款適合混合干皮膚的洗面奶，佰草集凈透保濕潔面乳。這款洗面奶采用氨基酸型潔面配方，溫和清潔肌膚。”

我想大家都看到了，剛才這個(gè)視頻里面，真正做到這樣一個(gè)虛擬員工，這樣一個(gè)工作流，你要把整個(gè)技能、數(shù)據(jù)庫跟你公司的所有數(shù)據(jù)打通，配以底層大模型，可以做出很了不起的事情。在應(yīng)用方面，我對很多中國公司接下來的發(fā)展是充滿信心的。

第六點(diǎn)，實(shí)際上就回到，WAIC世界人工智能大會(huì)今年的主題，就是AI治理這件事情。這個(gè)事情非常重要，而且每個(gè)國家對這件事情看法也很不一樣。這件事情，AI對民眾的沖擊，公司的沖擊，政府監(jiān)管的沖擊，社會(huì)發(fā)展的沖擊，現(xiàn)在大家都在擔(dān)心。比如講美大選，人工智能對大選產(chǎn)生一些影響，會(huì)不會(huì)有人用人工智能的一些技術(shù)去操縱大選的一些結(jié)果。它的確是非常的困難。

今年7月5號的時(shí)候，我有幸跟三個(gè)圖靈將得主，包括我的導(dǎo)師羅杰·瑞迪（Raj Reddy），曼紐爾·布盧姆（Manuel Blum），還有姚期智先生一起討論這樣一個(gè)問題。特別是今天，剛才王院士前面講到阿里云，就是基礎(chǔ)設(shè)施，我也非常贊同。

我覺得接下來，人工智能的發(fā)展很重要的一點(diǎn)，從各個(gè)國家、全球的角度來講，一定要做主權(quán)人工智能，所謂的Sovereign AI。主權(quán)人工智能背后一定需要有個(gè)主權(quán)云Sovereign cloud，來支持Sovereign AI的發(fā)展。

時(shí)間已經(jīng)差不多了，所以我很快把最后兩點(diǎn)跟大家分享一下。

大家很激動(dòng)地講大模型這件事情，但我想問一個(gè)問題，GPT給我們帶來的沖擊，有多少是人機(jī)交互的震撼，還有多少到底是機(jī)器智能的發(fā)展？大家好像覺得是機(jī)器智能的發(fā)展。我想感謝Michael，剛才提到IA這個(gè)詞，讓我不必再解釋了。

約翰·馬可夫（John Markoff），原來紐約時(shí)報(bào)的專欄作家，寫了一本非常好的書叫《machines of loving Grace》（注：國內(nèi)叫做《與機(jī)器人共舞》），梳理了過去50年計(jì)算機(jī)科學(xué)發(fā)展的兩條主線。

一條主線就是AI，Artificial intelligence，是我導(dǎo)師的導(dǎo)師約翰·麥卡錫（John McCarthy）創(chuàng)造了這個(gè)詞。第二個(gè)就是IA這條線，就是這幫做UI的人講的，這個(gè)世界最重要的事情是智能增強(qiáng)intelligence augmentation。

如果你沿著這條道路想，實(shí)際上我們過去這幾十年的進(jìn)展，主要是人機(jī)交互里面的一個(gè)突破。而且你要去想，人工智能這件事情，相當(dāng)長的時(shí)間它還是一個(gè)工具。那這樣想的話，你就可以看得到過去這四五十年的話，整個(gè)行業(yè)的進(jìn)展。

原來圖形用戶界面出來一個(gè)了不起的東西，叫做windows，產(chǎn)生了一家偉大的公司叫微軟。互聯(lián)網(wǎng)時(shí)代來了，出來一個(gè)東西叫搜索，出來一家公司叫谷歌，然后就到了移動(dòng)互聯(lián)網(wǎng)，現(xiàn)在到了AI時(shí)代了，它的人機(jī)交互最本質(zhì)的是什么？最本質(zhì)的是對話，就像ChatGPT這樣。那么ChatGPT加上微軟會(huì)不會(huì)成為AI時(shí)代最偉大的公司?我想只有時(shí)間才能夠驗(yàn)證。

最后我也想鼓勵(lì)大家研究，雖然GPT已經(jīng)弄得如火如荼了，大家都等著GPT-5出來，說不定哪天還有GPT-6。實(shí)際上，我們應(yīng)該從做學(xué)問的角度，回過頭來再想想，實(shí)際上今天對智能的理解還是非常非常有限，這個(gè)跟物理學(xué)真的是非常不一樣。

我們念物理的話，上到浩瀚的星空，下到微小的量子，希望弄一個(gè)大一統(tǒng)的理論能夠解釋。但是今天深度學(xué)習(xí)，雖然系統(tǒng)做的好像很像模像樣，但是大多數(shù)東西不可以解釋，也不是很魯棒。GPT-3出來了以后，大家就講有個(gè)東西叫做智能，有個(gè)東西叫做智能涌現(xiàn)。但實(shí)際上，為什么涌現(xiàn)出來，什么時(shí)候涌現(xiàn)出來，是什么方式涌現(xiàn)出來，都是講不清楚的。

去年，我在廈門科技大學(xué)聚集了一批海內(nèi)外的一些計(jì)算機(jī)科學(xué)家，特別是一些數(shù)學(xué)非常好的科研人員，大家一起討論，要深刻討論涌現(xiàn)智能背后的數(shù)據(jù)原理到底是什么。

實(shí)際上今天人工智能的發(fā)展，還在一個(gè)相對比較早期的階段，但是行業(yè)上已經(jīng)有很多應(yīng)用，我們真的下定決心去做了，特別是有王堅(jiān)院士弄的基礎(chǔ)設(shè)施在后面加持，我對未來發(fā)展充滿信心。

謝謝大家。

免責(zé)聲明：
本站所提供的文章資訊、圖片、音頻、視頻來源于互聯(lián)網(wǎng)及公開渠道，僅供學(xué)習(xí)參考，版權(quán)歸原創(chuàng)者所有! 如有侵犯您的版權(quán)，請通知我們，我們會(huì)遵循相關(guān)法律法規(guī)采取措施刪除相關(guān)內(nèi)容。

下一篇：油氣勘探開發(fā)邁入“納米時(shí)代”
上一篇：戶內(nèi)燃?xì)庖患壈踩[患圖文說明，?請立即整改，避免影響用氣

[ 技術(shù)前沿搜索 ] [ 加入收藏 ] [ 告訴好友 ] [ 打印本文 ] [ 關(guān)閉窗口 ]

同類技術(shù)前沿

一周資訊排行

圖文推薦

亚洲视频国产视频,亚洲综合首页,亚洲最大色视频,国内精品自产拍在线电影,日韩久久网,久久午夜影院,欧美亚洲高清

沈向洋院士在2024年外灘大會(huì)上的演講全文：大模型時(shí)代的機(jī)遇和挑戰(zhàn)——技術(shù)融合 產(chǎn)業(yè)躍遷

沈向洋院士在2024年外灘大會(huì)上的演講全文：大模型時(shí)代的機(jī)遇和挑戰(zhàn)——技術(shù)融合產(chǎn)業(yè)躍遷