亚洲视频国产视频,亚洲综合首页,亚洲最大色视频,国内精品自产拍在线电影,日韩久久网,久久午夜影院,欧美亚洲高清

  • 歡迎光臨燃?xì)獗硇畔⒕W(wǎng)!
 
當(dāng)前位置: 首頁 » 技術(shù)前沿 » 創(chuàng)新技術(shù) » 正文

沈向洋院士在2024年外灘大會(huì)上的演講全文:大模型時(shí)代的機(jī)遇和挑戰(zhàn)——技術(shù)融合 產(chǎn)業(yè)躍遷

字體: 放大字體  縮小字體 發(fā)布日期:2024-09-10  來源:智能超參數(shù)  瀏覽次數(shù):2246
 

 

    編者按:這篇文章是香港科技大學(xué)校董會(huì)主席、美國國家工程院外籍院士沈向洋(Harry Shum)在2024年9月5日開幕的2024年外灘大會(huì)上的演講實(shí)錄。在題為《大模型時(shí)代的機(jī)遇和挑戰(zhàn)——技術(shù)融合 產(chǎn)業(yè)躍遷》的演講中,沈向洋院士分享了他對算力、數(shù)據(jù)、大模型、以及AI Agent、AI 治理等話題的思考。

 

精彩觀點(diǎn):

 

    摩爾說我們18個(gè)月漲一倍算力,現(xiàn)在GPU算力是一年漲四倍。如果18個(gè)月只是漲一倍,那么十年下來大概上漲100倍。一年漲四倍,那么十年下來就是100萬倍。我再強(qiáng)調(diào)一遍,100萬倍。

 

    如果大家關(guān)注大模型,都知道大模型整個(gè)模型越來越大,參數(shù)量越來越大。所以算力要求,隨著參數(shù)的增長,實(shí)際上還不僅僅是線性增長,更加像是一個(gè)平方向的增長。

 

    真正做大模型的公司,如果你一萬張卡都沒有,你就根本不要講自己是在干大模型的公司了。

 

    GPT-5出來的時(shí)候,到底會(huì)用多少數(shù)據(jù)?我們現(xiàn)在只能猜一猜,我猜大概會(huì)是200個(gè)T的數(shù)據(jù)。

 

    今天你要做通用大模型,那肯定至少是萬張卡,而且再向前走,1萬張A卡都不行了,要一萬張H卡。行業(yè)大模型需要千卡級別的資源。每家企業(yè)要做企業(yè)大模型,可能需要百卡訓(xùn)練。

 

    我覺得接下來,人工智能的發(fā)展很重要的一點(diǎn),從各個(gè)國家、全球的角度來講,一定要做主權(quán)人工智能,所謂的Sovereign AI。主權(quán)人工智能背后一定需要有個(gè)主權(quán)云Sovereign cloud,來支持Sovereign AI的發(fā)展。

 

    GPT-3出來了以后,大家講有個(gè)東西叫做智能,有個(gè)東西叫做智能涌現(xiàn)。但實(shí)際上,為什么涌現(xiàn)出來,什么時(shí)候涌現(xiàn)出來,是什么方式涌現(xiàn)出來,都是講不清楚的。

 

    以下是“智能超參數(shù)”根據(jù)演講視頻整理而來的演講實(shí)錄,enjoy:

 


    大家早上好,非常高興又回到美麗的上海,跟大家一起分享一下最近在人工智能的科研方面、產(chǎn)業(yè)方面的一些心得和體會(huì)。今天我講的題目是《大模型時(shí)代的機(jī)遇和挑戰(zhàn)——技術(shù)融合 產(chǎn)業(yè)躍遷》。


 

    我們今天大會(huì)的主題是科技的發(fā)展和未來可持續(xù)發(fā)展。其實(shí)我們應(yīng)該首先看一看人類歷史的發(fā)展。它實(shí)際上從頭到尾就是一個(gè)技術(shù)發(fā)展的歷史,推動(dòng)了人類整體發(fā)展。

 


    如果我們聚焦到最近,就不要講以前發(fā)明的火、發(fā)明了輪子,那么現(xiàn)在最近這些年的這樣的一個(gè)發(fā)展,大家可以看得到整個(gè)科研的發(fā)展,科技的發(fā)展的話,它實(shí)際上整體是在加速的。剛才Kevin Kelly的三個(gè)觀點(diǎn)里面也提到了一個(gè)加速的發(fā)展。

 

    現(xiàn)在這個(gè)階段,今天我們在這里,主要討論的實(shí)際上是人工智能的發(fā)展。人工智能的發(fā)展也非常有趣。就是剛才Michael講的,這樣一些跟人工智能有關(guān)的字,Cybermetics、AI等。

 

    最近這些年,對普羅大眾來講,大家對人工智能的理解,我覺得可能有三件事情是非常家喻戶曉的。第一個(gè)事情當(dāng)然就是ChatGPT,實(shí)際上是從文生成文;第二個(gè)實(shí)際上是 DALL-E,就是所謂的文生成圖;第三個(gè)是 Sora,是文生成視頻。

 


    很神奇的事情,這三件事情,首先都是由OpenAI這樣一個(gè)初創(chuàng)公司首先推出來的。當(dāng)然接下來很多公司在競爭,做非常類似的東西。比如ChatGPT,我今天來外灘大會(huì)來演講,沒有什么思路,我就問問ChatGPT——我到外灘大會(huì)來演講,到底應(yīng)該講些什么東西?

 

    今天早上我們香港科大謝源教授跟我講,今天晚上要不要一起看足球,中國對日本,我也問了問ChatGPT或者類似的一些產(chǎn)品,說今天晚上中國對日本有沒有戲?現(xiàn)在這些人工智能可以回答得非常好,洋洋灑灑講了半天,大概率是沒啥希望,說不定還是可以爆冷的。

 

    中間這個(gè)例子,實(shí)際上我非常喜歡的。這是人類歷史上第一次一張人工智能生成的照片,成為一張雜志的封面,有史以來第一次。也就兩年前,有一個(gè)數(shù)字藝術(shù)家Karen Cheng,用DALL-E系統(tǒng),給了一段話提示符,說在浩瀚的星空中,一個(gè)女宇航員在火星上昂首闊步走向一個(gè)廣角鏡頭。那么人工智能的這種生成能力,實(shí)際上已經(jīng)相當(dāng)驚人。更不要講今年早些時(shí)候出來的Sora文生視頻,可以生成 60秒鐘的高清視頻。

 

    到了今天這個(gè)時(shí)刻,我們應(yīng)該怎么樣去思考大模型,特別是對產(chǎn)業(yè)方面,到底有什么樣的一些深入影響?

 

    前面的演講者也都提到了,實(shí)際上整個(gè)人工智能的發(fā)展,特別是過去這段時(shí)間深度學(xué)習(xí)的發(fā)展,最重要的事情,實(shí)際上是三件事情——算法,算力、數(shù)據(jù)。我接下來跟大家分享一下最近這段時(shí)間自己的一些思考。

 


    第一個(gè)思考——算力是門檻。今天做大模型,做深度學(xué)習(xí),首先最重要的事情實(shí)際上你要有算力。這里畫了一張圖。從2010、2012年開始,包括Geoffrey Hinton的學(xué)生做AlexNet,從那時(shí)候開始,所有這些大模型每年需要的算力是以一個(gè)什么樣的規(guī)模向前成長。

 

    開始幾年的話,有六七倍的成長,最近這幾年穩(wěn)定下來,大概每年有一個(gè)四倍的成長。每年四倍的成長是什么概念?大家平時(shí)不想這個(gè)問題,我先留一個(gè)題目給大家。你現(xiàn)在先想一想,待會(huì)我再問你。每年漲四倍,十年漲幾倍?

 


    算力這樣一個(gè)增長,很重要的一件事情,就是今天大家要大模型。如果大家關(guān)注大模型,都知道大模型整個(gè)模型越來越大,參數(shù)量越來越大。所以算力要求,隨著參數(shù)的增長,實(shí)際上還不僅僅是線性增長,更加像是一個(gè)平方向的增長。為什么呢?因?yàn)槟P痛罅艘院螅氵€要有更多數(shù)據(jù)來去訓(xùn)練大模型。所以整體對算力的要求,過去這些年是非常非常的大。英偉達(dá)股票之所以這樣高舉不下,這是最重要的一個(gè)原因。

 


    這幾年我演講,講了一句話叫做——講卡傷感情,沒卡沒感情。今天如果復(fù)旦的教授問校長,我是個(gè)人才嗎?其實(shí)很簡單了,你就問校長給不給我100張卡。

 

    你一定要去弄個(gè)公司做大模型,不要說做大模型,(就是)做行業(yè)模型,就要跟投資人講,你能保證給我錢買1000張卡嗎。真正做大模型的公司,如果你一萬張卡都沒有,你就根本不要講自己是在干大模型的公司了。所以我就講——講卡傷感情,沒卡沒感情。

 

    但沒卡以后,沒錢以后最大的一個(gè)問題是什么呢?就是貧窮。以前講叫貧窮限制了我們的想象力,我覺得現(xiàn)在是貧窮扭曲了我們的想象力,就不敢去想這樣可以有突破性的一些問題。

 

    講起卡,這個(gè)必須要講一講整個(gè)計(jì)算機(jī)芯片行業(yè)的發(fā)展。從原來的摩爾定律,已經(jīng)變成了黃氏定律。以前CPU的增長,大家都知道英特爾非常了不起。摩爾說我們18個(gè)月漲一倍算力,現(xiàn)在GPU算力是一年漲四倍。如果18個(gè)月只是漲一倍,那么十年下來大概也就是上漲100倍。一年漲四倍,那么十年下來那就是100萬倍。我再強(qiáng)調(diào)一遍,100萬倍。

 

    剛才王院士也講了,1000倍就是一個(gè)什么樣的進(jìn)展。那么100萬倍是什么樣一個(gè)情況?為什么會(huì)這樣呢?

 


    這是我的第二個(gè)思考,就是這里面數(shù)據(jù)的重要性。給大家看一個(gè)關(guān)于數(shù)據(jù)的數(shù)據(jù)。GPT-3出來的時(shí)候,兩個(gè)T的token。GBT-4的時(shí)候,從外面看到的數(shù)據(jù),當(dāng)時(shí)大概是 12個(gè)T左右的數(shù)據(jù)。那么它后來還在不斷加數(shù)據(jù),我們猜的話,現(xiàn)在GPT-4大概是20T的數(shù)據(jù)。

 

    今天大家望穿秋水,天天在等GPT-5什么時(shí)候會(huì)出來?那么GPT-5出來的時(shí)候,到底會(huì)用多少數(shù)據(jù)?我們現(xiàn)在只能猜一猜,我猜大概會(huì)是 200個(gè)T的數(shù)據(jù)。實(shí)際上你在互聯(lián)網(wǎng)上挖來挖去,挖不出200T的數(shù)據(jù)了。這200T的數(shù)據(jù)怎么出來的?實(shí)際上你還要再想其他辦法。

 


    當(dāng)GPT-3出來的時(shí)候,GPT-4出來的時(shí)候,這個(gè)給我的非常大的震撼,實(shí)際上是好像我們互聯(lián)網(wǎng)40年,天天大家急急忙忙的,今天寫個(gè)網(wǎng)站,明天弄個(gè)東西搬到網(wǎng)上去,激動(dòng)的不得了。首先是(數(shù)據(jù))被Google利用了,弄來做搜索。然后今天再想想,可能最主要的是積累了這個(gè)東西,就是用來做ChatGPT,就是為了這樣一個(gè)AI的時(shí)刻。

 


    做到今天了,下一步到底要干什么?我講就是非常清晰的,就是這樣一條思路,特別是最近DALL-E、Sora實(shí)際上也給大家指明了一個(gè)方向。就是從原來的語言模型、文本,接下來要做多模態(tài),我們仔細(xì)做computer vision的同學(xué)們,就有用武之地了。

 

    未來再向前走,Sora模型雖然做的非常好了,大家也可以看得到,實(shí)際上這樣一個(gè)多模態(tài)Sora模型,它還不是那么強(qiáng)大。實(shí)際上這里面的物理性質(zhì)是不能保證的,做不到世界模型。未來肯定是要往具身智能走,一定要往機(jī)器人走。機(jī)器人這件事情,當(dāng)然這里面的一個(gè)特別的形態(tài),實(shí)際上就是自動(dòng)駕駛。



    技術(shù)上來講,肯定是要走一條生成和理解綜合起來的一條道路,這樣一個(gè)AGI。當(dāng)然大家有不同的看法,比如(王)小川,一直覺得不需要視頻,不需要視覺,也是有希望走向AGI的。

 


    這里就介紹一下我?guī)讉€(gè)學(xué)生做的一個(gè)公司階躍星辰,這樣一個(gè)多模態(tài)可能是今年大模型公司里面做的最好的一個(gè)多模態(tài)的工作了。

 

    今天不舉其他例子,就講一個(gè)最左邊這個(gè)例子。比如,你把一張圖上傳到躍問這個(gè)APP上面去,你問他為什么圖中這個(gè)行為被稱之為無效技能?你看一下也搞不清楚為什么叫無效技能。這個(gè)APP會(huì)告訴你,為什么叫無效技能呢?因?yàn)樾∨笥烟稍诮稚洗驖L,他媽媽無動(dòng)于衷,一直繼續(xù)看手機(jī),所以小孩這個(gè)技能叫做無效技能。當(dāng)然視頻分析現(xiàn)在也可以做的很好,圖片分析都可以做的很好。

 


    第四個(gè)思考,毫無疑問大模型現(xiàn)在只是對整個(gè)行業(yè)的影響,剛才王院士也講到了,AI+有很多很多機(jī)會(huì)。

 

    那么我再回到對算力的需求。今天你要做通用大模型,那肯定至少是萬張卡,而且再向前走,1萬張A卡都不行了,要一萬張H卡。行業(yè)大模型需要千卡級別的資源。自己一家公司,每家企業(yè)要做企業(yè)大模型,可能需要百卡訓(xùn)練。

 

    但是我自己特別激動(dòng)人心的事情,實(shí)際上是個(gè)人大模型?,F(xiàn)在像聯(lián)想、微軟在推的AIPC,蘋果所謂的apple intelligence,都是朝著personal intelligence這個(gè)方向向前發(fā)展。

 


    這里我給大家分享一個(gè)數(shù)據(jù),到7月底,中國備案大模型一共是197個(gè)。197個(gè)備案的大模型里面,可以看得到,大概是30%是通用大模型,70%是行業(yè)大模型,未來肯定是越來越多的行業(yè)大模型。

 


    這里我簡單給大家看一個(gè)例子。這個(gè)是財(cái)躍公司做的一個(gè)“財(cái)躍”大模型,可以對整個(gè)金融行業(yè)進(jìn)行一個(gè)分析。比如說英偉達(dá)的財(cái)報(bào)出來了,然后很快可以做出一些非常好的結(jié)果。

 


    第五個(gè)分享,大家都在講大模型出來,人工智能時(shí)代真正了不起的超級應(yīng)用是什么?實(shí)際上超級應(yīng)用一直存在,就是大家干不出來。實(shí)際上,超級應(yīng)用就是AI Agent。

 

    ChatGPT雖然很了不起,很強(qiáng)大,但是還遠(yuǎn)遠(yuǎn)沒有到agent的一個(gè)地步。整個(gè)agent這件事情,實(shí)際上是把人的生產(chǎn)力提高到了一個(gè)非常大的高度。從進(jìn)來到出去,整個(gè)一個(gè)工作。

 


    今天大家都知道,在公司里面,工作上整個(gè)工作流是非常之復(fù)雜的。GPT到今天,基本上還是相對比較單點(diǎn)的突破。真正向前走的話,要把整個(gè)工作流弄起來。今天時(shí)間關(guān)系,我就不展開講了,就是你要把這個(gè)行業(yè)進(jìn)行一個(gè)分析,從大模型應(yīng)用框架,到平臺(tái),到知識技能、任務(wù)、對話全部要接起來,才可以做到這樣的結(jié)果。

 

    這是非常簡單的一個(gè)例子,比如說讓AI顧問為您定制健康美麗方案。

 

演示視頻對話內(nèi)容:

 

    “您好,我是您的健康美麗顧問,非常高興為您服務(wù)。請告訴我您的需求,我將為您量身定制個(gè)性化的方案,祝你煥發(fā)自信和活力。

 

    給我推薦一個(gè)好用的洗面奶吧。

 

    當(dāng)然可以。在為您推薦洗面奶之前,我想了解一下您的年齡、性別和膚質(zhì),這樣我才能更準(zhǔn)確的為您推薦適合您的產(chǎn)品。

 

    我是混合干皮。

 

    小西馬上幫您進(jìn)行查詢,了解了您的膚質(zhì),我可以為您推薦一款適合混合干皮膚的洗面奶,佰草集凈透保濕潔面乳。這款洗面奶采用氨基酸型潔面配方,溫和清潔肌膚。”

 

    我想大家都看到了,剛才這個(gè)視頻里面,真正做到這樣一個(gè)虛擬員工,這樣一個(gè)工作流,你要把整個(gè)技能、數(shù)據(jù)庫跟你公司的所有數(shù)據(jù)打通,配以底層大模型,可以做出很了不起的事情。在應(yīng)用方面,我對很多中國公司接下來的發(fā)展是充滿信心的。

 


    第六點(diǎn),實(shí)際上就回到,WAIC世界人工智能大會(huì)今年的主題,就是AI治理這件事情。這個(gè)事情非常重要,而且每個(gè)國家對這件事情看法也很不一樣。這件事情,AI對民眾的沖擊,公司的沖擊,政府監(jiān)管的沖擊,社會(huì)發(fā)展的沖擊,現(xiàn)在大家都在擔(dān)心。比如講美大選,人工智能對大選產(chǎn)生一些影響,會(huì)不會(huì)有人用人工智能的一些技術(shù)去操縱大選的一些結(jié)果。它的確是非常的困難。

 

    今年7月5號的時(shí)候,我有幸跟三個(gè)圖靈將得主,包括我的導(dǎo)師羅杰·瑞迪(Raj Reddy),曼紐爾·布盧姆(Manuel Blum),還有姚期智先生一起討論這樣一個(gè)問題。特別是今天,剛才王院士前面講到阿里云,就是基礎(chǔ)設(shè)施,我也非常贊同。

 

    我覺得接下來,人工智能的發(fā)展很重要的一點(diǎn),從各個(gè)國家、全球的角度來講,一定要做主權(quán)人工智能,所謂的Sovereign AI。主權(quán)人工智能背后一定需要有個(gè)主權(quán)云Sovereign cloud,來支持Sovereign AI的發(fā)展。

 

    時(shí)間已經(jīng)差不多了,所以我很快把最后兩點(diǎn)跟大家分享一下。

 


    大家很激動(dòng)地講大模型這件事情,但我想問一個(gè)問題,GPT給我們帶來的沖擊,有多少是人機(jī)交互的震撼,還有多少到底是機(jī)器智能的發(fā)展?大家好像覺得是機(jī)器智能的發(fā)展。我想感謝Michael,剛才提到IA這個(gè)詞,讓我不必再解釋了。

 

    約翰·馬可夫(John Markoff),原來紐約時(shí)報(bào)的專欄作家,寫了一本非常好的書叫《machines of loving Grace》(注:國內(nèi)叫做《與機(jī)器人共舞》),梳理了過去50年計(jì)算機(jī)科學(xué)發(fā)展的兩條主線。

 

    一條主線就是AI,Artificial intelligence,是我導(dǎo)師的導(dǎo)師約翰·麥卡錫(John McCarthy)創(chuàng)造了這個(gè)詞。第二個(gè)就是IA這條線,就是這幫做UI的人講的,這個(gè)世界最重要的事情是智能增強(qiáng)intelligence augmentation。

 

    如果你沿著這條道路想,實(shí)際上我們過去這幾十年的進(jìn)展,主要是人機(jī)交互里面的一個(gè)突破。而且你要去想,人工智能這件事情,相當(dāng)長的時(shí)間它還是一個(gè)工具。那這樣想的話,你就可以看得到過去這四五十年的話,整個(gè)行業(yè)的進(jìn)展。

 

    原來圖形用戶界面出來一個(gè)了不起的東西,叫做windows,產(chǎn)生了一家偉大的公司叫微軟。互聯(lián)網(wǎng)時(shí)代來了,出來一個(gè)東西叫搜索,出來一家公司叫谷歌,然后就到了移動(dòng)互聯(lián)網(wǎng),現(xiàn)在到了AI時(shí)代了,它的人機(jī)交互最本質(zhì)的是什么?最本質(zhì)的是對話,就像ChatGPT這樣。那么ChatGPT加上微軟會(huì)不會(huì)成為AI時(shí)代最偉大的公司?我想只有時(shí)間才能夠驗(yàn)證。

 


    最后我也想鼓勵(lì)大家研究,雖然GPT已經(jīng)弄得如火如荼了,大家都等著GPT-5出來,說不定哪天還有GPT-6。實(shí)際上,我們應(yīng)該從做學(xué)問的角度,回過頭來再想想,實(shí)際上今天對智能的理解還是非常非常有限,這個(gè)跟物理學(xué)真的是非常不一樣。

 

    我們念物理的話,上到浩瀚的星空,下到微小的量子,希望弄一個(gè)大一統(tǒng)的理論能夠解釋。但是今天深度學(xué)習(xí),雖然系統(tǒng)做的好像很像模像樣,但是大多數(shù)東西不可以解釋,也不是很魯棒。GPT-3出來了以后,大家就講有個(gè)東西叫做智能,有個(gè)東西叫做智能涌現(xiàn)。但實(shí)際上,為什么涌現(xiàn)出來,什么時(shí)候涌現(xiàn)出來,是什么方式涌現(xiàn)出來,都是講不清楚的。

 


    去年,我在廈門科技大學(xué)聚集了一批海內(nèi)外的一些計(jì)算機(jī)科學(xué)家,特別是一些數(shù)學(xué)非常好的科研人員,大家一起討論,要深刻討論涌現(xiàn)智能背后的數(shù)據(jù)原理到底是什么。

 

    實(shí)際上今天人工智能的發(fā)展,還在一個(gè)相對比較早期的階段,但是行業(yè)上已經(jīng)有很多應(yīng)用,我們真的下定決心去做了,特別是有王堅(jiān)院士弄的基礎(chǔ)設(shè)施在后面加持,我對未來發(fā)展充滿信心。

 

    謝謝大家。

 

 
免責(zé)聲明:
本站所提供的文章資訊、圖片、音頻、視頻來源于互聯(lián)網(wǎng)及公開渠道,僅供學(xué)習(xí)參考,版權(quán)歸原創(chuàng)者所有! 如有侵犯您的版權(quán),請通知我們,我們會(huì)遵循相關(guān)法律法規(guī)采取措施刪除相關(guān)內(nèi)容。


 
[ 技術(shù)前沿搜索 ]  [ 加入收藏 ]  [ 告訴好友 ]  [ 打印本文 ]  [ 關(guān)閉窗口 ]

 
 
 
一周資訊排行
圖文推薦