今年,以ChatGPT為代表的新AI熱潮奔涌而來(lái),“大模型熱潮”也從國(guó)外涌向了國(guó)內(nèi)。
國(guó)產(chǎn)大模型“神仙打架”
AI大模型,指的是擁有數(shù)百萬(wàn)以上參數(shù)規(guī)模的深度神經(jīng)網(wǎng)絡(luò)模型。這類模型在經(jīng)過(guò)專門的訓(xùn)練后,即可對(duì)海量數(shù)據(jù)進(jìn)行復(fù)雜處理和任務(wù)處理。由OpenAI開(kāi)發(fā)的ChatGPT之所以擁有強(qiáng)大的對(duì)話交互能力,背靠的正是名為“GPT”的AI預(yù)訓(xùn)練模型。
繼百度文心一言之后,三六零、阿里、華為、京東、騰訊等大模型陸續(xù)浮出水面,國(guó)內(nèi)AI大模型的追逐戰(zhàn)正在愈演愈烈。
4月7日,阿里云公開(kāi)“阿里版GPT”通義千問(wèn)邀測(cè)入口,引發(fā)強(qiáng)烈關(guān)注。4月11日,阿里云再放大招——阿里巴巴所有產(chǎn)品未來(lái)將接入“通義千問(wèn)”大模型。與百度于3月中旬上線的“文心一言”大模型工具類似,“通義千問(wèn)”也具備與用戶進(jìn)行多輪對(duì)話的能力,并支持代碼編程、文案創(chuàng)作等功能。
4月8日,在人工智能大模型技術(shù)高峰論壇上,華為云人工智能領(lǐng)域首席科學(xué)家田奇介紹了盤古大模型的進(jìn)展及其應(yīng)用狀況。據(jù)介紹,該模型利用了深度學(xué)習(xí)與自然語(yǔ)言處理技術(shù),并且采用海量中文語(yǔ)料庫(kù)對(duì)其進(jìn)行培訓(xùn)。
同日,京東也宣布將在今年發(fā)布“ChatJD”,定位為產(chǎn)業(yè)版本ChatGPT。目前京東的大模型主要聚焦于文本、語(yǔ)音、對(duì)話和數(shù)字人生成等4個(gè)方面開(kāi)展工作,比如給商品自動(dòng)生成長(zhǎng)度不等的文案,包括標(biāo)題、賣點(diǎn)文案和直播文案等。
4月9日,360宣布,將基于360GPT大模型開(kāi)發(fā)人工智能產(chǎn)品矩陣“360智腦”,未來(lái)將其率先落地在“360搜索”場(chǎng)景,后續(xù)面向電商、營(yíng)銷、辦公等場(chǎng)景深度落地。
4月10日,商湯科技公布“日日新SenseNova”大模型體系雛形,并現(xiàn)場(chǎng)演示了該模型體系下“商量SenseChat”語(yǔ)言工具的超長(zhǎng)文本閱讀理解、健康咨詢等創(chuàng)新能力。
同日,游戲起家的昆侖萬(wàn)維也對(duì)外預(yù)告,不日將發(fā)布和奇點(diǎn)智源合作自研的大模型成果——“天工”3.5,并宣稱這是“中國(guó)第一個(gè)真正實(shí)現(xiàn)智能涌現(xiàn)的國(guó)產(chǎn)大語(yǔ)言模型”。
4月11日,字節(jié)跳動(dòng)旗下辦公軟件飛書(shū)發(fā)布視頻,預(yù)告專屬智能助手“My AI”,區(qū)別于其他大廠的AI智能工具,“My AI”似乎無(wú)意再?gòu)?fù)制一個(gè)類似ChatGPT的語(yǔ)言大模型,更類似微軟推出的Office Copilot。
4月14日,騰訊云正式發(fā)布新一代HCC(High-Performance Computing Cluster)高性能計(jì)算集群。騰訊方面實(shí)測(cè)顯示,騰訊云新一代集群的算力性能較前代提升高達(dá)3倍,是國(guó)內(nèi)性能最強(qiáng)的大模型計(jì)算集群。
如今,包括百度、騰訊、阿里、華為、京東、360等多家國(guó)內(nèi)科技巨頭均已宣布在生成式AI產(chǎn)業(yè)有相應(yīng)布局,5月,騰訊混元大模型也即將發(fā)布。
與此同時(shí),大模型在學(xué)術(shù)界也成了“香餑餑”。早在今年2月,復(fù)旦大學(xué)邱錫鵬教授團(tuán)隊(duì)發(fā)布國(guó)內(nèi)首個(gè)類ChatGPT模型MOSS。3月,中國(guó)人民大學(xué)盧志武團(tuán)隊(duì)自主研發(fā)多模態(tài)對(duì)話大模型并落地了第一款應(yīng)用“元乘象ChatImg”……
根據(jù)公開(kāi)信息不完全統(tǒng)計(jì),目前國(guó)內(nèi)至少已經(jīng)有30多家大模型亮相,其中不乏參數(shù)規(guī)模甚至超過(guò)ChatGPT規(guī)模的大模型,廠商涵蓋了互聯(lián)網(wǎng)巨頭、AI上市公司、服務(wù)器龍頭企業(yè)、科研院所與一級(jí)市場(chǎng)創(chuàng)業(yè)公司。
此外,隨著ChatGPT的火爆,國(guó)內(nèi)還火速興起了AI大模型的創(chuàng)業(yè)風(fēng)潮。
2023年2月,原美團(tuán)聯(lián)合創(chuàng)始人王慧文發(fā)布“AI英雄榜”,并火速啟動(dòng)A輪融資;隨后,創(chuàng)新工場(chǎng)CEO李開(kāi)復(fù)、前搜狗CEO王小川、前京東AI掌門人周伯文、出門問(wèn)問(wèn)創(chuàng)始人李志飛等掀起了AI大模型創(chuàng)業(yè)狂潮;阿里AI大牛賈揚(yáng)清亦被爆出投身AI創(chuàng)業(yè);還有一系列整合AI的新產(chǎn)品雨后春筍般涌現(xiàn)。
可以預(yù)計(jì),在中國(guó)規(guī)模龐大的互聯(lián)網(wǎng)用戶的支撐下,國(guó)內(nèi)企業(yè)在算法和算力上有望不斷實(shí)現(xiàn)突破并取得領(lǐng)先。從算力到應(yīng)用,已經(jīng)按下了AI大模型發(fā)展的加速鍵。
國(guó)產(chǎn)大模型多為ToB
當(dāng)前,國(guó)產(chǎn)大語(yǔ)言模型均未對(duì)公眾大面積開(kāi)放,也沒(méi)有明確的ToC入口,未來(lái)發(fā)展大多也走ToB路線。
當(dāng)前已正式上線的三家中,百度、商湯有關(guān)負(fù)責(zé)人曾向媒體表示,自家大模型為toB產(chǎn)品。阿里方面在4月11日舉辦的阿里云峰會(huì)上也宣稱,未來(lái)“通義千問(wèn)”將主要面對(duì)企業(yè)定制個(gè)性化服務(wù)。
而在已有消息的幾家中,科大訊飛、網(wǎng)易有道兩家皆已透露了基于公司類GPT技術(shù)所要落地的產(chǎn)品;京東的“ChatJD”明確定位為產(chǎn)業(yè)版本ChatGPT;而華為“盤古”系列下的NLP大模型主要面向智能文檔搜索、智能ERP、小語(yǔ)種大模型等行業(yè),多處理類案檢索、企業(yè)財(cái)務(wù)異常檢測(cè)等商業(yè)場(chǎng)景。
整體看來(lái),國(guó)內(nèi)大語(yǔ)言模型賽道的公司在開(kāi)發(fā)模型后,更傾向于將相關(guān)模型嫁接到自家的C端服務(wù)中,或者走私有化部署、企業(yè)定制等路線。
而在與海外相同賽道的公司對(duì)比之后,不難得出第二個(gè)特點(diǎn)——相比海外,國(guó)內(nèi)廠商更傾向于“每家必備”一個(gè)大模型。
當(dāng)前,海外頭部科技公司如OpenAI、谷歌等,其開(kāi)發(fā)都以基礎(chǔ)模型(Foundation Models)為主,不管是ChatGPT、Gpt4,還是PaLM-E,都是類似AI基礎(chǔ)設(shè)施的基礎(chǔ)大模型。其他公司,要么索性走開(kāi)源社區(qū)的路線,要么像美國(guó)云服務(wù)巨頭Salesforce一樣,直接與OpenAI合作接入ChatGPT使用。在某種程度上,可以說(shuō)是“大家都在規(guī)定范圍里各自賺錢”。
誰(shuí)是下一個(gè)OpenAI?
國(guó)內(nèi)科技企業(yè)圍繞AI大模型上演“百團(tuán)大戰(zhàn)”背后,誰(shuí)能憑硬實(shí)力拔得頭籌?
IDC中國(guó)助理研究總監(jiān)盧言霞接受中新經(jīng)緯采訪時(shí)認(rèn)為,當(dāng)前各家公司密集發(fā)布大模型或公布大模型進(jìn)展,主要還是被市場(chǎng)熱度倒逼的?!笆聦?shí)上,行業(yè)成熟期遠(yuǎn)未到來(lái),目前仍是起步階段。但這種密集發(fā)布會(huì)推動(dòng)大模型技術(shù)的落地,加速商業(yè)化。”盧言霞說(shuō)。
中國(guó)電子商務(wù)專家服務(wù)中心副主任、知名互聯(lián)網(wǎng)專家郭濤在接受證券日?qǐng)?bào)采訪時(shí)表示:“目前,國(guó)內(nèi)AI大模型正處在從實(shí)驗(yàn)室走向大規(guī)模商業(yè)化的早期階段,存在核心技術(shù)不成熟、成熟落地場(chǎng)景較少、生態(tài)系統(tǒng)不健全等突出問(wèn)題。”深度科技研究院院長(zhǎng)張孝榮也認(rèn)為,國(guó)內(nèi)AI大模型研發(fā)的水平還在實(shí)驗(yàn)室階段,相關(guān)算法尚未成型。
浙江大學(xué)國(guó)際聯(lián)合商學(xué)院數(shù)字經(jīng)濟(jì)與金融創(chuàng)新研究中心聯(lián)席主任盤和林進(jìn)一步介紹道,大模型生成式AI是弱智能向強(qiáng)智能的跨越,國(guó)內(nèi)AI企業(yè)尚未跨越關(guān)鍵門檻。當(dāng)前國(guó)內(nèi)AI主要是中小模型,比如人臉識(shí)別,圖像識(shí)別,簡(jiǎn)單語(yǔ)音對(duì)話,語(yǔ)義理解,應(yīng)用范圍很廣,但在大模型應(yīng)用方面,一方面海外更成熟的AI如今很難在國(guó)內(nèi)落地,而國(guó)內(nèi)又缺乏相關(guān)產(chǎn)品,所以還沒(méi)有應(yīng)用。
值得注意的是,在大模型“百花齊放”的當(dāng)下,大多數(shù)公司看到的是機(jī)會(huì),但也不排除有些公司是“炒概念”。對(duì)于投資者來(lái)說(shuō),還需要仔細(xì)甄別其中的風(fēng)險(xiǎn)。
民生證券研報(bào)認(rèn)為,大模型表面不再稀缺后,實(shí)質(zhì)格局更像“太極拳”:易學(xué)難精。因?yàn)殚_(kāi)源基礎(chǔ)以及大公司本身的算力儲(chǔ)備與資金實(shí)力,單純發(fā)布一個(gè)大模型門檻沒(méi)有市場(chǎng)想象那么高。但是能夠擁有高質(zhì)量數(shù)據(jù)場(chǎng)景助力持續(xù)迭代,使得逐步性能逼近ChatGPT的大模型預(yù)計(jì)最終仍是“鳳毛麟角”。市場(chǎng)會(huì)逐步凝結(jié)共識(shí):得數(shù)據(jù)者得天下,數(shù)據(jù)是差異化競(jìng)爭(zhēng)關(guān)鍵。
多國(guó)“圍剿”ChatGPT,我國(guó)也出手監(jiān)管AI
從國(guó)外AI大模型發(fā)展邏輯來(lái)看,當(dāng)AI強(qiáng)大到一定地步,如GPT-4時(shí),監(jiān)管就顯得很有必要。
當(dāng)?shù)貢r(shí)間3月31日,意大利個(gè)人數(shù)據(jù)保護(hù)局宣布,從即日起禁止使用聊天機(jī)器人ChatGPT,并限制開(kāi)發(fā)這一平臺(tái)的OpenAI公司處理意大利用戶信息。
隨后,4月3日,德國(guó)聯(lián)邦數(shù)據(jù)保護(hù)專員Ulrich Kelber表示,德國(guó)可能會(huì)效仿意大利,以數(shù)據(jù)安全方面的擔(dān)憂為由,屏蔽ChatGPT。
法國(guó)和愛(ài)爾蘭方面也聯(lián)系了意大利數(shù)據(jù)監(jiān)管機(jī)構(gòu),并討論了調(diào)查結(jié)果,同時(shí),加拿大隱私專員辦公室(OPC)宣布開(kāi)始調(diào)查ChatGPT背后的公司OpenAI,涉及“指控OpenAI未經(jīng)同意收集、使用和披露個(gè)人信息”等投訴。
不僅如此,多國(guó)企業(yè)和機(jī)構(gòu)也開(kāi)始調(diào)查或采取措施限制使用該軟件。
3月末,韓國(guó)三星半導(dǎo)體部門發(fā)生了3起因員工在ChatGPT上輸入設(shè)備信息及重要會(huì)議摘要,導(dǎo)致公司機(jī)密外泄風(fēng)險(xiǎn)陡增的事件。
臺(tái)積電、軟銀、日立、富士通、日本瑞穗金融集團(tuán)等企業(yè)也開(kāi)始限制ChatGPT等交互式人工智能服務(wù)在商業(yè)運(yùn)作中的使用。
此外,摩根大通已經(jīng)限制員工使用ChatGPT,亞馬遜、微軟和沃爾瑪也已向員工發(fā)出警告,要求員工謹(jǐn)慎使用生成式AI服務(wù),埃森哲則警告員工不要將客戶信息暴露在ChatGPT中。
與此同時(shí),另一個(gè)引發(fā)關(guān)注的焦點(diǎn)是,如今GPT-4可能具備“自我進(jìn)化”的能力。前谷歌大腦研究工程師Eric Jang發(fā)現(xiàn),GPT-4能夠以合理的方式批評(píng)自己的成果,“AI是否能夠超越人類”這個(gè)終極難題再度浮現(xiàn)。
曾有微軟研究員發(fā)推說(shuō)GPT-4根本無(wú)法寫出“不押韻”的詩(shī)歌。然而,當(dāng)再去詢問(wèn)GPT-4是否完成了任務(wù)。這時(shí),它道歉后,生成了一個(gè)不押韻的詩(shī),可以說(shuō)是滿分。
似乎,人工智能發(fā)展到現(xiàn)在,已經(jīng)成為令人“不安”的存在。
國(guó)內(nèi)方面,國(guó)家互聯(lián)網(wǎng)信息辦公室就《生成式人工智能服務(wù)管理辦法(征求意見(jiàn)稿)》(簡(jiǎn)稱《征求意見(jiàn)稿》)公開(kāi)征求意見(jiàn),《征求意見(jiàn)稿》共21條,從生成式人工智能服務(wù)商的準(zhǔn)入,到算法設(shè)計(jì)、訓(xùn)練數(shù)據(jù)選擇、模型到內(nèi)容,以及用戶實(shí)名和個(gè)人隱私、商業(yè)秘密等方面提出了相關(guān)要求。這意味著,當(dāng)下爆火的生成式AI產(chǎn)業(yè)將迎來(lái)首份監(jiān)管文件。
其中管理辦法涉及的生成式人工智能包括基于算法、模型、規(guī)則生成文本、圖片、聲音、視頻、代碼等內(nèi)容的技術(shù)。并對(duì)利用生成式人工智能產(chǎn)品提供聊天和文本、圖像、聲音生成等服務(wù)的組織和個(gè)人(簡(jiǎn)稱“提供者”)的責(zé)任進(jìn)行了規(guī)定。
對(duì)于生成式人工智能產(chǎn)品,提供者需要按照《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》對(duì)生成的圖片、視頻等內(nèi)容進(jìn)行標(biāo)識(shí)等。
在合理的控制下,大模型成為AI時(shí)代的基礎(chǔ)設(shè)施已是可以預(yù)見(jiàn)的事。在日趨激烈的國(guó)產(chǎn)AI賽道上,誰(shuí)能更好地把控算法、算力、數(shù)據(jù)、產(chǎn)品、場(chǎng)景這五個(gè)維度,誰(shuí)就能獲得更多的可能性。