“光是春節(jié)期間,就有近百家投資機(jī)構(gòu)托人介紹,看看有沒有機(jī)會投資DeepSeek。”
面對國內(nèi)AI公司深度求索發(fā)布的大模型DeepSeek的現(xiàn)象級走紅,某天使投資人向澎湃新聞記者坦言,“我們需要思考,為什么像DeepSeek這樣的項(xiàng)目,之前竟被我們錯過了?!?/p>
DeepSeek技術(shù)熱潮引發(fā)全球性震撼,大洋彼岸多家科技巨頭股價應(yīng)聲暴跌,人工智能龍頭英偉達(dá)更是曾經(jīng)一夜之間跌去4.3萬億元市值。
“DeepSeek沒有推廣預(yù)算,也沒有千萬年薪挖人,就是目標(biāo)明確地投入研究、發(fā)布產(chǎn)品?!鄙鲜鐾顿Y人評論。另一家大模型獨(dú)角獸向記者透露,“DeepSeek創(chuàng)始人梁文鋒是一個有AI信仰的人,他堅(jiān)持的技術(shù)浪漫主義,在業(yè)內(nèi)非常知名?!?/p>
“不要因?yàn)樽冯SDeepSeek,而錯過下一個DeepSeek,我們需要的不是一擁而上地追捧和模仿,人工智能時代將倒逼人類回歸價值本源?!睆?fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院教授、上海市數(shù)據(jù)科學(xué)重點(diǎn)實(shí)驗(yàn)室主任肖仰華告訴記者。
在他看來,DeepSeek的崛起,背后是中國AI力量的縮影,一批類似DeepSeek的人工智能創(chuàng)業(yè)公司正在站上世界舞臺展露頭角。
為何是DeepSeek殺出重圍
“去年的我對DeepSeek愛答不理,現(xiàn)在是高攀不起了。”在上海某AI公司擔(dān)任算法工程師的陶如對澎湃新聞記者笑言,身為國內(nèi)頂尖高校的算法畢業(yè)生,去年他曾經(jīng)接到過DeepSeek的橄欖枝,最后卻因?yàn)閾?dān)心公司不夠知名、不會專注投入AI而放棄。
在社交媒體上,不少應(yīng)屆生曬出DeepSeek的入職邀請,言辭之間頗為惋惜。
同樣“錯失”DeepSeek的還有一圈投資機(jī)構(gòu),“DeepSeek公司高層明確對商業(yè)化不感興趣,只想做技術(shù)研究。而投資機(jī)構(gòu)需要通過公司進(jìn)行商業(yè)化變現(xiàn),對公司有收入利潤和資本化訴求,還需要創(chuàng)始人讓渡一定程度的股權(quán)和自由?!币晃煌顿Y人坦言,實(shí)際上,AI投資的從業(yè)者,沒有人不知道DeepSeek,早在爆火之前,就有人伸去了橄欖枝。
但最終的結(jié)局是,沒有一家VC(風(fēng)投機(jī)構(gòu))成功地投進(jìn)了這家公司。
有了解DeepSeek人士向記者透露,自己曾經(jīng)面試過一些AI領(lǐng)域的人才,最后拒絕了自己的公司,去了DeepSeek,理由是他們科研氛圍好,是一個真正做事的團(tuán)隊(duì)。
“從薪資待遇來看,DeepSeek在業(yè)內(nèi)僅處于中等水平,并非最高?!彼寡?,“人才密度或許比不上頭部大廠,不是大廠的人不聰明,而是大廠的聰明人在技術(shù)之外耗費(fèi)了太多精力。大廠雖薪資優(yōu)厚,但內(nèi)部斗爭也較為激烈,想要心無旁騖地搞技術(shù),反而不如DeepSeek這樣的技術(shù)公司純粹 ?!?/p>
“DeepSeek的火爆出圈有偶然因素,但更多是必然。”肖仰華告訴記者。
“它背后的母公司幻方資本,在量化交易和智能金融領(lǐng)域有強(qiáng)大技術(shù)實(shí)力和算力基礎(chǔ)。在2022年底OpenAI剛推出ChatGPT時,國內(nèi)擁有萬卡集群的,除了幻方?jīng)]有幾家。此外,在金融領(lǐng)域匯聚了大量AI相關(guān)人才,也讓DeepSeek具備了深厚的人才優(yōu)勢?!?/p>
“更重要的是心態(tài)上的變化。”肖仰華坦言,過去的AI企業(yè)大多急于求成,忙著刷榜、宣傳、變現(xiàn)和給資本交代,而DeepSeek心態(tài)從容,專注技術(shù)探索,允許團(tuán)隊(duì)基于好奇心驅(qū)動研發(fā),不急于商業(yè)變現(xiàn)。在環(huán)境因素上,DeepSeek公司所在的杭州創(chuàng)新環(huán)境先進(jìn),政府營造了寬容、允許試錯和探索的氛圍,只搭建平臺,而不干預(yù)企業(yè)的創(chuàng)新方向,這非常利于企業(yè)發(fā)展。
北京郵電大學(xué)智能交互設(shè)計(jì)專業(yè)副教授譚劍認(rèn)為,DeepSeek帶來的關(guān)鍵變革意味著,隨著模型成本下降,在未來,高水平的AI應(yīng)用將由中小企業(yè)接手推動、形成“百花齊放”的局面,并在中短期利好云計(jì)算、邊緣計(jì)算、服務(wù)器這三類廠商?!澳壳?,三大運(yùn)營商和眾多互聯(lián)網(wǎng)計(jì)算服務(wù)平臺已經(jīng)接入了DeepSeek并提供互聯(lián)網(wǎng)訪問,可以預(yù)測,隨著全民注冊AI服務(wù),這些傳統(tǒng)云服務(wù)和計(jì)算平臺的營收將穩(wěn)定上升?!?/p>
中國不止有DeepSeek
DeepSeek的爆火出圈,也讓外界看到,中國在大模型產(chǎn)業(yè)已經(jīng)形成一批頗具實(shí)力和影響力的公司,其中有字節(jié)跳動、阿里、騰訊等大廠身影,也有月之暗面、智譜、MiniMax等初創(chuàng)企業(yè)。
在DeepSeek火爆全網(wǎng)后的大年初一,阿里云通義團(tuán)隊(duì)發(fā)布旗艦?zāi)P汀癚wen2.5-Max”,成為第二家可以比肩美國OpenAI公司o1系列的中國大語言模型,再次引發(fā)震動。
據(jù)第三方平臺榜單排名顯示,“Qwen2.5-Max”以1332分排總榜第7名,超過深度求索的“DeepSeek-V3”以及OpenAI的“o1-mini”。而在數(shù)學(xué)和編程方面,“Qwen2.5-Max”則排名第1,在Hard prompts方面排名第2。
AI獨(dú)角獸“月之暗面”成立于2023年4月,法定代表人楊植麟畢業(yè)于清華大學(xué)。他在美國卡內(nèi)基梅隆大學(xué)獲得了博士學(xué)位,并在北京創(chuàng)業(yè)。據(jù)第三方機(jī)構(gòu)數(shù)據(jù),截至1月,月之暗面的企業(yè)估值已達(dá)到33億美元。
位于上海的人工智能獨(dú)角獸MiniMax成立于2021年12月,旗下具備文本、語音、音樂、圖像和視頻等多模態(tài)大模型。一個值得關(guān)注的亮點(diǎn)是,在AI出海方面,MiniMax走在了國內(nèi)最前列。最新數(shù)據(jù)顯示,MiniMax旗下海螺AI海外版登頂去年12月全球AI視頻榜,月訪問量超2700萬。
劉華此前向澎湃新聞記者表示,美國在AI大模型技術(shù)方面整體處于領(lǐng)先地位,而在語音、視頻等細(xì)分領(lǐng)域,中國大模型追趕速度很快,例如海螺AI和快手旗下的可靈大模型等都在美國有廣泛應(yīng)用,目前在這些領(lǐng)域,兩國技術(shù)水平已達(dá)到不相伯仲的階段。
“實(shí)際上,如今美國在大模型技術(shù)的迭代和演進(jìn)速度相比之前確實(shí)有所放緩?!眲⑷A表示,“目前,美國頭部企業(yè)已經(jīng)或正在構(gòu)建10萬卡集群。甚至,為了訓(xùn)練更先進(jìn)的模型,計(jì)劃打造百萬卡級別的集群。但百萬卡集群的實(shí)現(xiàn)面臨諸多挑戰(zhàn),其中當(dāng)?shù)厥欠裼写笮碗娏υO(shè)施支撐是關(guān)鍵因素之一 。”
在這樣的背景下,中國企業(yè)正快速追平和趕超美國的競爭對手。DeepSeek宛如一條“鯰魚”,再次激發(fā)AI競賽的活力。
“大模型領(lǐng)域目前尚未形成絕對的護(hù)城河,行業(yè)仍處于發(fā)展早期,距離成熟階段還有很長的路要走?!盇I行業(yè)資深觀察者陳承向澎湃新聞記者表示,他猜測,大模型行業(yè)的競爭和內(nèi)卷在DeepSeek爆火后會進(jìn)一步加劇。
“廠商之間的激烈競爭,最受益的無疑是大模型的使用者,也就是普通用戶,他們將享受到大模型能力不斷進(jìn)化、性價比不斷提升所帶來的紅利 ?!?/p>
一家知名AI公司向記者表示,DeepSeek并非完美無缺,v3模型主要在數(shù)學(xué)和代碼等能力方面比較突出,其他通用類文本生成、理解等方面效果還有提升空間,關(guān)于其特別低的訓(xùn)練成本,并不包括所有成本。(編注:v3公布的訓(xùn)練成本約557.6萬美元。有第三方報(bào)告指出,557.6萬美元這個數(shù)字主要指的是模型預(yù)訓(xùn)練的GPU成本,并不包括研發(fā)、數(shù)據(jù)收集、清理等其他重要成本。)
“DeepSeek爆火之后,無疑會激發(fā)行業(yè)內(nèi)各方進(jìn)一步投入到良性的技術(shù)競賽中,這對整個行業(yè)的發(fā)展來說是極為有利的。目前在大模型賽道里,各家企業(yè)都在全力以赴地研發(fā),力求取得更優(yōu)異的表現(xiàn),這種充滿活力的競爭氛圍十分難得?!绷硪患褹I創(chuàng)業(yè)公司內(nèi)部人士向記者坦言,“在這個階段,誰會掉隊(duì)、誰能脫穎而出都還是未知數(shù)。大家為了在競爭中生存和發(fā)展,肯定會投入更多資源,整個行業(yè)充滿了活力和發(fā)展?jié)摿??!?/p>
“DeepSeek效應(yīng)”如何發(fā)酵
FutureLabs未來實(shí)驗(yàn)室首席專家胡延平表示,DeepSeek已經(jīng)成為了一種效應(yīng),包含了四個方面,即算力成本效應(yīng)、用戶引爆效應(yīng)、信心提振效應(yīng)和開源生態(tài)效應(yīng):“接下來會出現(xiàn)一個新的現(xiàn)象,很多略有實(shí)力的相關(guān)企業(yè)都會基于基座大模型來做各種各樣的后訓(xùn)練、蒸餾微調(diào)、結(jié)合知識庫等等,然后去面向千行百業(yè),形成一個AI 2.0時代大模型產(chǎn)業(yè)的腰部后市場。”
基于這樣的觀察,胡延平認(rèn)為,AI行業(yè)接下來有三個有潛力的方向:第一個方向是在以大語言模型為代表的AI 2.0的第一個周期結(jié)束后,以多模態(tài)、具身智能、時空智能等為代表的第二個周期;第二個方向是AI大模型的后市場,即腰部和長尾的生態(tài)涌現(xiàn);第三個方向是端側(cè)AI Agent(智能體),特別是能夠和工作流以及每個人的個性化需求相結(jié)合的部分。
在肖仰華看來,很多AI初創(chuàng)企業(yè)有良好的高校背景,不缺人才和資金,但普遍存在心態(tài)著急的問題,過于急切,反而不利于原始創(chuàng)新。
“企業(yè)需要更寬松的發(fā)展氛圍,按照自身節(jié)奏和戰(zhàn)略方向穩(wěn)步發(fā)展?!彼J(rèn)為,實(shí)際上,現(xiàn)在各地政府都很關(guān)心AI企業(yè),但缺乏真正優(yōu)秀、拿得出手的企業(yè),“政府的關(guān)心要適度,搭建好環(huán)境和平臺后就不過多干預(yù)。過度關(guān)心可能會打亂企業(yè)發(fā)展節(jié)奏,做聰明的關(guān)心者更重要。”
此外,DeepSeek的出現(xiàn),證明了AI企業(yè)依靠燒錢卷“投流”“獲客”的路徑是不可行的,以往中國AI大模型“卷”算力、“卷”價格、“卷”獲客、“卷”變現(xiàn)能力,如今人們更認(rèn)可長期主義的原始創(chuàng)新,企業(yè)應(yīng)當(dāng)思考架構(gòu)創(chuàng)新和低成本研發(fā),而不是一味燒錢。
“人工智能大模型是一個風(fēng)險極大的投資賽道,投資金額巨大,而最終存活下來的只有幾家企業(yè),這意味著對很多企業(yè)的投資都會失敗?!币患掖竽P推髽I(yè)副總裁告訴澎湃新聞記者,在目前的環(huán)境下,美元基金因?yàn)槟假Y受限的原因,無法實(shí)現(xiàn)傳統(tǒng)的“投融管退”路徑,“大模型行業(yè)必須要接受一個現(xiàn)實(shí),政府引導(dǎo)基金會發(fā)揮更重要的作用?!?/p>
從形式上來看,他建議,可以參考現(xiàn)在國內(nèi)、國際都比較通行的算力券。比如,現(xiàn)在國企可以建立算力集群為大模型企業(yè)提供算力,投資入股之后,大部分的投資資金又會以算力租賃費(fèi)用的形式重新回到國資企業(yè)手里。
肖仰華認(rèn)為,大模型行業(yè)掀起的創(chuàng)業(yè)浪潮,意味著民營企業(yè)和小微企業(yè)在國家科技創(chuàng)新體系中扮演著重要角色,未來也將帶動更多企業(yè)蓬勃發(fā)展。“企業(yè)在初創(chuàng)和小微階段,往往最具好奇心和創(chuàng)造力。好奇心就像珍貴的火種,彌足珍貴,整個社會都應(yīng)該精心呵護(hù),讓創(chuàng)新的種子在適宜的土壤中不斷生根發(fā)芽,茁壯成長 。”