文 | 闌夕
這幾天刷推很明顯的感覺到英文技術(shù)社區(qū)對(duì)中國(guó)AI產(chǎn)業(yè)的進(jìn)步速度處于一種半震動(dòng)半懵逼的狀態(tài),應(yīng)激來(lái)源主要是兩個(gè),一個(gè)是宇樹(Unitree)的輪足式機(jī)器狗B2-W,另一個(gè)是開源MoE模型DeepSeek-V3。
宇樹在早年基本上屬于是波士頓動(dòng)力的跟班,產(chǎn)品形態(tài)完全照貓畫虎,商業(yè)上瞄準(zhǔn)的也是低配平替生態(tài)位,沒有太大的吸引力,但從B系列型號(hào)開始,宇樹的機(jī)器狗就在靈活性上可以和波士頓動(dòng)力平起平坐了。
B2-W的意外在于切換了技術(shù)線,用運(yùn)動(dòng)性更高但平衡性同時(shí)也更難的動(dòng)輪方案取代了B2還在沿用四足方案,然后在一年時(shí)間里完成了能在戶外環(huán)境里跋山涉水的訓(xùn)練,很多美國(guó)人在視頻底下說(shuō)這一定是CGI的畫面,不知道是真串還是心態(tài)炸了。
波士頓在機(jī)器狗身上也曾短暫用過(guò)動(dòng)輪方案,或者說(shuō)它測(cè)過(guò)的方案遠(yuǎn)比宇樹要多——公司成立時(shí)長(zhǎng)擺在那里——但是作為行業(yè)先驅(qū),它連保持一家美國(guó)公司的實(shí)體都辦不到了。
現(xiàn)代汽車2020年以打折價(jià)從軟銀手里買了波士頓動(dòng)力,正值軟銀賬面巨虧需要回血,而軟銀當(dāng)初又是在2017年從Google那里買到手的,Google為什么賣呢,因?yàn)橛X得太燒錢了,虧不起。
這理由就很離譜,美國(guó)的風(fēng)險(xiǎn)資本系統(tǒng)對(duì)于虧損的容忍度本來(lái)就是全球最高的,沒有之一,對(duì)于前沿性的研究,砸錢畫餅是再尋常不過(guò)了的——看這兩年硅谷在AI上的投入產(chǎn)出比就知道了——但波士頓動(dòng)力何以在獨(dú)一檔的地位上被當(dāng)成不良資產(chǎn)賣來(lái)賣去?
那頭房間里的大象,美國(guó)的科技行業(yè)普遍都裝作看不到:美國(guó)人,如今的美國(guó)人,從投行到企業(yè),從CEO到程序員,從紐約到灣區(qū),對(duì)制造業(yè)的厭棄已經(jīng)成為本能了。
A16Z的合伙人馬克·安德森2011年在‘華爾街日?qǐng)?bào)’寫了那篇流傳甚廣的代表作‘軟件吞噬世界’,大概意思是,邊際成本極低的軟件公司注定接管一切水草繁盛之地,和這種可以提供指數(shù)級(jí)增長(zhǎng)的生意比起來(lái),其他的行業(yè)都不夠看。
并不是說(shuō)馬克·安德森的表達(dá)有問(wèn)題,后面這十幾年來(lái)的現(xiàn)實(shí)走向,也確實(shí)在證明這條攫取規(guī)?;麧?rùn)的回報(bào)是最高的,但美國(guó)人的路徑依賴到最后必然帶來(lái)一整代人喪失制造能力的結(jié)果。
這里說(shuō)的喪失制造能力,并不是說(shuō)喪失制造興趣或是熱情,我前段時(shí)間拜訪了深圳一家逆向海淘公司,業(yè)務(wù)就是把華強(qiáng)北的電子配件做成可索引的結(jié)構(gòu)化目錄,然后提供從采購(gòu)到驗(yàn)貨再到發(fā)包的全流程服務(wù),最大的買方就是美國(guó)的DIY市場(chǎng)和高校學(xué)生,他們之所以要不遠(yuǎn)萬(wàn)里的等上幾個(gè)星期委托中國(guó)人來(lái)買東西,就是因?yàn)樵谥Z大的美國(guó)本土,根本找不到供應(yīng)鏈。
然后那些學(xué)生也只有在讀書時(shí)才有真正嘗試制造某些東西的機(jī)會(huì),到了要去大公司里上班領(lǐng)薪后,再也沒人愿意把手弄臟了。
但軟件終究不能脫離硬件運(yùn)行,哪怕硬件生產(chǎn)的附加值再不夠看,基于采集一手物理數(shù)據(jù)的入口,制造商腰板硬起來(lái)后去做全套解決方案,只取決于能不能組建好的工程師團(tuán)隊(duì),反過(guò)來(lái)卻不一樣,制造訂單長(zhǎng)期外包出去,它就變成產(chǎn)業(yè)鏈配套回不來(lái)了。
所以像是多旋翼無(wú)人機(jī)和四足機(jī)器狗這類新興科技萌芽的原型機(jī)一般都還是產(chǎn)自有著試錯(cuò)資本的歐美,也就是所謂‘從零到一’的過(guò)程,而在‘從一到十’的落地階段,中國(guó)的追趕成果就會(huì)開始密集呈現(xiàn),進(jìn)入‘從十到百’的量產(chǎn)之后,中國(guó)的供應(yīng)鏈成本直接殺死比賽。
波士頓動(dòng)力的機(jī)器人最早在網(wǎng)上爆火的時(shí)候,Google X的負(fù)責(zé)人在內(nèi)部備忘錄里說(shuō)他已經(jīng)和媒體溝通了,希望不要讓視頻和Google扯上太大關(guān)系,是不是很迷惑,這么牛逼的事情,你作為母公司非但不高興,還想躲起來(lái),現(xiàn)在你們懂得這種顧慮從何而來(lái)了,就是覺得貴為軟件巨頭的Google去卷袖子干制造的活兒太卑賤了唄。
當(dāng)然美國(guó)也還有馬斯克這樣的建設(shè)者(Builder),但你要知道馬斯克的故事之所以動(dòng)人,是因?yàn)樗@樣的人現(xiàn)在是極度稀缺的,而且長(zhǎng)期以來(lái)不受主流科技業(yè)界待見,完全是靠逆常識(shí)的成就——造汽車,造火箭,造隧道,這都是硅谷唯恐避之不及的事情——去一步步打臉打出來(lái)的名聲。
如果說(shuō)宇樹是在硬件上引起了一波懷疑現(xiàn)實(shí)的熱度,那么DeepSeek則在軟件的原生地盤,把大模型廠商都給硬控住了。
在微軟、Meta、Google都在奔著10萬(wàn)卡集群去做大模型訓(xùn)練時(shí),DeepSeek在2000個(gè)GPU上,花了不到600萬(wàn)美金和2個(gè)月的時(shí)間,就實(shí)現(xiàn)了對(duì)齊GPT-4o和Claude 3.5 Sonnet的測(cè)試結(jié)果。
DeepSeek-V2在半年前就火過(guò)一波,但那會(huì)兒的敘事還相對(duì)符合舊版本的預(yù)期:中國(guó)AI公司推出了低成本的開源模型,想要成為行業(yè)里的價(jià)格屠夫,中國(guó)人就擅長(zhǎng)做這種便宜耐用的東西,只要不去和頂級(jí)產(chǎn)品比較,能用是肯定的。
但V3則完全不同了,它把成本降了10倍以上,同時(shí)質(zhì)量卻能比肩t1陣營(yíng),關(guān)鍵還是開源的,相關(guān)推文的評(píng)論區(qū)全是‘中國(guó)人咋做到的?’
雖然但是,后發(fā)的大模型可以通過(guò)知識(shí)蒸餾等手段實(shí)現(xiàn)性價(jià)比更高的訓(xùn)練——類似你學(xué)習(xí)牛頓三定律的速度降低的斜率也在有利于追趕者,肯定比牛頓本人琢磨出定律的速度要快——成本,但匪夷所思的效率提升,是很難用已知訓(xùn)練方法來(lái)歸納的,它一定是是在底層架構(gòu)上做了不同于其他巨頭的創(chuàng)新。
另一個(gè)角度更有意思,如果針對(duì)中國(guó)的AI芯片禁售政策最后產(chǎn)生的后果,是讓中國(guó)的大模型公司不得不在算力受限的約束下實(shí)現(xiàn)了效率更高的解決方案,這種適得其反的劇情就太諷刺了。
DeepSeek的創(chuàng)始人梁文鋒之前也說(shuō)過(guò),公司差的從來(lái)都不是錢,而是高端芯片被禁運(yùn)。
所以中國(guó)的大模型公司,像是字節(jié)和阿里這樣的大廠,卡能管夠,把年收入的1/10拿出來(lái)卷AI,問(wèn)題不大,但初創(chuàng)公司沒這么多彈藥,保持不下牌桌的唯一方法就是玩命創(chuàng)新。
李開復(fù)今年也一直在表達(dá)一個(gè)觀點(diǎn),中國(guó)做AI的優(yōu)勢(shì)從來(lái)不是在不設(shè)預(yù)算上限的情況下去做突破性研究,而是在好、快、便宜和可靠性之間找出最優(yōu)解。
零一和DeepSeek用的都是MoE(混合專家)模式,相當(dāng)于是在事先準(zhǔn)備的高質(zhì)量數(shù)據(jù)集上去做特定訓(xùn)練,不能說(shuō)在跑分上完全沒有水分,但市場(chǎng)并不關(guān)心原理,只要質(zhì)價(jià)比夠看,就一定會(huì)有競(jìng)爭(zhēng)力。
當(dāng)然DeepSeek不太一樣的是,它不太缺卡,2021年就囤了1萬(wàn)張英偉達(dá)A100,那會(huì)兒ChatGPT還沒影呢,和Meta為了元宇宙囤卡卻陰差陽(yáng)錯(cuò)的趕上AI浪潮很像,DeepSeek買那么多卡,是為了做量化交易??
我最早對(duì)梁文鋒有印象,是‘西蒙斯傳’里有他寫的序,西蒙斯是文藝復(fù)興科技公司的創(chuàng)始人,用算法模型去做自動(dòng)化投資的開創(chuàng)者,梁文鋒當(dāng)時(shí)管著600億人民幣的量化私募,寫序?qū)儆陧樌沓烧碌慕o行業(yè)祖師爺致敬。
交待這個(gè)背景,是想說(shuō),梁文鋒的幾家公司,從量化交易做到大模型開發(fā),并不是一個(gè)金融轉(zhuǎn)為科技的過(guò)程,而是數(shù)學(xué)技能在兩個(gè)應(yīng)用場(chǎng)景之間的切換,投資的目的是預(yù)測(cè)市場(chǎng),大模型的原理也是預(yù)測(cè)Token。
后來(lái)看過(guò)幾次梁文鋒的采訪,對(duì)他的印象很好,非常清醒和聰明的一個(gè)人,我貼幾段你們感受一下:
‘暗涌’:大部分中國(guó)公司都選擇既要模型又要應(yīng)用,為什么DeepSeek目前選擇只做研究探索?
梁文鋒:因?yàn)槲覀冇X得現(xiàn)在最重要的是參與到全球創(chuàng)新的浪潮里去。過(guò)去很多年,中國(guó)公司習(xí)慣了別人做技術(shù)創(chuàng)新,我們拿過(guò)來(lái)做應(yīng)用變現(xiàn),但這并非是一種理所當(dāng)然。這一波浪潮里,我們的出發(fā)點(diǎn),就不是趁機(jī)賺一筆,而是走到技術(shù)的前沿,去推動(dòng)整個(gè)生態(tài)發(fā)展。
‘暗涌’:互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)時(shí)代留給大部分人的慣性認(rèn)知是,美國(guó)擅長(zhǎng)搞技術(shù)創(chuàng)新,中國(guó)更擅長(zhǎng)做應(yīng)用。
梁文鋒:我們認(rèn)為隨著經(jīng)濟(jì)發(fā)展,中國(guó)也要逐步成為貢獻(xiàn)者,而不是一直搭便車。過(guò)去三十多年IT浪潮里,我們基本沒有參與到真正的技術(shù)創(chuàng)新里。我們已經(jīng)習(xí)慣摩爾定律從天而降,躺在家里18個(gè)月就會(huì)出來(lái)更好的硬件和軟件。Scaling Law也在被如此對(duì)待。但其實(shí),這是西方主導(dǎo)的技術(shù)社區(qū)一代代孜孜不倦創(chuàng)造出來(lái)的,只因?yàn)橹拔覀儧]有參與這個(gè)過(guò)程,以至于忽視了它的存在。
‘暗涌’:但這種選擇放在中國(guó)語(yǔ)境里,也過(guò)于奢侈。大模型是一個(gè)重投入游戲,不是所有公司都有資本只去研究創(chuàng)新,而不是先考慮商業(yè)化。
梁文鋒:創(chuàng)新的成本肯定不低,過(guò)去那種拿來(lái)主義的慣性也和過(guò)去的國(guó)情有關(guān)。但現(xiàn)在,你看無(wú)論中國(guó)的經(jīng)濟(jì)體量,還是字節(jié)、騰訊這些大廠的利潤(rùn),放在全球都不低。我們創(chuàng)新缺的肯定不是資本,而是缺乏信心以及不知道怎么組織高密度的人才實(shí)現(xiàn)有效的創(chuàng)新。
‘暗涌’:但做大模型,單純的技術(shù)領(lǐng)先也很難形成絕對(duì)優(yōu)勢(shì),你們賭的那個(gè)更大的東西是什么?
梁文鋒:我們看到的是中國(guó)AI不可能永遠(yuǎn)處在跟隨的位置。我們經(jīng)常說(shuō)中國(guó)AI和美國(guó)有一兩年差距,但真實(shí)的gap是原創(chuàng)和模仿之差。如果這個(gè)不改變,中國(guó)永遠(yuǎn)只能是追隨者,所以有些探索也是逃不掉的。英偉達(dá)的領(lǐng)先,不只是一個(gè)公司的努力,而是整個(gè)西方技術(shù)社區(qū)和產(chǎn)業(yè)共同努力的結(jié)果。他們能看到下一代的技術(shù)趨勢(shì),手里有路線圖。中國(guó)AI的發(fā)展,同樣需要這樣的生態(tài)。很多國(guó)產(chǎn)芯片發(fā)展不起來(lái),也是因?yàn)槿狈ε涮椎募夹g(shù)社區(qū),只有第二手消息,所以中國(guó)必然需要有人站到技術(shù)的前沿。
‘暗涌’:很多大模型公司都執(zhí)著地去海外挖人,很多人覺得這個(gè)領(lǐng)域前50名的頂尖人才可能都不在中國(guó)的公司,你們的人都來(lái)自哪里?
梁文鋒:V2模型沒有海外回來(lái)的人,都是本土的。前50名頂尖人才可能不在中國(guó),但也許我們能自己打造這樣的人。
‘暗涌’:所以你對(duì)這件事也是樂觀的?
梁文鋒:我是八十年代在廣東一個(gè)五線城市長(zhǎng)大的。我的父親是小學(xué)老師,九十年代,廣東賺錢機(jī)會(huì)很多,當(dāng)時(shí)有不少家長(zhǎng)到我家里來(lái),基本就是家長(zhǎng)覺得讀書沒用。但現(xiàn)在回去看,觀念都變了。因?yàn)殄X不好賺了,連開出租車的機(jī)會(huì)可能都沒了。一代人的時(shí)間就變了。以后硬核創(chuàng)新會(huì)越來(lái)越多?,F(xiàn)在可能還不容易被理解,是因?yàn)檎麄€(gè)社會(huì)群體需要被事實(shí)教育。當(dāng)這個(gè)社會(huì)讓硬核創(chuàng)新的人功成名就,群體性想法就會(huì)改變。我們只是還需要一堆事實(shí)和一個(gè)過(guò)程。
黃仁勛深度專訪:談中國(guó)、特朗普、AI、臺(tái)積電、英特爾
AI迎來(lái)轉(zhuǎn)折點(diǎn):谷歌Gemini 2.0會(huì)成為自主AI的開始嗎?
美國(guó)人終于發(fā)現(xiàn),中國(guó)“已做好準(zhǔn)備”!爆炸性消息傳出,特朗普萬(wàn)萬(wàn)沒料到
12月16日上市!全市場(chǎng)首只,“編號(hào)159363”的創(chuàng)業(yè)板人工智能ETF華寶澎湃上市,Reset中國(guó)AI投資新坐標(biāo)!
諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主:現(xiàn)在有兩個(gè)AI大國(guó),一個(gè)是美國(guó)一個(gè)是中國(guó)
華為AI,大消息!中國(guó)AI框架新增市場(chǎng)中華為昇思份額將達(dá)30%
長(zhǎng)三角接下“華為溢出效應(yīng)”,從青浦開始
高盛看好新興市場(chǎng)匯率對(duì)沖后的固定收益敞口 推薦5年期中國(guó)國(guó)債
《中國(guó)家電研發(fā)創(chuàng)新白皮書》重磅發(fā)布,以研發(fā)創(chuàng)新鍛造新質(zhì)生產(chǎn)力
還沒有評(píng)論,來(lái)說(shuō)兩句吧...