《AI未來指北》欄目由騰訊新聞推出,邀約全球業(yè)內(nèi)專家、創(chuàng)業(yè)者、投資人,探討AI領(lǐng)域的技術(shù)發(fā)展、商業(yè)模式、應(yīng)用場(chǎng)景、及治理挑戰(zhàn)。
文 / 騰訊科技 周小燕
(相關(guān)資料圖)
ChatGPT的出現(xiàn),像極了2007年iPhone出世的時(shí)刻:由于基礎(chǔ)設(shè)施不夠成熟,人們很難想象未來的應(yīng)用產(chǎn)品畫像 。但曾經(jīng)iPhone掀起移動(dòng)互聯(lián)網(wǎng)創(chuàng)業(yè)浪潮的經(jīng)歷,讓如今的投資人和創(chuàng)業(yè)者蓄勢(shì)待發(fā),時(shí)刻為新的“iPhone時(shí)刻”的到來做準(zhǔn)備。
從2020年GPT-3出現(xiàn)開始,英諾天使基金合伙人王晟就一直關(guān)注生成式預(yù)訓(xùn)練模型的機(jī)會(huì),在期間做了很多相關(guān)的思考和探索,他將新一代AI的投資自下而上分為三個(gè)層次:AI Infra、大模型和應(yīng)用。
AI Infra板塊主要看國產(chǎn)替代的機(jī)會(huì),比如無損網(wǎng)絡(luò)、算力和軟件及生態(tài)機(jī)會(huì);
大模型板塊包括語言大模型LLM,多模態(tài)大模型如圖像生成式AI、視頻生成式AI等,垂類域比如AI for Science & AI for Industry;
應(yīng)用端板塊主要分為AI改造舊場(chǎng)景以及AI創(chuàng)造新場(chǎng)景的機(jī)會(huì)。
他認(rèn)為,當(dāng)下算力、模型訓(xùn)練框架層面還存在需要補(bǔ)足的地方,我們正處于完善AI訓(xùn)練和運(yùn)行(推理)所需的基礎(chǔ)設(shè)施的階段,應(yīng)用端還沒有太好的投資標(biāo)的??梢砸贿叴罱ɑA(chǔ)設(shè)施,一邊等待新的應(yīng)用機(jī)會(huì)和商業(yè)模式出現(xiàn)。
在大模型板塊上,王晟認(rèn)為“AI for Science”的想象空間非常大,在諸如航空航天、軍艦甚至建筑和半導(dǎo)體設(shè)計(jì)方面,AI可能可以替代頂級(jí)科學(xué)家的計(jì)算和求解能力。
核心觀點(diǎn):
1小模型的核心問題是無法泛化,它太“愚蠢”了,現(xiàn)在鼓吹小模型的無非是2個(gè)點(diǎn):第一,大模型貴,但這是成本問題,后續(xù)通過工業(yè)化、規(guī)模化方式可以解決這一點(diǎn),核心還是如何滿足用戶需求;第二,在有的場(chǎng)景里面,我們可能無法使用大模型,諸如對(duì)實(shí)時(shí)性要求較高、或者功能單一的IoT設(shè)備,比如:智能攝像頭、智能降噪耳機(jī),在這些板塊小模型確實(shí)有一定需求,但主流的范式不會(huì)是小模型。 2在移動(dòng)互聯(lián)網(wǎng)的創(chuàng)新涌現(xiàn)之前,各行業(yè)也都是原先業(yè)務(wù)的“大家伙”做一個(gè)遷移、換個(gè)流量入口而已。在AI時(shí)代也是,先是底層的Infra完善、工具鏈完善、開發(fā)環(huán)境完善,然后涌現(xiàn)創(chuàng)業(yè)者,再做業(yè)務(wù)移植。如果只依靠移植,不會(huì)產(chǎn)生什么真正的投資或創(chuàng)業(yè)機(jī)會(huì),只有等“移植”階段過去,才會(huì)真正進(jìn)入到模式創(chuàng)新的時(shí)代。 3現(xiàn)在處于AI Infra時(shí)代,傳統(tǒng)業(yè)務(wù)正逐漸遷移到AI中,在這個(gè)時(shí)代可能沒有太好的應(yīng)用端投資標(biāo)的,主要的投資機(jī)會(huì)還是在基礎(chǔ)設(shè)施上?;A(chǔ)設(shè)施投資是一個(gè)長期的過程,但最重要的窗口是在當(dāng)下這個(gè)時(shí)代,后面的投資窗口可能會(huì)遷移到比如商業(yè)模式創(chuàng)新的板塊了。 4“AI for Science”板塊非常值得關(guān)注,這個(gè)板塊最重要的是“科學(xué)計(jì)算”,但主要是微軟和DeepMind在做,創(chuàng)業(yè)公司可能沒什么機(jī)會(huì)。比如設(shè)計(jì)一個(gè)大飛機(jī),需要很多空氣動(dòng)力學(xué)上的研究,目前都是需要依靠極其頂級(jí)的科學(xué)家來設(shè)計(jì)和求解、論證。如果AI來做這件事情,它就能解決很多問題,包括航空航天、軍艦甚至建筑和半導(dǎo)體設(shè)計(jì)。 5大模型+自動(dòng)駕駛面臨的挑戰(zhàn)非常大,最大的問題是它對(duì)錯(cuò)誤的容忍度太低。ChatGPT胡說幾句話無所謂,但用在自動(dòng)駕駛上,哪怕是百分之一或萬分一的錯(cuò)誤,都可能會(huì)出現(xiàn)很大的安全問題。英諾天使基金合伙人 王晟
以下為訪談內(nèi)容整理:
騰訊科技:這半年因?yàn)锳IGC領(lǐng)域的關(guān)注度較高,一級(jí)市場(chǎng)的投資氛圍也很“卷”,大家都在尋找各種投資機(jī)會(huì),投資人群體在這段時(shí)間的心態(tài)是怎么樣的?
王晟:絕大部分投資人是比較焦慮的,但也不完全是因?yàn)榇竽P停F(xiàn)在整個(gè)經(jīng)濟(jì)環(huán)境和投融資環(huán)境都比較令人焦慮。整個(gè)金融市場(chǎng)環(huán)境不利于資金流動(dòng),而較差的資金流動(dòng)性不利于項(xiàng)目退出,從而形成一個(gè)不好的循環(huán):沒有退出就會(huì)影響募資,影響募資就會(huì)影響投資。
在投資人群體里面,相比較于人民幣基金,美元基金投資人會(huì)更“沖動(dòng)”一些。在過去,由于政策的原因,新能源或硬科技創(chuàng)業(yè)團(tuán)隊(duì)不太敢要美元的錢,但AI對(duì)美元VC而言是一個(gè)很好的投資窗口,畢竟傳統(tǒng)的人民幣基金很難承受AI創(chuàng)業(yè)公司的長周期投資要求。
騰訊科技:在這波熱潮里,英諾基金的投資心態(tài)是怎樣的?
王晟:我們比較淡定,因?yàn)槲覀冊(cè)诖竽P皖I(lǐng)域已經(jīng)深耕很長時(shí)間了。去年6月份,我們投資了預(yù)訓(xùn)練模型技術(shù)服務(wù)商深言科技,它的主要目標(biāo)是用NLP技術(shù),尤其是大模型(LLM)技術(shù),全流程服務(wù)信息處理。
如果追溯到更久,實(shí)際上在前年(2021年)下半年,我們內(nèi)部就非常確定,未來是大模型的世界,小模型的機(jī)會(huì)不多。
當(dāng)然,關(guān)于大模型和小模型誰更有機(jī)會(huì),目前依舊存在爭(zhēng)議。在一些對(duì)安全性要求比較高的特定場(chǎng)景里,比如政府、企業(yè)等組織確實(shí)需要部署一些私有模型,但這并不代表整體市場(chǎng)的發(fā)展方向。我認(rèn)為未來的主流方向在大模型,沒有小模型的世界。大模型像云服務(wù)一樣,它是新一代互聯(lián)網(wǎng)業(yè)務(wù)的基礎(chǔ)設(shè)施。
本來我們預(yù)估這兩年大模型的投資熱度會(huì)緩慢升溫,但Open AI突然發(fā)布ChatGPT,一下子點(diǎn)燃了這個(gè)賽道,突然涌現(xiàn)出很多大模型團(tuán)隊(duì),我們剛開始看這個(gè)賽道的時(shí)候根本不存在這些團(tuán)隊(duì)。
騰訊科技:你們前年就發(fā)現(xiàn)大模型是趨勢(shì),小模型沒什么機(jī)會(huì),當(dāng)時(shí)經(jīng)歷了哪些實(shí)驗(yàn)得出這個(gè)結(jié)論?
王晟:小模型的核心問題是無法泛化,它太“愚蠢”了,比如今天小模型能認(rèn)出農(nóng)夫山泉,明天把農(nóng)夫山泉瓶子換成藍(lán)色的,它可能就不認(rèn)識(shí)了。現(xiàn)在鼓吹小模型的無非是2個(gè)點(diǎn):
第一,大模型貴,但這是成本問題,后續(xù)通過工業(yè)化、規(guī)?;绞娇梢越鉀Q這一點(diǎn),核心還是如何滿足用戶需求。
第二,在有的場(chǎng)景里面,我們可能無法使用大模型,比如對(duì)安全性要求比較高,或者功能單一的IoT設(shè)備,如智能攝像頭、智能降噪耳機(jī),它對(duì)實(shí)時(shí)性要求太高,大模型跑不進(jìn)去。從這個(gè)角度來看,小模型確實(shí)有一定需求,但主流的范式不會(huì)是小模型。
大模型會(huì)成為主流,其中語言大模型是人工智能皇冠上的明珠,畢竟人類的知識(shí)大部分以語言文字的方式承載,維特根斯坦講人類語言的邊界就是我們思維的邊界。除了語言大模型之外,我們也非常關(guān)注其他模態(tài)的AI大模型,比如:圖像、視頻、3D等等。
2020年,Open AI發(fā)布GPT-3,我們初步預(yù)測(cè)生成式預(yù)訓(xùn)練語言模型是未來的方向;
2021年4月底,Open AI發(fā)布DALL-E模型之后,文生圖的模型更加趨向成熟,整個(gè)科研界都覺得這個(gè)路子是對(duì)的,它創(chuàng)建了CLIP+Diffusion的技術(shù)范式,接下來Stable Diffusion、Midjourney都順著這個(gè)技術(shù)路徑走,它比過去GAN、VAE“文生圖”模型更容易泛化,所以從2021年下半年開始,我們非常關(guān)注文生圖大模型范式;
2021年其實(shí)還涌現(xiàn)出很多其它多模態(tài)相關(guān)的AI技術(shù),除了文生圖的CLIP+Diffusion,還有谷歌發(fā)布的NeRF,這是一種基于神經(jīng)場(chǎng)的渲染技術(shù),可以用來生成視頻流或者重構(gòu)成3D Mesh。谷歌也利用NeRF技術(shù)重構(gòu)了舊金山市。
從2021年下半年開始,大模型被我們定義為一個(gè)很重要的投資方向,我們順著這個(gè)方向?qū)ふ翼?xiàng)目。但是,我們也遇到了很大的挑戰(zhàn):真正投入做大模型的比如IDEA研究院、華為、百度,是我們投資不進(jìn)去的;而市場(chǎng)上又找不到能做大模型的團(tuán)隊(duì),所以有勁兒沒處使。
騰訊科技:但你們?nèi)ツ昃屯顿Y了深言科技,當(dāng)時(shí)你們是通過什么方法找到他們的?
王晟:英諾在清華大學(xué)計(jì)算機(jī)系設(shè)立了一個(gè)獎(jiǎng)學(xué)金,2021年豈凡超拿了這項(xiàng)獎(jiǎng)學(xué)金的第一名,我們也開始關(guān)注到他們團(tuán)隊(duì)做的事情,正好符合我們想要的項(xiàng)目的標(biāo)準(zhǔn),就投資進(jìn)去了。
2021年在多模態(tài)方向,我們接觸過多個(gè)文生圖的團(tuán)隊(duì),但是我們一直沒有出手投資,主要是沒看清商業(yè)化的轉(zhuǎn)換路徑。在文生圖領(lǐng)域,我們非常關(guān)注可控性問題:
首先,模型能不能被很好地控制?包括一些精確的布局控制,比如我想要生成一張圖,需要中間有一張桌子,旁邊站著一個(gè)人,以及很多主體的排布和控制等,模型能不能精準(zhǔn)地實(shí)現(xiàn)和控制需求非常關(guān)鍵;
其次,模型的持續(xù)性很重要,它又叫做“概念定義”,比如第一次要求機(jī)器畫出鋼鐵俠,第二次還是要畫鋼鐵俠,機(jī)器能不能把“鋼鐵俠”的概念定義出來很關(guān)鍵,還有二次創(chuàng)作(Inpainting)的問題,比如第一次畫的不盡如意,還需要基礎(chǔ)上修改一下。
在那段時(shí)間,我們看了很多項(xiàng)目,但他們也很難解決這兩個(gè)問題。
到2023年2月,這幾個(gè)問題都被ControlNet解決了,它的出現(xiàn)是里程碑式的模塊,整個(gè)文生圖的可控性被大大提高。
騰訊科技:ControlNet出現(xiàn)確實(shí)大大提升整個(gè)文生圖領(lǐng)域的生產(chǎn)力,但國內(nèi)的項(xiàng)目怎么和Midhourney這些進(jìn)入中國的明星工具競(jìng)爭(zhēng)?
王晟:對(duì),我們確實(shí)又面臨下一個(gè)問題:能不能投?怎么去投?Midjourney的競(jìng)爭(zhēng)力很強(qiáng),Stable Diffusion開源又免費(fèi)。此外,很多創(chuàng)業(yè)者可能也沒有勇氣做這個(gè)方向了,很多項(xiàng)目無非是拿Stable Diffusion結(jié)合某個(gè)行業(yè)做個(gè)工具鏈,很少有人會(huì)訓(xùn)練一個(gè)通用的文生圖模型。即便有的項(xiàng)目做,他們的估值太高,不適合早期機(jī)構(gòu)投資。
騰訊科技:大模型比較貴,估值也很高,所以也有一些投資人看一些有稀缺數(shù)據(jù)的垂直模型,你認(rèn)為這個(gè)細(xì)分賽道有哪些場(chǎng)景和機(jī)會(huì)?
王晟:很多人強(qiáng)調(diào)大模型拿到的是通用知識(shí),它沒有私有數(shù)據(jù),但我認(rèn)為這完全不重要。
第一,垂直模型拿到的知識(shí),大模型都能拿到,沒有多少東西是某個(gè)個(gè)體純碎私有、別人沒有的,無非是大家解決問題的先后順序不同。
第二,大模型擁有了足夠知識(shí)后,很多細(xì)小的知識(shí)都不被需要了,Open AI內(nèi)部人曾經(jīng)提過,他們?cè)谟?xùn)練GPT-4的時(shí)候,特意留下很多空白的知識(shí)域(Knowledge Domain),但在測(cè)驗(yàn)的時(shí)候發(fā)現(xiàn)即便是沒有被投喂數(shù)據(jù)的領(lǐng)域的知識(shí),GPT-4也能知道。人類的知識(shí)相關(guān)性太強(qiáng)了,GPT-4完全不需要數(shù)據(jù)投喂也能學(xué)會(huì)這些知識(shí),所以指望那點(diǎn)稀有數(shù)據(jù)形成核心競(jìng)爭(zhēng)力比較難。
騰訊科技:垂直模型不值得投入,那么大模型應(yīng)該怎么投?這一輪的大模型蛋糕是不是已經(jīng)被分完了?如果現(xiàn)在想要入場(chǎng),AIGC領(lǐng)域還有哪些投資和創(chuàng)業(yè)機(jī)會(huì)?
王晟:任何一個(gè)新的產(chǎn)業(yè)技術(shù)范式誕生之后,都會(huì)存在一個(gè)發(fā)展周期,比如“iPhone時(shí)刻”的到來有很多技術(shù)積累,芯片的集成度和算力、觸摸屏、4G/5G通信等。
iPhone第一天出現(xiàn)的時(shí)候,用戶也很難理解它到底能做多少事,所以2007年iPhone出現(xiàn),但2011年微信才出現(xiàn),2012年才有了滴滴,2015年才有了拼多多,2016年才出現(xiàn)抖音。從2007年到2016年,中間整整隔了10年。
現(xiàn)在“AI時(shí)刻”也要到來了,它代表了一種新的技術(shù)范式,但它在初期階段能做的事情并不多。消費(fèi)者的使用門檻高、基礎(chǔ)設(shè)施不夠完善、用戶對(duì)它的理解也差很多??赡芗夹g(shù)范式的創(chuàng)新會(huì)讓AI Infra先起步,比如芯片的成本變得更低、開發(fā)工具更完善、終端保有量足夠多的時(shí)候,AI會(huì)迸發(fā)出更多的機(jī)會(huì)點(diǎn)。
在AI發(fā)展的第一個(gè)階段,由于大家的想象力還很有限,能做的事情可能是把舊的行業(yè)全移植一遍。
騰訊科技:但光依靠“移植”或“遷移”,現(xiàn)有移動(dòng)互聯(lián)網(wǎng)的各細(xì)分行業(yè)的格局很難被改變。
王晟:在移動(dòng)互聯(lián)網(wǎng)的創(chuàng)新涌現(xiàn)之前,各行業(yè)也都是原先業(yè)務(wù)的“大家伙”做一個(gè)遷移、換個(gè)流量入口而已。在AI時(shí)代也是,先是底層的Infra完善、工具鏈完善、開發(fā)環(huán)境完善,然后涌現(xiàn)創(chuàng)業(yè)者,再做業(yè)務(wù)移植。
其實(shí),如果只依靠移植,這個(gè)時(shí)代不會(huì)產(chǎn)生什么真正的投資或創(chuàng)業(yè)機(jī)會(huì),只有等“移植”階段過去,才會(huì)真正進(jìn)入到模式創(chuàng)新的時(shí)代,它創(chuàng)造了新的用戶需求,但這是我們還看不到的東西,還需要時(shí)間、需要未來的創(chuàng)業(yè)者去創(chuàng)造。
當(dāng)這個(gè)周期過去,就會(huì)進(jìn)入到“內(nèi)卷”階段,就像移動(dòng)互聯(lián)網(wǎng)發(fā)展到2017年就已經(jīng)進(jìn)入尾聲了,它很難產(chǎn)生真正的創(chuàng)新,也不會(huì)有新的商業(yè)模式出現(xiàn)了,大家都去卷內(nèi)容,比如卷短視頻、卷直播、卷帶貨。
我們現(xiàn)在處于AI Infra時(shí)代,處于傳統(tǒng)業(yè)務(wù)逐漸遷移到AI的過程中,在這個(gè)時(shí)代可能沒有太好的投資標(biāo)的,這3年我們會(huì)繼續(xù)投資基礎(chǔ)設(shè)施。當(dāng)然,基礎(chǔ)設(shè)施投資是一個(gè)長期的過程,但最重要的窗口是在當(dāng)下這個(gè)時(shí)代,后面的投資窗口可能會(huì)遷移到比如商業(yè)模式創(chuàng)新的板塊了。
騰訊科技:除了AI Infra,在模型層以及應(yīng)用層你們打算怎么布局?
王晟:在AI Infra板塊,硬件上我們投無損網(wǎng)絡(luò)、高速度光通信,包括存算一體、Chiplet等,我們也投資了光芯片和量子方向。近期,我們剛投資了一家AI Chiplet供應(yīng)商“原粒半導(dǎo)體”,它可以通過提高能效、降低成本的方式為多模態(tài)大模型提供算力支持。
再更上一層,我們也在關(guān)注 MLOps、AI開發(fā)框架、AI編譯器等方向。
再往上的大模型層面,我們除了會(huì)看語言大模型,也看多模態(tài)的大模型和垂類知識(shí)域的機(jī)會(huì):
在語言大模型板塊我們投資了深言科技;
在多模態(tài)板塊,我們投資了3D掃描重建技術(shù)企業(yè)KIRI Innovation(麒礪創(chuàng)新),目前他們?cè)谧?D的人工智能的生成式模型,直接text to 3D;我們還投資了做虛擬人動(dòng)作行為的大模型中科深智,屬于text to motion,它是端到端生成式AI虛擬人技術(shù)的公司,能有效改進(jìn)游戲角色過于依賴動(dòng)作庫和表情庫的現(xiàn)狀,依賴“庫”的模式會(huì)導(dǎo)致角色表現(xiàn)力欠缺變化、顯得僵化的問題。
CV領(lǐng)域過去有非常多的小模型公司,4月份我們看到Meta的SAM模型展現(xiàn)出非常強(qiáng)的泛化能力,我們也在觀察真正的CV大模型的投資機(jī)會(huì)。
圖像、視頻生成領(lǐng)域,由于SD開源、MJ和Runway都非常強(qiáng)大,我們看到的情況是國內(nèi)大量的創(chuàng)業(yè)者在基于SD做應(yīng)用,而不是自研模型和這幾家硬剛。我們非常期待國內(nèi)出現(xiàn)有勇氣、有實(shí)力的創(chuàng)業(yè)團(tuán)隊(duì)。
大模型的另外一個(gè)投資方向是AI for Science,這是一個(gè)比較早期且富有爭(zhēng)議的領(lǐng)域,創(chuàng)業(yè)和投資的認(rèn)知門檻非常高。
AI for Science板塊分三個(gè)范式:科學(xué)計(jì)算大模型、垂類域知識(shí)大模型和垂類域生成式AI。
其中,科學(xué)計(jì)算是最底層的范式,它可以利用AI幫助科學(xué)家做計(jì)算,從邏輯上看它能解決一切科研問題,但主要是微軟和DeepMind在做,創(chuàng)業(yè)公司可能沒什么機(jī)會(huì)。比如我們要設(shè)計(jì)一個(gè)大飛機(jī),需要很多空氣動(dòng)力學(xué)上的研究,目前都是需要依靠極其頂級(jí)的科學(xué)家來設(shè)計(jì)和求解、論證。如果AI來做這件事情,它就能解決很多問題,包括航空航天、軍艦甚至建筑和半導(dǎo)體設(shè)計(jì)。
第二個(gè)范式是垂類領(lǐng)域知識(shí)大模型,這也是我們目前最關(guān)注、馬上會(huì)做投資的范式,它以LLM大語言模型為底座,加上大量的科學(xué)Paper和相關(guān)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行訓(xùn)練,期望以此涌現(xiàn)出類似ChatGPT和GPT-4的思維鏈和推理能力,甚至具備一定程度的theory of mind(心智)能力。
第三個(gè)范式是垂類域生成式AI,相比較于前兩個(gè)范式,盡管它跑得更早一些,但其發(fā)展程度并沒有比前兩個(gè)范式更成熟,它通過學(xué)習(xí)大量關(guān)于分子結(jié)構(gòu)知識(shí)和數(shù)據(jù),來實(shí)現(xiàn)對(duì)DNA結(jié)構(gòu)、分子結(jié)構(gòu)的推測(cè),同時(shí)做一些分子之間的力的分析和推測(cè)。它可以應(yīng)用于制藥、蛋白質(zhì)合成,尤其在大分子生物相關(guān)的應(yīng)用上的機(jī)會(huì)更多。但它面臨的爭(zhēng)議也比較大,盡管它所展現(xiàn)出的效率較高,能比人更快地推測(cè)出新結(jié)構(gòu),但沒有經(jīng)過實(shí)驗(yàn)證明其有效性。
不論是哪個(gè)范式,AI for Science從理論上來說可以解決一切科學(xué)領(lǐng)域的問題,比如和人類生活息息相關(guān)的可再生能源問題、氣候問題等,但整個(gè)AI for Science最重要的應(yīng)用方向有兩個(gè):醫(yī)療制藥和材料領(lǐng)域,因?yàn)檫@兩個(gè)領(lǐng)域的賺錢能力最強(qiáng)。
騰訊科技:這些方向還是聚焦在模型層面,但現(xiàn)階段大家其實(shí)更關(guān)心應(yīng)用層面的機(jī)會(huì),英諾從2020年就觀察AIGC的機(jī)會(huì),現(xiàn)階段應(yīng)用層有哪些想象力?
王晟:在應(yīng)用方面非常難投。
我們不太想假設(shè)這件事,我認(rèn)為現(xiàn)在還沒有到應(yīng)用創(chuàng)新的階段,沒有人能假設(shè)全新的場(chǎng)景,只有創(chuàng)業(yè)者做出來了,投資人才能看到,我們需要等待。
AI對(duì)傳統(tǒng)行業(yè)改造其實(shí)也不是創(chuàng)業(yè)者的“菜”,就算有人能做,這個(gè)人肯定在傳統(tǒng)領(lǐng)域極其有影響力,或者說特別懂這個(gè)行業(yè)、有非常強(qiáng)的資源,這些可能是非常特殊的領(lǐng)域。在其它領(lǐng)域,比如辦公場(chǎng)景,比如做智能PPT,只能微軟去做;做智能家居、建筑設(shè)計(jì),只能AutoDesk去做,對(duì)創(chuàng)業(yè)者而言這些沒有太大意義。
騰訊科技:即便對(duì)很多試圖用AI改造傳統(tǒng)行業(yè)的公司而言,內(nèi)部還需要打通各種數(shù)據(jù),也是一個(gè)非常艱難的過程。
王晟:對(duì),非常難,可能需要很大的耐心去等待。
騰訊科技:你曾說AI3.0時(shí)代是“具身智能”的時(shí)代,可以用大模型驅(qū)動(dòng)人形機(jī)器人,而自動(dòng)駕駛和人形機(jī)器人的很多能力都是打通的,你認(rèn)為大模型+自動(dòng)駕駛算不算一個(gè)接地氣的應(yīng)用層面的機(jī)會(huì)?
王晟:大模型+自動(dòng)駕駛面臨的挑戰(zhàn)非常大,我覺得最大的問題是它對(duì)錯(cuò)誤的容忍度太低。ChatGPT胡說幾句話無所謂,但用在自動(dòng)駕駛上,哪怕是百分之一或萬分一的錯(cuò)誤,都可能會(huì)出現(xiàn)很大的安全問題。
我們可能沒辦法說這次AI的突破一定能使自動(dòng)駕駛落地,但將智能座艙引入大模型肯定能提升用戶體驗(yàn),當(dāng)然也會(huì)增加用戶使用車的成本。
此外,我覺得會(huì)對(duì)整個(gè)自動(dòng)駕駛產(chǎn)業(yè)有比較大的帶動(dòng),比如在車?yán)锏乃懔σo到多少才夠?這些算力由英偉達(dá)提供,還是由專門的車規(guī)級(jí)AI推理芯片來提供?
騰訊科技:這本質(zhì)上是不是因?yàn)榇竽P蜕瞄L解決公共屬性的問題,但很難解決自動(dòng)駕駛一些很特殊的corner case(邊角場(chǎng)景)?
王晟:大模型也許不一定能有效識(shí)別這些corner case,但是大模型的智能水平會(huì)大幅度上升,即便它無法識(shí)別也可能有辦法處理。比如,我們?cè)诼飞像{駛撞到了一個(gè)你從來沒見過的物體,人類駕駛員是知道如何處理這些情況的,大模型即便無法識(shí)別,但它有較高的智能水平,也許也能處理這些情況。
騰訊科技:如果一直堅(jiān)持訓(xùn)練大模型識(shí)別各種各樣的corner case,也許它能無限逼近人類駕駛員的智力和識(shí)別水平?
王晟:對(duì),我們不要低估未來,可能是我一個(gè)科技樂觀主義,我相信技術(shù)進(jìn)步能解決很多問題。很多人比較容易高估短期趨勢(shì),大幅度低估長期趨勢(shì),包括大模型的投資熱潮也一樣,很多公司估值高的投不進(jìn)去,其實(shí)這是對(duì)短期高度樂觀,并不理性。
騰訊科技:你曾經(jīng)說做大模型的清華系創(chuàng)業(yè)者里面,最能打的是王小川和深言科技,他們的壁壘主要存在哪些方面?
王晟:核心還是看團(tuán)隊(duì),最重要的是團(tuán)隊(duì)的“信仰”,大家都看到了大模型,有的人信AGI,有的人不信。比如Transformer是谷歌做出來的,但是谷歌沒有那么大的信仰,他們一會(huì)兒說Encoder不錯(cuò),一會(huì)兒說Decoder也不錯(cuò),一會(huì)兒又做一個(gè)encoder+decoder 的 T5出來,但只有Open AI孤注一擲往GPT方向探索。
我們投資了深言科技后,馬上安排深言做下一輪融資,帶他們見了幾十家機(jī)構(gòu),但沒有一家肯投。后來拉著紅杉的投資人和豈凡超一起吃了一頓牛肉火鍋,吃完后紅杉就答應(yīng)投資?,F(xiàn)在,又有太多投資機(jī)構(gòu)想要擠進(jìn)去,所以信和不信造成的結(jié)果差異還是很大的。
包括現(xiàn)在投資AI for Science也需要信仰,沒有人確定AI能不能涌現(xiàn)出科研能力,我們也判斷不了AI能在什么時(shí)間點(diǎn)、涌現(xiàn)出多大能力、解決多大問題,但我們“信”就行了。我們跟很多科學(xué)家都聊過AI for Science,有的科學(xué)家很興奮,有的認(rèn)為啥也不是,在這種情況下即便你懂,也無從判斷。
關(guān)于誰能把這件事情做成,也要看投資人自己信不信,我們可以找很多理由,比如說做成大模型需要過去有經(jīng)驗(yàn),因?yàn)檫@里面要面臨的挑戰(zhàn)有很多,比如數(shù)據(jù)、工程化、算法、分布式訓(xùn)練等等,在這方面深言科技是有很大優(yōu)勢(shì)的。
如果認(rèn)為做成大模型需要具備很強(qiáng)的融資能力,那么王慧文可能更好;如果認(rèn)為科研和科學(xué)家更重要,那么就應(yīng)該投唐杰老師;如果你認(rèn)為做工程更重要,那可以投資周伯文。
所以核心還是要看你相信什么,有時(shí)候不是因?yàn)槟阏娴南嘈?,只不過是因?yàn)槟阆胱屪约合嘈拧?/p>
騰訊科技:所以投誰或者不投誰,可能也要看“氣場(chǎng)”契合與否。
王晟:對(duì),我們?nèi)ツ晖读松钛钥萍?,今年我們也把市?chǎng)上相關(guān)的項(xiàng)目也談了一遍,談完之后反而強(qiáng)化了我們持續(xù)不斷加持深言科技的信心。因?yàn)檫^去投資了深言科技,你會(huì)很清楚他們的能力在哪里,會(huì)強(qiáng)化你的信仰。
但是對(duì)于新入場(chǎng)的人來說,他們沒有站隊(duì),就會(huì)覺得企業(yè)家更重要,可能去投資王慧文或王小川??偟膩碚f,這沒有核心的標(biāo)準(zhǔn),每家都有自己的理由。
騰訊科技:你和王小川、王慧文都聊過嗎,為什么沒有投資他們?
王晟:主要是他們太貴了,對(duì)早期基金來說,5億美金或10億美金的投資額太貴了。
騰訊科技:英諾有幾個(gè)投資人看AIGC領(lǐng)域?
王晟:我們有一個(gè)AIGC小組,組里就3個(gè)投資人,但我們要求每個(gè)賽道的投資人都要理解AI,因?yàn)锳I會(huì)改變所有行業(yè)。不論你看的是材料方向,還是生命科技,或是芯片、半導(dǎo)體方向,所有人都要把AI思考進(jìn)去。
騰訊科技:你們什么時(shí)候設(shè)立這個(gè)小組的?
王晟:前年(2021年),這個(gè)小組主要由我來負(fù)責(zé)。
騰訊科技:這個(gè)小組的運(yùn)轉(zhuǎn)方式是怎樣的?
王晟:我們不強(qiáng)調(diào)KPI,主要靠大家的自驅(qū)力,投資人們基本都在沒日沒夜地看項(xiàng)目,我們對(duì)投資人的要求是,首先要熱愛這個(gè)行業(yè);其次要專業(yè),這樣才能找到好項(xiàng)目;第三就要看投資成績(jī),短期來看,如果投資到好的項(xiàng)目,項(xiàng)目增長很快,投資人也有很大的滿足感,長期來看,好項(xiàng)目最終產(chǎn)生的收益也會(huì)給大家一個(gè)很好的分配激勵(lì)機(jī)制。
騰訊科技:你們的AIGC小組現(xiàn)在投資了多少個(gè)項(xiàng)目?單筆投資大約是什么樣的體量?
王晟:在這一波大模型和生成式AI投資中,英諾算是接觸項(xiàng)目數(shù)量最多和質(zhì)量最高的機(jī)構(gòu)之一,但真正的好項(xiàng)目非常稀缺,我們投資的數(shù)量一只手就能數(shù)過來。投資數(shù)量的多少,也和各家基金的策略不同有關(guān)系。
我們希望每一個(gè)項(xiàng)目都投得精準(zhǔn),比如有的項(xiàng)目我們都看過,我們沒投,但是紅杉資本投了。不是我們比他們更嚴(yán)格,而是他們的基金體量更大,有種子、VC、成長,甚至有二級(jí)市場(chǎng)業(yè)務(wù)板塊,他們更怕“錯(cuò)過”,我們更怕“投錯(cuò)”,可能我們也會(huì)因此錯(cuò)過一些項(xiàng)目。
我們有兩類基金,一類是面向過去傳統(tǒng)的天使類型的投資,單筆大概會(huì)投資一千萬,現(xiàn)在也有一些早期項(xiàng)目變得很貴,所以我們又做了一個(gè)體量更大的基金,單筆投資兩三千萬左右。