(相關(guān)資料圖)
騰訊新聞作者| 葉蓁
王小川組建的百川智能8月8日發(fā)布公司旗下第三款大模型產(chǎn)品——Baichuan-53B。據(jù)王小川介紹,Baichuan-53B定位閉源大模型,目前在寫作、文本創(chuàng)作能力方面,已經(jīng)達(dá)到行業(yè)最好的水平。
據(jù)悉,百川智能已經(jīng)發(fā)布參數(shù)量130億的通用大語(yǔ)言模型Baichuan-13B-Base、對(duì)話模型Baichuan-13B-Chat及其INT4/INT8兩個(gè)量化版本。
百川智能稱,Baichuan大模型,融合了意圖理解、信息檢索以及強(qiáng)化學(xué)習(xí)技術(shù),結(jié)合有監(jiān)督微調(diào)與人類意圖對(duì)齊,在知識(shí)問答、文本創(chuàng)作領(lǐng)域表現(xiàn)突出。
目前,百川智能公司目前有113人,人員來(lái)自包括搜狗、百度、字節(jié)和騰訊等公司。
王小川在發(fā)布會(huì)現(xiàn)場(chǎng)表示:百川智能第一次融資的時(shí)候,估值已經(jīng)超過5億美元,下一輪融資,可能估值就超過10億美元。他表示目前融資比較順利。
Chat GPT誕生后,中國(guó)創(chuàng)業(yè)圈興起百模大戰(zhàn)。王小川表示,目前中國(guó)的大模型競(jìng)爭(zhēng)格局還處于群魔亂舞的狀態(tài),還沒有沉淀和分層出來(lái)。
王小川在談及王慧文因病退出大模型創(chuàng)業(yè)時(shí)表示,沒有技術(shù)背景做大模型壓力會(huì)大很多,但是技術(shù)足夠的話,其實(shí)是件挺愉悅的事情。