訂閱
糾錯
加入自媒體

百川智能CEO王小川:攜手阿里推動大模型生態(tài)更加繁榮

10月31日,在2023云棲大會上,百川智能創(chuàng)始人兼CEO王小川分享了百川智能在大模型時代的思考與實踐。日前,百川推出全球最長上下文窗口大模型Baichuan2-192K引發(fā)媒體關(guān)注。王小川介紹,百川成立僅半年便發(fā)布了7款大模型,快速迭代背后離不開云計算的支持。

2023年4月,搜狗公司原CEO王小川官宣創(chuàng)辦AI大模型公司“百川智能”,此后百川短短數(shù)月便躋身科技獨角獸行列。尤其令人矚目的是,僅半年時間,百川先后發(fā)布7款基礎大模型,研發(fā)速度遠超行業(yè)水平,且開源模型表現(xiàn)優(yōu)異。今年8月底,百川更是率先通過國家《生成式人工智能服務管理暫行辦法》備案,是首批公司中唯一一家今年成立的大模型公司。

王小川認為,大模型浪潮將超越外界之前所有的想象,技術(shù)大爆炸正在發(fā)生,人類已步入通用人工智能時代。2018年,王小川便提出,“機器掌握語言,通用人工智能時代就來了!彼J為,語言代表認知世界的邊界,大模型一旦掌握了語言的規(guī)律,就意味著掌握了語言背后的知識、思考、溝通和文化。在智能時代,就像互聯(lián)網(wǎng)時代的芯片提供信息化基礎一樣,大模型會在社會各個方面起到“點亮智能”的作用。

但客觀而言,國內(nèi)大模型的發(fā)展與“不計成本登月”的OpenAI還存在差距。王小川表示,國內(nèi)大模型的現(xiàn)狀是“理想上慢一步,落地上快三步”。雖然在技術(shù)創(chuàng)新和技術(shù)理想上美國有所領先,但是中國的應用落地能力更強。百川擁有經(jīng)驗豐富的搜索團隊,過去成功打造過基于語言模型的超級應用,且擁有經(jīng)過市場驗證的技術(shù)、產(chǎn)品、商業(yè)化能力,團隊掌握的搜索技術(shù)可以助力大模型研發(fā),且能補齊大模型在幻覺等問題上的短板。

通過結(jié)合過去經(jīng)驗和技術(shù)積累“小步快跑”,百川目前已成為中國大模型創(chuàng)業(yè)公司引領者之一。百川開源大模型總下載量3個月突破600萬次,Baichuan2在通用及垂直領域均達到領先水平,中英文表現(xiàn)超過LLaMA2。10月30日最新發(fā)布的Baichuan2-192K更是成為全球支持最長上下文窗口的大模型,一次可輸入35萬字,全面領先Claude2-100K。

除了團隊、經(jīng)驗等優(yōu)勢外,百川實現(xiàn)平均每月迭代一款模型的另一重要原因是云計算的支撐。王小川介紹,模型的快速迭代和部署離不開云計算,百川智能和阿里云作為緊密的合作伙伴,在模型預訓練和模型部署等方面進行了深入合作。在雙方的共同努力下,百川很好地完成了千卡大模型訓練任務,有效降低了模型推理成本,提升了模型部署效率。

百川的開源模型在阿里云的魔搭社區(qū)上也吸引了大量的開發(fā)者,借助社區(qū)的力量,開發(fā)者們在百川大模型的基礎上針對眾多垂直領域進行微調(diào),并將其能力集成到各類AI應用,極大豐富了國內(nèi)的大模型生態(tài)。

王小川表示,未來,百川智能將與阿里云持續(xù)深入合作,攜手探索更前沿的大模型技術(shù)創(chuàng)新,推動大模型落地到更豐富的應用場景,共同助力大模型生態(tài)更加繁榮。

聲明: 本網(wǎng)站所刊載信息,不代表OFweek觀點?帽菊靖寮瑒战(jīng)書面授權(quán)。未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復制、翻譯及建立鏡像,違者將依法追究法律責任。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號