中國(guó)的平價(jià)開源AI模型DeepSeek驚艷全球科學(xué)家
日前,,來自中國(guó)的大語(yǔ)言模型DeepSeek-R1震動(dòng)了整個(gè)科學(xué)圈,,對(duì)于OpenAI的o1一類的“推理”模型來說,這個(gè)負(fù)擔(dān)得起的開源模型成了它們的競(jìng)爭(zhēng)對(duì)手,。
這類模型能以類似人類推理的過程生成逐步式回答,。這使得這些模型比之前的語(yǔ)言模型更擅長(zhǎng)解決科學(xué)問題,并有望在科研中發(fā)揮作用,。1月20日發(fā)布的對(duì)R1的初步測(cè)試顯示,,其在特定化學(xué)、數(shù)學(xué)和代碼任務(wù)上的表現(xiàn)與o1不相上下,,OpenAI去年9月發(fā)布的o1曾令科研人員贊嘆不已,。
“這太瘋狂了,完全出乎意料,,”英國(guó)AI咨詢公司DAIR.AI的聯(lián)合創(chuàng)始人,、AI研究員Elvis Saravia 在X上寫道。
R1令人贊嘆的原因還有一個(gè),。構(gòu)建該模型的DeepSeek(深度求索)是杭州的一家初創(chuàng)公司,,該公司以“open-weight”的形式發(fā)布了該模型,open-weight允許科研人員研究并繼續(xù)構(gòu)建這個(gè)算法,。這個(gè)模型使用MIT許可證,,能免費(fèi)重復(fù)使用,但不屬于完全開源,,因?yàn)槠溆?xùn)練數(shù)據(jù)并未公開,。
“DeepSeek的開源很了不起,”德國(guó)馬克斯·普朗克光學(xué)研究所Artificial Scientist Lab負(fù)責(zé)人Mario Krenn稱贊道,。相比之下,,他說,舊金山的OpenAI構(gòu)建的o1等模型,,包括其最新的o3,,“基本上都是黑箱”。
DeepSeek還沒有公布訓(xùn)練R1的總成本,,但使用其界面的用戶只需支付使用o1 的1/30,。這家公司還創(chuàng)建了R1的“蒸餾”迷你模型,讓算力有限的研究人員也能上手,?!?strong>在o1上要花300多英鎊的一個(gè)實(shí)驗(yàn),用R1只要不到10美元,,”Krenn說,,“這種巨大差異肯定會(huì)影響模型的未來采用?!?/p>
轉(zhuǎn)載請(qǐng)注明來自浙江中液機(jī)械設(shè)備有限公司 ,,本文標(biāo)題:《中國(guó)的平價(jià)開源AI模型DeepSeek驚艷全球科學(xué)家》
還沒有評(píng)論,,來說兩句吧...