中新社北京2月6日電 (記者 夏賓)乙巳蛇年,中國大模型密集“上新”,引發(fā)各方關注。
一邊是阿里云旗下大模型全新版本升級發(fā)布。1月29日凌晨,阿里云通義團隊發(fā)布的Qwen2.5-Max,該模型是阿里云通義團隊對MoE(混合專家模式)模型的最新探索成果,預訓練數(shù)據(jù)超過20萬億tokens。該新模型展現(xiàn)強勁的綜合性能,在多項公開主流模型評測基準上錄得高分。
另一邊是DeepSeek(深度求索)大模型迎來大量新平臺的接入上架。2月5日,華為表示,DeepSeek系列新模型正式上線昇騰社區(qū)。
此前,國家超算互聯(lián)網平臺也已上線DeepSeek系列模型。用戶目前也可在百度智能云、騰訊云、360數(shù)字安全等平臺上調用DeepSeek模型。
第三方大模型性能測試平臺Chatbot Arena近日公布的最新大模型盲測榜單顯示,包括DeepSeek、阿里云、智譜在內的多家中國公司旗下大模型憑借出眾的性能躋身前列,這些國產大模型在部分單項性能上也實現(xiàn)了對海外主流大模型的趕超。
據(jù)悉,Chatbot Arena目前已集成190多種模型,該平臺推出的測評榜單采用匿名方式將大模型兩兩組隊,交給用戶盲測,用戶根據(jù)真實對話體驗對模型能力進行投票。
上述榜單成績在中外社交媒體上引發(fā)熱議。在小紅書上,“大模型中國造”成了新詞,有網友直言:“期待國產大模型越來越好,給海內外帶來新的震撼!”
在X上,不少海外網友表示,中國新模型的迭代速度和質量令人驚艷,甚至還有人打趣地為OpenAI首席執(zhí)行官奧特曼(Sam Altman)擔憂。
平安證券研究報告稱,近期,國產大模型產品密集更新和迭代升級,中國算法能力及模型效果逐漸接近和趕超國際主流產品,國產大模型應用落地步伐有望加速。
微軟首席執(zhí)行官薩提亞·納德拉在今年的冬季達沃斯論壇上表示,DeepSeek的新模型令人印象深刻,尤其是在如何高效開發(fā)開源模型并進行推理計算方面,它的計算效率非常出色。“我們應當非常、非常認真地對待來自中國的這些技術進展?!?/p>
華泰證券策略研究近期發(fā)布報告則提到,中美科技股估值在過去兩年分化顯著,AI發(fā)展水平或是關鍵。DeepSeek具有低成本、高性能優(yōu)勢,引發(fā)行業(yè)對資本開支、應用場景等討論,或推動投資者重新評估中國科技企業(yè)的技術潛力,進而催化中美科技股價值重估。
中信證券研究報告認為,2025年有望成為A股市場主題投資大年,主題賽道是市場普遍關注的焦點,多個因素將共同推動2025年全年A股市場的主題投資機遇,其中之一便是,在AI等新技術成熟和新商業(yè)模式清晰催化下,更多新興產業(yè)有望步入高速成長期。(完)