阿里秘密研發(fā)新模型將發(fā)布,影響力指標(biāo)成最重要考核
出品|虎嗅商業(yè)消費(fèi)組
作者|苗正卿
題圖|視覺中國
虎嗅獨(dú)家獲悉,阿里即將在2025年4月第二周發(fā)布新模型Qwen3,這將是阿里在2025年上半年最重要的模型產(chǎn)品,距離2024年9月阿里在云棲大會上發(fā)布Qwen2.5過去了大約七個月的時間。
據(jù)虎嗅獨(dú)家了解,在2024年發(fā)布Qwen2.5后,阿里云內(nèi)部的基礎(chǔ)模型團(tuán)隊(duì)已經(jīng)開始推動Qwen3相關(guān)項(xiàng)目。但2025年初DeepSeek的火爆,改變了團(tuán)隊(duì)的部分思路與重心。“2024年四季度,圈內(nèi)已經(jīng)意識到模型的推理能力很重要,但還不能說是最重要的方向,DeepSeek火爆后,推理能力已經(jīng)成為繞不開的關(guān)鍵能力。”知情人士告訴虎嗅,DeepSeek-R1發(fā)布后,阿里云基礎(chǔ)模型團(tuán)隊(duì)把策略中心進(jìn)一步向模型的推理能力傾斜。
值得注意的是,在2024年下半年,阿里云基礎(chǔ)模型團(tuán)隊(duì)對標(biāo)的競品模型主要是OpenAI的o1,而在DeepSeek-R1發(fā)布后,DeepSeek-R1已經(jīng)成為了另一個主要對標(biāo)模型。
虎嗅獨(dú)家獲悉,在阿里內(nèi)部,基礎(chǔ)模型團(tuán)隊(duì)最重要的考核維度是“模型影響力”。在內(nèi)部,高層希望團(tuán)隊(duì)可以在業(yè)內(nèi)成功塑造“最強(qiáng)模型”的心智。阿里集團(tuán)CEO吳泳銘同時兼任阿里云CEO,據(jù)悉吳泳銘頻繁參與到基礎(chǔ)模型團(tuán)隊(duì)的業(yè)務(wù)溝通之中,并密切留意模型團(tuán)隊(duì)的各種進(jìn)展。
兩個具體的維度,被視為阿里基礎(chǔ)模型團(tuán)隊(duì)的考核點(diǎn):其一是衍生模型量,其二是在開發(fā)者社區(qū)的受歡迎度。
由于阿里采取模型開源策略,基于Qwen開源模型的衍生模型總量,被視為一個關(guān)鍵指標(biāo)。截至目前,這一數(shù)據(jù)已經(jīng)超過10萬。而在開發(fā)者社區(qū)的歡迎度,阿里會考慮多個具體指標(biāo),比如開源模型下載量等。虎嗅獲悉,2024年Qwen系列模型在開發(fā)者社區(qū)的下載量超過了2億。
“在開發(fā)者社區(qū)之中,一個模型的影響力,主要有兩個維度:一個是下載量,一個是衍生模型數(shù)。基于下載的開源模型,微調(diào)而成新的衍生模型后,需要重新上傳至開發(fā)者社區(qū)。所以這兩個維度可以比較好地反映一個開源模型的人氣。”一位知情人士告訴虎嗅,在阿里內(nèi)部針對全球開發(fā)者的模型影響力相關(guān)心智指標(biāo),從2024年開始就被高度重視,這和吳泳銘等技術(shù)出身的高管熟稔技術(shù)圈文化有關(guān)。
虎嗅另外獨(dú)家獲悉,2025年阿里模型團(tuán)隊(duì)也意識到了諸如智駕、AI Agent、AI硬件等機(jī)會風(fēng)口的存在。為了更好地契合這些場景,基礎(chǔ)模型團(tuán)隊(duì)依然會采取“多尺寸”策略。2024年發(fā)布的Qwen2系列,總共發(fā)布了7種不同的模型尺寸,而即將發(fā)布的Qwen3尺寸類型可能會更多。
值得注意的是,伴隨Qwen3發(fā)布,阿里正在開啟史上最大規(guī)模的校招,而虎嗅獲悉,校招的HC之中涉及到基礎(chǔ)模型團(tuán)隊(duì)的崗位量也達(dá)到史上最高。和以往不同的是,目前基礎(chǔ)模型團(tuán)隊(duì)在招人過程中,更看重人才的“AI原生”,也就是說更希望引入一開始接觸的就是大語言模型的人才,而非傳統(tǒng)的NLP人才( 自然語言模型 )。
文章標(biāo)題:阿里秘密研發(fā)新模型將發(fā)布,影響力指標(biāo)成最重要考核
文章鏈接:https://www.huxiu.com/article/4187485.html
閱讀原文:阿里秘密研發(fā)新模型將發(fā)布,影響力指標(biāo)成最重要考核_虎嗅網(wǎng)