本報(bào)記者袁傳璽
12月18日,火山引擎在FORCE原動(dòng)力大會(huì)上正式發(fā)布豆包大模型1.8(Doubao-Seed-1.8)及音視頻創(chuàng)作模型Seedance1.5pro?;鹕揭婵偛米T待表示,截至今年12月份,豆包大模型日均token使用量突破50萬億,較去年同期增長超過10倍;目前已有超過100家企業(yè)客戶累計(jì)token使用量超過一萬億。
“目前大廠在多模態(tài)Agent(智能體)領(lǐng)域的競(jìng)爭(zhēng)已從單點(diǎn)模型能力比拼,升級(jí)為‘模型—平臺(tái)—生態(tài)’的系統(tǒng)化作戰(zhàn)?!敝袊苿?dòng)通信聯(lián)合會(huì)教育與科學(xué)技術(shù)研究院執(zhí)行院長陳曉華在接受《證券日?qǐng)?bào)》記者采訪時(shí)表示,火山引擎此次發(fā)布的產(chǎn)品旨在依托其日均調(diào)用量的規(guī)模優(yōu)勢(shì),在Agent生態(tài)底座上確立領(lǐng)先地位。
技術(shù)突圍
本次發(fā)布的豆包大模型1.8,其核心升級(jí)完全圍繞“打造更強(qiáng)大的Agent大腦”展開。與單純追求參數(shù)規(guī)模不同,該版本在設(shè)計(jì)之初便針對(duì)多模態(tài)Agent場(chǎng)景進(jìn)行定向優(yōu)化,在復(fù)雜指令遵循、多輪交互以及操作系統(tǒng)級(jí)別的實(shí)際操作(OSAgent)能力上實(shí)現(xiàn)了系統(tǒng)性增強(qiáng)。
在至關(guān)重要的多模態(tài)理解層面,豆包1.8完成了視覺能力的底層升級(jí)。其單次視頻理解幀數(shù)提升至1280幀,并能以低幀率解析超長視頻,在需要時(shí)調(diào)用工具對(duì)關(guān)鍵片段進(jìn)行高精度分析。這一能力使得模型能夠處理在線教育課程、工業(yè)質(zhì)檢視頻等復(fù)雜冗長的視覺信息,為Agent在真實(shí)場(chǎng)景中自主決策提供了感知基礎(chǔ)。
同步亮相的音視頻創(chuàng)作模型Seedance1.5Pro,則從內(nèi)容創(chuàng)作端展示了多模態(tài)融合的更高階形態(tài)。該模型采用創(chuàng)新的原生音視頻聯(lián)合生成架構(gòu),實(shí)現(xiàn)了毫秒級(jí)的音畫同步,并能基于畫面景深和角色數(shù)量,精準(zhǔn)匹配多人、多語言對(duì)話的口型。這解決了AI視頻生成中長期存在的“張口無聲”或口型錯(cuò)位的頑疾,將技術(shù)從“炫技”推向“實(shí)用”。
火山引擎推出上述兩個(gè)模型,標(biāo)志著大模型行業(yè)已從單純的參數(shù)競(jìng)賽,全面進(jìn)入了以多模態(tài)Agent為核心的產(chǎn)業(yè)落地新階段。賽智產(chǎn)業(yè)研究院人工智能研究所副所長安赟對(duì)《證券日?qǐng)?bào)》記者表示,這可以從三個(gè)維度來分析。其一,AI價(jià)值從“單點(diǎn)生成”向“全鏈路執(zhí)行”的質(zhì)變。通過多模態(tài)感知與Agent規(guī)劃能力的結(jié)合,AI能夠跨越感知與行動(dòng)的鴻溝,真正具備了在垂直場(chǎng)景中閉環(huán)完成任務(wù)的能力。其二,IT基礎(chǔ)設(shè)施從“功能驅(qū)動(dòng)”向“智能驅(qū)動(dòng)”的范式重構(gòu)?;鹕揭嫣岢龅摹癆I云原生架構(gòu)”極具前瞻性,揭示了未來的軟件形態(tài)將不再是傳統(tǒng)的SaaS堆棧,而是以Agent為主體的智能協(xié)同網(wǎng)絡(luò)。其三,大模型應(yīng)用正在跨越“成本與穩(wěn)定性”的規(guī)模化門檻。
競(jìng)爭(zhēng)加劇
事實(shí)上,主要云廠商均已將戰(zhàn)略重心調(diào)整至多模態(tài)智能體平臺(tái),競(jìng)爭(zhēng)維度從單一模型能力升級(jí)為全棧技術(shù)、開發(fā)生態(tài)與行業(yè)場(chǎng)景的立體化角逐。
阿里云在9月份的云棲大會(huì)上全面升級(jí)了其全棧AI體系,實(shí)現(xiàn)從AI大模型到AI基礎(chǔ)設(shè)施的技術(shù)更新。阿里通義旗艦?zāi)P蚎wen3-Max不僅在多項(xiàng)評(píng)測(cè)中躋身全球前列,更在聚焦Agent工具調(diào)用能力的Tau2-Bench測(cè)試中取得突破性高分。更重要的是,阿里云發(fā)布了全新的Agent開發(fā)框架ModelStudio-ADK和低代碼平臺(tái)ModelStudio-ADP,將Agent的開發(fā)效率提升至“1個(gè)小時(shí)就能輕松開發(fā)一個(gè)能生成深度報(bào)告的DeepResearch項(xiàng)目”的水平。
10月15日,百度搜索宣布全面升級(jí)文心助手AIGC創(chuàng)作能力,支持AI圖片、AI視頻、AI音樂、AI播客等8種模態(tài)創(chuàng)作。依靠百度搜索開放平臺(tái),文心助手支持一鍵調(diào)用多工具解決生活、健康、教育、工作等多場(chǎng)景問題。
在譚待看來,傳統(tǒng)的IT架構(gòu)已無法滿足Agent時(shí)代的需求,以模型為中心的AI云原生架構(gòu)正在形成,并圍繞Agent的開發(fā)與運(yùn)營進(jìn)行重構(gòu)。
面對(duì)競(jìng)爭(zhēng),火山引擎此次打出了“組合拳”?;鹕揭嫒嫔?jí)了企業(yè)級(jí)AIAgent平臺(tái)——AgentKit,覆蓋了Agent從開發(fā)、部署到管控的全生命周期。同時(shí),火山引擎推出了HiAgent智能體工作站,通過構(gòu)建統(tǒng)一的企業(yè)AI任務(wù)調(diào)度中心、提供一系列開箱即用的通用智能體,以及支持個(gè)性化定制智能體應(yīng)用,幫助企業(yè)實(shí)現(xiàn)Agent的規(guī)?;芾砼c應(yīng)用。
除了提升模型能力外,火山引擎還推出業(yè)內(nèi)首個(gè)“AI節(jié)省計(jì)劃”,該計(jì)劃通過階梯定價(jià),承諾最高可為按量付費(fèi)的企業(yè)節(jié)省47%的成本。
“通過從模型能力到基礎(chǔ)設(shè)施的全面革新,火山引擎正在推動(dòng)AI應(yīng)用從單一的模型調(diào)用向復(fù)雜的Agent智能體生態(tài)演進(jìn),加速AI在各行各業(yè)的深度落地?!弊T待表示。