近年來,從應急救援、金融服務,到交通出行、能源電力,行業(yè)大模型如雨后春筍般發(fā)展。如何架構(gòu)行業(yè)垂直大模型,適應千行百業(yè)的場景需求?業(yè)界人士表示,行業(yè)大模型的火熱將助推數(shù)據(jù)收集、數(shù)據(jù)標注、數(shù)據(jù)治理等規(guī)范高效發(fā)展。那些能夠服務行業(yè)痛點,通過場景應用不斷迭代提效的大模型,將在發(fā)展中搶占先機。
行業(yè)大模型,指的是面向特定行業(yè)領(lǐng)域需求打造、適配行業(yè)場景的專用大型模型。與通用大模型相比,行業(yè)大模型通過對垂直細分領(lǐng)域的數(shù)據(jù)進行更有針對性地訓練和優(yōu)化,能更有效地完成專業(yè)性工作。天眼查數(shù)據(jù)顯示,截至目前,全國已有210余條行業(yè)大模型相關(guān)專利和110余條垂直大模型相關(guān)專利布局。這一數(shù)據(jù)表明,我國正加速推進人工智能技術(shù)從通用化向行業(yè)化、場景化深度演進。
“通用人工智能大模型在應急管理行業(yè)適用性不強?!贝髷?shù)據(jù)與人工智能應用創(chuàng)新應急管理部重點實驗室主任劉永強表示,面對?;繁O(jiān)管、災害處置預案等專業(yè)性較強的問題,通用大模型的回答準確率偏低。目前,培育行業(yè)大模型需要將積累的高質(zhì)量數(shù)據(jù)經(jīng)標注加工后,通過后訓練方式融入通用大模型的參數(shù)庫,而非簡單掛載知識庫進行檢索式問答。
百度智能云政務行業(yè)總經(jīng)理傅鵬表示,通用大模型更多面向C端,提供問答、圖片視頻處理等通用能力。而垂類行業(yè)大模型,核心需求是支撐專業(yè)應用場景落地,提升管理效能和實戰(zhàn)效果。
對于提高行業(yè)大模型的有效性,劉永強認為,要重點開展兩方面工作,其一是構(gòu)建高質(zhì)量數(shù)據(jù)集,其二是基于微調(diào)技術(shù)對大模型訓練調(diào)優(yōu)。未來,要建強大數(shù)據(jù)和大模型底座,構(gòu)建行業(yè)高質(zhì)量數(shù)據(jù)集,帶動應用場景的拓展。
“這就要求行業(yè)模型要達到多模態(tài)數(shù)據(jù)處理能力,整合圖像、文本、視頻、傳感器等各類數(shù)據(jù);提升高效響應能力,在短時間內(nèi)完成數(shù)據(jù)處理、分析和決策支持;實現(xiàn)自主化流程編排能力,在復雜場景要自動完成多環(huán)節(jié)協(xié)同操作,提升工作效率?!备爹i說。
此外,攻克大模型“幻覺”是業(yè)界關(guān)注的重點?!按竽P偷腻e誤回答可能導致執(zhí)法誤判、救援失誤等嚴重后果。我們正在構(gòu)建大模型的自我評估能力,讓模型根據(jù)場景應用效果自主判斷回答質(zhì)量,并進行自我迭代更新?!眲⒂缽娬f,要基于知識圖譜的檢測技術(shù),及時發(fā)現(xiàn)大模型的“幻覺”問題,采用插件化生成技術(shù)進行糾偏,暫時無法糾偏時則禁止輸出。
業(yè)界人士表示,在大模型賦能行業(yè)發(fā)展的同時,行業(yè)也為大模型迭代升級提供了應用場景。前些年大家多是重視算力、芯片,如今對行業(yè)大模型的應用場景更為關(guān)注,要能解決行業(yè)實際問題。
未來,行業(yè)大模型要致力于理解和解讀“復雜環(huán)境”的專業(yè)語言,并深度融入行業(yè)的核心業(yè)務流程與關(guān)鍵場景。以交通領(lǐng)域為例,中新數(shù)字科技(四川)有限公司董事長李河表示,應堅持以真實場景需求為牽引、以自主技術(shù)創(chuàng)新為驅(qū)動、以行業(yè)政策標準為依據(jù),系統(tǒng)性提升從感知、決策到執(zhí)行的全鏈條運營效率。隨著技術(shù)與業(yè)務場景的深度融合,持續(xù)增強模型在多樣化場景下的自適應能力、全周期數(shù)據(jù)安全治理能力以及產(chǎn)業(yè)鏈協(xié)同支撐能力,推動行業(yè)大模型實現(xiàn)從“單點技術(shù)突破”向“全場景業(yè)務協(xié)同”演進。