新華社倫敦7月22日電 谷歌旗下“深層思維”公司21日宣布,其搭載了“深度思考”能力的高級(jí)版“雙子座(Gemini)”人工智能模型測(cè)試得分達(dá)到國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽(IMO)金牌水平,該成績(jī)已獲官方認(rèn)證。
“深層思維”公司在官網(wǎng)發(fā)布公報(bào)說(shuō),高級(jí)版“雙子座”模型的“深度思考”模式成功解答了2025年國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽6道題目中的5道,共獲35分,達(dá)到金牌水平。相關(guān)解題方案已在網(wǎng)上公布。
“我們可以證實(shí),谷歌‘深層思維’已達(dá)成這一備受期待的里程碑,在總分42分中獲得35分——這已達(dá)到(今年)金牌分?jǐn)?shù)線?!眹?guó)際數(shù)學(xué)奧林匹克競(jìng)賽主席格雷戈?duì)枴ざ嗬{爾教授說(shuō)。他稱解題方案在諸多方面都“令人驚嘆”。國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽評(píng)分員認(rèn)為這些方案清晰、精確,且大多數(shù)都易于理解。
國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽自1959年起每年舉辦一屆,參賽選手需在兩天(每天各4.5小時(shí))內(nèi)解答涉及代數(shù)、組合數(shù)學(xué)、幾何和數(shù)論四大領(lǐng)域的6道極具難度的題目。近年來(lái),該競(jìng)賽成為檢驗(yàn)人工智能模型解決高級(jí)數(shù)學(xué)問(wèn)題能力和推理能力的熱門(mén)挑戰(zhàn)。
“深層思維”公司推出的人工智能模型AlphaProof與AlphaGeometry 2組合解答了2024年國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽6道題中的4道,以28分的成績(jī)達(dá)到當(dāng)年銀牌水平。為了讓這兩個(gè)模型理解題目,專(zhuān)家先將題目從自然語(yǔ)言翻譯成特定計(jì)算機(jī)語(yǔ)言,解題總共耗費(fèi)兩到三天的計(jì)算時(shí)間。今年,高級(jí)版“雙子座”測(cè)試成果相比去年有顯著進(jìn)展,它直接根據(jù)自然語(yǔ)言描述的題目給出數(shù)學(xué)證明,并在競(jìng)賽時(shí)限內(nèi)完成挑戰(zhàn)。競(jìng)賽協(xié)調(diào)員采用與學(xué)生選手解題方案相同的標(biāo)準(zhǔn)對(duì)其進(jìn)行正式評(píng)分和認(rèn)證。
“深層思維”公司說(shuō),今年取得的成果得益于高級(jí)版“雙子座”的“深層思考”模式——這是一種針對(duì)復(fù)雜問(wèn)題的增強(qiáng)推理模式,融合了“并行思維”等最新技術(shù)。這種模式設(shè)置可使模型在給出最終答案之前,同時(shí)探索并整合多種可能的解決方案,而非沿著單一、線性思路推進(jìn)。