??
? 随着我国“人工智能+”行动加速推进,蚂小财大模型技术在金融领域的金融I金应用持续落地。为全面评估金融领域大模型的领域炉理WhatsApp%E3%80%90+86%2015855158769%E3%80%91crane%20island%20florida专业、可靠程度,最新近日,评测上海财经大学推出的榜出国内首个金融领域大模型评估基准升级为FinEval 6.0,新增了金融严谨性等维度并发布首份评测报告。融专FinEval 6.0对国内外主流大模型的业表评测显示,蚂蚁集团旗下理财AI“蚂小财”的现排模型底座在金融严谨性等维度表现突出排名第一,跑赢了众多通用大模型。名第

(金融领域大模型应用评测榜单,上财)
? 公开资料显示,领域炉理上海财经大学是最新国内最早开展金融领域大模型测评工作的高校,并在2024年参与制定了《金融大模型应用测评指南》,评测WhatsApp%E3%80%90+86%2015855158769%E3%80%91crane%20island%20florida这是全国首个以金融业务能力为核心的团体标准。此次,上海财经大学结合对AI企业、金融机构的调研与投资者洞察,重点完善了FinEval 6.0的严谨性评测样本,从金融学术知识、金融行业理解、金融严谨性测试、金融安全认知、金融智能体应用等关键维度,全面评估大模型在复杂金融业务场景中的表现。
? 同时,F(xiàn)inEval 6.0对国内外9款有代表性的大模型进行评测,包括DeepSeek-R1、GPT- 4o等通用基础模型,以及金融垂直领域模型。评测报告结果显示,参评模型在金融学术知识方面的表现整体优异,但在金融严谨性、金融行业理解等适配复杂场景的能力上表现各异。其中,理财AI“蚂小财”的模型底座、蚂蚁自研Finix大模型整体表现较好,总分跑赢了通用大模型。尤其在金融严谨性上,行业均值为70.27分,蚂小财超出均值17分显著领先。
?

?(金融領(lǐng)域大模型應(yīng)用嚴(yán)謹(jǐn)性評(píng)測(cè)排名,上財(cái))
? 官方數(shù)據(jù)顯示,“螞小財(cái)”是螞蟻集團(tuán)旗下的AI理財(cái)管家,連接了螞蟻財(cái)富平臺(tái)生態(tài)內(nèi)200多家基金公司、券商和財(cái)經(jīng)媒體的內(nèi)容與服務(wù)。在通用大模型的基礎(chǔ)上,“螞小財(cái)”技術(shù)團(tuán)隊(duì)還搭建了一套金融智能增強(qiáng)的技術(shù)體系,實(shí)現(xiàn)了金融場(chǎng)景內(nèi)專(zhuān)業(yè)功能、交互體驗(yàn)的全面增強(qiáng)。
? “金融領(lǐng)域是國(guó)內(nèi)AI技術(shù)應(yīng)用的焦點(diǎn)場(chǎng)景之一,但天然也對(duì)AI的專(zhuān)業(yè)性、嚴(yán)謹(jǐn)性等能力提出更高標(biāo)準(zhǔn)。? ? 目前國(guó)內(nèi)AI在金融領(lǐng)域的表現(xiàn)逐漸提升,不斷從“博聞強(qiáng)識(shí)”走向“專(zhuān)業(yè)審慎”,為下一階段大規(guī)模應(yīng)用打好了基本盤(pán)。”測(cè)評(píng)團(tuán)隊(duì)負(fù)責(zé)人、上海財(cái)經(jīng)大學(xué)教授張立文表示,這些“AI+金融場(chǎng)景”的積極穩(wěn)妥探索,有助于在國(guó)際AI產(chǎn)業(yè)競(jìng)爭(zhēng)中保持領(lǐng)先身位,也將打開(kāi)我國(guó)數(shù)字金融、普惠金融建設(shè)的新局面。



































