开云体育(中国)官方网站  FLAME由两个见识的评测基准构成-开云(中国)Kaiyun·官方网站 - 登录入口
发布日期:2026-02-12 04:55    点击次数:166

开云体育(中国)官方网站  FLAME由两个见识的评测基准构成-开云(中国)Kaiyun·官方网站 - 登录入口

  新京报贝壳财经讯(记者白金蕾)12月23日开云体育(中国)官方网站,百川智能发布全链路增盛大模子Baichuan4-Finance(百川智能旗下大模子)。在金融数据的基础上,通过鸿沟自拘谨老师决策,Baichuan4-Finance杀青了金融才气和通用才气同步进步的截至。该模子在中国东谈主民大学财政金融学院新近发布的评测体系FLAME以及国内开源金融评测基准FinanceIQ上均登上榜首。

  当今Baichuan4-Finance API已在百川智能官网厚爱上线。

  FLAME由两个见识的评测基准构成。其中,FLAME-Cer主要面向模子的专科金融才气评测,灭绝了CPA(注册管帐师老师)、CFA(特准金融分析师)、FRM(金融风险经管师)等14类巨擘金融履历认证;FLAME-Sce则侧重模子的场景专揽才气,包含10个一级中枢金融业务场景,21个二级细分金融业务场景,近百个三级金融专揽任务。

  FLAME-Cer评测截至线路,Baichuan4-Finance在银行、保障、基金、证券等多个履历认证鸿沟的准确率均打破了95%,全体准确率93.62%,率先GPT-4o(Open AI旗下一款大模子)和XuanYuan3-70B-Chat(国内首个开源华文金融大模子),超出GPT-4o近20%。在FLAME-Sce评测中,Baichuan4-Finance一级中枢金融业务场景的全体可用率达84.15%,其金融数据策动、金融常识表面等场景的可用率更是跳动90%。

  中国东谈主民大学财政金融学院FLAME-Cer测评截至。图|受访者供图

  此外开云体育(中国)官方网站,在国内主流开源金融评测基准FinanceIQ上Baichuan4-Finance相似高出了GPT-4o和XuanYuan3-70B-Chat,全体准确率达到79.23%,率先GPT-4o近13%。

  FinanceIQ测评截至。图|受访者供图

  奈何让模子在进步专科才气的同期不吃亏通用才气,是当下大模子落地具体场景最大的碎裂。为治理这一问题,百川智能打造了一套全链路鸿沟增强决策,该决策灭绝了高质地数据集构建、模子预老师、微调、强化学习等从模子研发到场景专揽的全进程。

  具体而言,Baichuan4-Finance的金融数据集全面且严谨,既包含金融专科讲义与学术著述、顶级金融期刊论文、监管机构战略文献、金融法律规定等中枢专科金融常识数据,也灭绝了金融专科问答集、企业财报与年度叙述、金融类有计划分析叙述等实施专揽类数据,为进步模子金融才气提供了底层撑抓。在此基础上,Baichuan4-Finance还在鸿沟自拘谨老师过程中引入了更高精的通用数据,与金融数据一齐进行羼杂老师,最终杀青了模子通用才气不下落,金融才气增长的截至。

  此外,百川智能在后老师次序也作念了多数增强使命,如:通过合成数据、教导数据对模子进行有监督的微调;在强化学习策略中,针对数学策动等金融鸿沟相配温文的场景进行样本增强等,进一步进步了模子性能。



热点资讯
相关资讯