两大AI模型性能提升 登上国际榜单

应用开发2025-11-05 12:15:08449

科技日报讯(记者李禾)近日,模型由盛大AI团队研发的提升模型Watt-tool-70B和Newsbang/homer-72B,登上国际知名AI排行榜榜首。登上其中,国际Watt-tool-70B是榜单由盛大旗下Watt团队研发的旗舰模型,目前位列BFCL Leaderboard总榜单第一。模型

据悉,提升榜单BFCL Leaderboard是登上由加州大学伯克利分校开发的评估LLM工具调用能力基准测试平台。作为目前大语言模型(LLM)最热门的国际研究方向之一,工具调用(Function-Calling)是榜单为了让LLM理解,并能准确使用API(应用程序编程接口),模型来执行更复杂而具体的提升任务。免费源码下载在近期公布的登上最新一轮评估结果中,Watt的国际“多轮对话执行能力”相较于排名第二的GPT-4o 领先11分,比排名第十的榜单Gemini-1.5-Pro 领先近40分。

“这个模型将加速大模型落地‘融合’过程。”Watt有关负责人说,还有助于从底层数据标注到人机交互的体系化建设,让大模型初步实现从“光说不练”到“能文能武”。

此外,由盛大集团NewsBang团队开发的Newsbang/homer-72B 模型位列Open LLM LeaderBoard v2榜单第一。Open LLM Leaderboard V2是由Hugging Face维护的开源语言模型评测平台升级版本,采用更全面和严格评估标准,免费信息发布网对各类开源大语言模型进行多维度测试和排名。Newsbang/homer-72B重视提升模型在推理和思考方面的能力,通过搭配数据筛选机制等,在多个核心评测维度,该模型性能有了大幅提升。

据公开报道,2023年初,盛大集团宣布All in AI战略,去年10月,联合多家高校发表了AI与长期记忆方面的论文,其自研的OMNE大模型多智能体框架登上GAIA 基准测试排行榜榜首;其旗下的天桥脑科学研究院(TCCI)与国际学术杂志《Science》合作推出全球AI驱动科学大奖,举办和支持包括“AI+精神健康”在内的各种高水平国际会议和夏校项目,助力培养跨学科青年AI人才等。

服务器托管
本文地址:http://www.bzve.cn/html/420b1799562.html
版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

热门文章

全站热门

富勒G60(豪华、高性能、环保,一辆领先的电动SUV)

Oracle数据字典

PostgreSQL连接JAVA接口

Hadoop RPC通信Client客户端的流程分析

快速恢复误删U盘数据的有效方法(掌握最快速恢复U盘数据的技巧,轻松应对数据丢失问题)

CS:GO 交易网站被黑,价值 600 万美元皮肤被盗

SQL Server 2008中增强的汇总技巧

深入浅出解析大数据平台架构

友情链接

滇ICP备2023006006号-39