两大AI模型性能提升登上国际榜单

应用开发2025-11-05 12:15:08449

科技日报讯(记者李禾)近日，模型由盛大AI团队研发的提升模型Watt-tool-70B和Newsbang/homer-72B，登上国际知名AI排行榜榜首。登上其中，国际Watt-tool-70B是榜单由盛大旗下Watt团队研发的旗舰模型，目前位列BFCL Leaderboard总榜单第一。模型

据悉，提升榜单BFCL Leaderboard是登上由加州大学伯克利分校开发的评估LLM工具调用能力基准测试平台。作为目前大语言模型(LLM)最热门的国际研究方向之一，工具调用(Function-Calling)是榜单为了让LLM理解，并能准确使用API(应用程序编程接口)，模型来执行更复杂而具体的提升任务。免费源码下载在近期公布的登上最新一轮评估结果中，Watt的国际“多轮对话执行能力”相较于排名第二的GPT-4o 领先11分，比排名第十的榜单Gemini-1.5-Pro 领先近40分。

“这个模型将加速大模型落地‘融合’过程。”Watt有关负责人说，还有助于从底层数据标注到人机交互的体系化建设，让大模型初步实现从“光说不练”到“能文能武”。

此外，由盛大集团NewsBang团队开发的Newsbang/homer-72B 模型位列Open LLM LeaderBoard v2榜单第一。Open LLM Leaderboard V2是由Hugging Face维护的开源语言模型评测平台升级版本，采用更全面和严格评估标准，免费信息发布网对各类开源大语言模型进行多维度测试和排名。Newsbang/homer-72B重视提升模型在推理和思考方面的能力，通过搭配数据筛选机制等，在多个核心评测维度，该模型性能有了大幅提升。

据公开报道，2023年初，盛大集团宣布All in AI战略，去年10月，联合多家高校发表了AI与长期记忆方面的论文，其自研的OMNE大模型多智能体框架登上GAIA 基准测试排行榜榜首;其旗下的天桥脑科学研究院(TCCI)与国际学术杂志《Science》合作推出全球AI驱动科学大奖，举办和支持包括“AI+精神健康”在内的各种高水平国际会议和夏校项目，助力培养跨学科青年AI人才等。

服务器托管

本文地址：http://www.bzve.cn/html/420b1799562.html

版权声明

本文仅代表作者观点，不代表本站立场。
本文系作者授权发表，未经许可，不得转载。

两大AI模型性能提升登上国际榜单

本文地址：http://www.bzve.cn/html/420b1799562.html

版权声明

热门文章

热门标签

全站热门

热门文章

两大AI模型性能提升 登上国际榜单

本文地址：http://www.bzve.cn/html/420b1799562.html

版权声明

相关文章

热门文章

热门标签

全站热门

热门文章

两大AI模型性能提升登上国际榜单