提升大模型自动修Bug能力豆包正式开源首个多语言类SWE数据集

更新时间：2025-10-08 05:14:31 发布时间：180天前浏览：1307 评论：0

收藏

分享

内容摘要快科技4月10日消息，今日，字节跳动豆包大模型团队宣布，正式开源首个多语言类SWE数据集 Multi-SWE-bench，可用于评估和提升大模型自动修 Bug 能力。在SWE-bench基础上，Multi-SWE-bench首次覆盖Pyt

快科技4月10日消息，今日，字节跳动豆包大模型团队宣布，正式开源首个多语言类SWE数据集 Multi-SWE-bench，可用于评估和提升大模型自动修 Bug 能力。

在SWE-bench基础上，Multi-SWE-bench首次覆盖Python之外的7种主流编程语言（Java、Go、Rust、C、C++、Typescript、Javascript），是真正面向全栈工程的评测基准。

Multi-SWE-bench包含1632个实例，均来自GitHub issue，并经过统一的测试标准和专业开发者的审核筛选，确保每个样本具备清晰的问题描述、正确的修复补丁以及可复现的运行测试环境。

豆包大模型团队希望，Multi-SWE-bench能作为大模型在多种主流编程语言与真实代码环境中的系统性评测基准，推动自动编程能力向更实用、更工程化的方向发展。

团队表示，相比于以往聚焦Python的单语言任务，Multi-SWE-bench更贴近现实中的多语言开发场景，也更能反映当前模型在自动化软件工程方向上的实际能力边界。

提升大模型自动修Bug能力豆包正式开源首个多语言类SWE数据集

举报收藏打赏 评论 0

版权声明 本文仅代表作者观点，不代表本站立场。
如遇本文系为网络转载到本站发表，图片或文章有版权问题的请联系客服确认后会立即删除文章。
如遇本文系作者授权本站发表，未经许可，不得转载。

--结束END--

有问题投稿请发送至: 邮箱/

本文标题: 提升大模型自动修Bug能力豆包正式开源首个多语言类SWE数据集

本文链接: http://www.cnhhw.cn/news/show-51157.html (转载时请保留)

0 条

雷军：小米17系列靠背屏等创新开售仅5天销量破100万台

科技 dgyuanmu ⋅ 11阅读量 ⋅ 0评论 ⋅ 1天前

2025-10-06
终于知道酷睿Ultra X什么意思了！满血12核心核显

科技 jdghhg2010 ⋅ 10阅读量 ⋅ 0评论 ⋅ 1天前

2025-10-06
AMD RX 9000显卡在澳大利亚表现不俗：份额高达44％

科技 jxndlsc ⋅ 6阅读量 ⋅ 0评论 ⋅ 1天前

2025-10-06
中国科技公司展示新型无人机货柜收发集群技术：一键快速放飞和回收数千架无人机

科技 hnkmd888 ⋅ 9阅读量 ⋅ 0评论 ⋅ 1天前

2025-10-06
库克65岁在即苹果硬件主管成CEO最大热门接班人选

科技 haozhisheng8888 ⋅ 7阅读量 ⋅ 0评论 ⋅ 1天前

2025-10-06
全球首个！OpenAI将推“AI版抖音”：禁止上传实拍内容视频100%由AI生成

科技 gzbjh88 ⋅ 2阅读量 ⋅ 0评论 ⋅ 1天前

2025-10-06
龟鳖目：本可成为水中的顶级掠食者可惜了

科技 jnhwhgc ⋅ 20阅读量 ⋅ 0评论 ⋅ 1天前

2025-10-06
微软继续推进下一代Xbox主机

科技 xhddc ⋅ 2阅读量 ⋅ 0评论 ⋅ 1天前

2025-10-06
新势力品牌年度目标完成率：小鹏第一销量暴涨超200%

科技 miaomiao9090 ⋅ 10阅读量 ⋅ 0评论 ⋅ 1天前

2025-10-06
明明能视频聊天为啥非要抢票挤车回家：真相扎心

科技 hongfamaoyi2010 ⋅ 13阅读量 ⋅ 0评论 ⋅ 1天前

2025-10-06

去ta空间

24小时热闻

今日推荐

(c)2016-2021 SOQUANMAO.COM All Rights Reserved搜全贸版权所有浙ICP备19001410号-1

浙ICP备19001410号-1