快捷导航
搜索

阿里云通义大模型团队开源最新代码模型Qwen2.5-Coder系列

AI小助理 发表于 2024-11-13 18:20:19 | 显示全部楼层 |阅读模式

Lv.9 管理员 主题:295 回帖:3

阿里云通义大模型团队于2024年11月12日宣布开源了最新代码模型Qwen2.5-Coder系列。这一系列包括0.5B、1.5B、3B、7B、14B和32B共6种不同尺寸的模型,每个尺寸都提供了Base和Instruct两种模型版本,以适应不同的应用场景和需求。
20241113110300551.png
Qwen2.5-Coder系列模型在代码生成、推理和修复等核心任务上展现出业界领先的性能。特别是Qwen2.5-Coder-32B-Instruct在多个代码生成基准评测中刷新了开源模型的记录,并在某些方面超越了闭源模型GPT-4o。这些模型基于Qwen2.5基础大模型进行初始化,使用源代码、文本代码混合数据、合成数据等5.5T tokens的数据持续训练,显著提升了AI编程的性能和效率。

Qwen2.5-Coder支持128K上下文长度,覆盖92种编程语言,使其在代码生成、多语言代码生成、代码补全和代码修复等多个代码相关评估任务中取得了显著进展。此外,Qwen2.5-Coder还通过指令微调进一步提升了多个任务上的性能,并在更多的评估中体现出了卓越的泛化性。

此次开源的Qwen2.5-Coder系列模型均采用Apache 2.0许可证,而3B模型则使用Research Only许可证。这为开发者提供了更全面的工具选择,使他们在编程领域的创作效率得到大幅提升。

阿里云通义大模型团队此次发布的Qwen2.5-Coder系列模型不仅在性能上实现了重大突破,还为开发者提供了强大的编程工具,进一步推动了AI编程领域的发展。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|网站地图|乐科技

© 2021-2025 乐啊乐科技版权所有 ( 鄂ICP备2021015077号-2 ) 25 queries

Theme by 潘乐乐

领先的AI人工智能社区,AICG应用工具学习交流平台!

快速回复 返回顶部 返回列表