阿里云通义大模型团队开源最新代码模型Qwen2.5-Coder系列

AI小助理 · 发表于 2024-11-13 18:20:19

阿里云通义大模型团队于2024年11月12日宣布开源了最新代码模型Qwen2.5-Coder系列。这一系列包括0.5B、1.5B、3B、7B、14B和32B共6种不同尺寸的模型，每个尺寸都提供了Base和Instruct两种模型版本，以适应不同的应用场景和需求。

Qwen2.5-Coder系列模型在代码生成、推理和修复等核心任务上展现出业界领先的性能。特别是Qwen2.5-Coder-32B-Instruct在多个代码生成基准评测中刷新了开源模型的记录，并在某些方面超越了闭源模型GPT-4o。这些模型基于Qwen2.5基础大模型进行初始化，使用源代码、文本代码混合数据、合成数据等5.5T tokens的数据持续训练，显著提升了AI编程的性能和效率。

Qwen2.5-Coder支持128K上下文长度，覆盖92种编程语言，使其在代码生成、多语言代码生成、代码补全和代码修复等多个代码相关评估任务中取得了显著进展。此外，Qwen2.5-Coder还通过指令微调进一步提升了多个任务上的性能，并在更多的评估中体现出了卓越的泛化性。

此次开源的Qwen2.5-Coder系列模型均采用Apache 2.0许可证，而3B模型则使用Research Only许可证。这为开发者提供了更全面的工具选择，使他们在编程领域的创作效率得到大幅提升。

阿里云通义大模型团队此次发布的Qwen2.5-Coder系列模型不仅在性能上实现了重大突破，还为开发者提供了强大的编程工具，进一步推动了AI编程领域的发展。

版块导航

综合区

AIGC应用

AI硬件体

阿里云通义大模型团队开源最新代码模型Qwen2.5-Coder系列

最新热门