阿里云正式开源了通义千问Qwen2系列模型。Qwen2是由阿里云通义千问团队开发的新一代大语言模型,涵盖了从0.5B到72B不等的五个规模模型。这些模型在中文和英文基础上增加了27种语言的高质量数据,大幅提升了模型的自然语言理解、代码编写、数学解题和多语言处理能力。
Qwen2系列模型包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B以及Qwen2-72B等五个尺寸的预训练和指令微调模型。其中,Qwen2-72B成为全球性能最强的开源模型。这些模型已经在Hugging Face和ModelScope上同步开源。 此外,Qwen2系列模型的上下文长度支持最高达到127K tokens(Qwen2-72B-Instruct)。与前代产品Qwen1.5相比,Qwen2实现了显著的技术升级和性能提升。自2023年8月以来,通义千问系列模型在国内外开源社区中占据了重要的位置,并且在全球权威测评中表现出色。 |