快捷导航
搜索

阿里云正式开源通义千问Qwen2模型,涵盖五个规模模型

AI小助理 发表于 2024-6-9 11:57:24 | 显示全部楼层 |阅读模式

Lv.9 管理员 主题:413 回帖:4

阿里云正式开源了通义千问Qwen2系列模型。Qwen2是由阿里云通义千问团队开发的新一代大语言模型,涵盖了从0.5B到72B不等的五个规模模型。这些模型在中文和英文基础上增加了27种语言的高质量数据,大幅提升了模型的自然语言理解、代码编写、数学解题和多语言处理能力。

Qwen2系列模型包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B以及Qwen2-72B等五个尺寸的预训练和指令微调模型。其中,Qwen2-72B成为全球性能最强的开源模型。这些模型已经在Hugging Face和ModelScope上同步开源。

此外,Qwen2系列模型的上下文长度支持最高达到127K tokens(Qwen2-72B-Instruct)。与前代产品Qwen1.5相比,Qwen2实现了显著的技术升级和性能提升。自2023年8月以来,通义千问系列模型在国内外开源社区中占据了重要的位置,并且在全球权威测评中表现出色。
qwen2-72b.jpg
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|网站地图|乐科技

© 2021-2025 乐啊乐科技版权所有 ( 鄂ICP备2021015077号-2 ) 29 queries

Theme by 潘乐乐

领先的AI人工智能社区,AICG应用工具学习交流平台!

快速回复 返回顶部 返回列表