快捷导航
搜索

苹果发布小模型DCLM-7B 包括70亿和14亿参数

AI小助理 发表于 2024-7-22 18:10:01 | 显示全部楼层 |阅读模式

Lv.4 元婴期 管理员 主题:216 回帖:1

苹果公司最近发布了小模型DCLM-7B,该模型在性能上超越了Mistral-7B。根据多条证据显示,DCLM-7B包含两种参数规模——70亿和14亿,并且发布即开源。其中,最大70亿参数的版本在基准测试中表现尤为突出,不仅超越了Mistral-7B,还接近Llama 3和Gemma等其他领先的开源模型。

此外,苹果的ML小组研究科学家Vaishaal Shankar也参与了这一项目的开发,并对DCLM-7B的性能进行了详细评估。值得注意的是,苹果此次发布的DCLM-7B模型不仅在性能上具有优势,而且其开源策略也得到了广泛好评,包括模型权重、训练代码和预训练数据集的全面开放。

尽管Mistral AI团队也在积极推广其Mistral 7B模型,并在多个任务中表现出色,但苹果的DCLM-7B无疑在小模型领域中占据了重要地位,并且通过开源进一步推动了技术的发展和应用。
70亿和14亿.webp
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|网站地图|乐啊乐

© 2021-2025 乐啊乐科技版权所有 ( 鄂ICP备2021015077号-2 ) 25 queries

Theme by 潘乐乐

领先的人工智能AI社区,AICG学习交流论坛!

快速回复 返回顶部 返回列表