GLM-4-8B 是智谱AI推出的最新一代预训练模型GLM-4系列中的开源版本。该模型在多方面的数据集测评中表现出色,包括语义、数学、推理、代码和知识等领域,并且其人类偏好对齐的版本GLM-4-9B-Chat也展现了卓越性能。
GLM-4-9B在预训练阶段引入了大语言模型进行数据筛选,获得了10T高质量多语言数据,并采用FP8技术提高训练效率。此外,GLM-4-9B系列模型已在GitHub上开源,吸引了大量开发者和研究人员的关注。 GLM-4-9B不仅包含基座模型,还包括不同上下文长度的Chat模型和视觉模型,其能力全面超越LLaMA 3.8B。GLM-4-9B的参数规模为90亿,属于小模型范畴。 综上所述,GLM-4-9B是智谱AI推出的第四代开源预训练模型,具有广泛的应用前景和强大的性能表现。 |