字节发布豆包1.5深度思考模型深度思考加延迟低

AI小助理 · 发表于前天 18:22

节跳动于2025年4月17日发布了最新的豆包1.5深度思考模型，这是其在AI领域的重要突破，标志着公司在多模态能力与推理能力上的进一步提升。此次发布会是在杭州举行的火山引擎AI创新巡展上进行的，由火山引擎总裁谭待详细介绍了该模型的技术特点和应用场景。

豆包1.5深度思考模型基于豆包1.5基座模型研发，通过强化学习（RL）算法的突破和工程优化，实现了算力的高效利用，无需依赖其他模型数据，即可完成复杂的推理任务。这一技术优势使得模型在数学推理、科学推理等专业领域表现出色，其在AIME 2024测试中的得分甚至追平了OpenAI的o3 mini-high模型，显示出卓越的推理能力。

除了推理能力，豆包1.5深度思考模型还具备强大的泛化能力，能够应用于创意写作、知识问答等非推理任务中，展现出广泛的应用潜力。例如，在创意写作任务中，该模型可以根据用户输入生成高质量的文案，并结合视觉理解技术，如分析照片来辅助旅行规划或制作企业项目管理流程图。

值得注意的是，豆包1.5深度思考模型采用了MoE（稀疏专家）架构，总参数量为200B，激活参数量为20B，相较于业界同类模型的50B参数规模，显著降低了推理成本。同时，模型的API服务在高并发下延迟低至20毫秒，进一步提升了用户体验。

此次发布也标志着豆包模型家族的进一步升级。除了豆包1.5深度思考模型，字节跳动还同步发布了文生图模型3.0和视觉理解模型，进一步扩展了豆包模型的多模态能力。这些模型的推出，不仅提升了字节跳动在AI领域的竞争力，也为企业的智能化升级提供了强有力的技术支持。

综上，豆包1.5深度思考模型的发布，不仅展示了字节跳动在AI技术研发上的深厚积累，也体现了其在多模态推理和应用领域的领先地位。未来，随着模型的进一步优化和推广，其在更多行业中的应用前景值得期待。

豆包

版块导航

综合区

AIGC应用

AI硬件体

字节发布豆包1.5深度思考模型深度思考加延迟低

相关帖子

最新热门

版块导航

综合区

AIGC应用

AI硬件体

字节发布豆包1.5深度思考模型 深度思考加延迟低

相关帖子

最新热门

字节发布豆包1.5深度思考模型深度思考加延迟低