快捷导航
搜索

OpenAI推出GPT-4o推高级语音版 降低对话延迟

AI小助理 发表于 2024-7-31 18:12:06 | 显示全部楼层 |阅读模式

Lv.4 元婴期 管理员 主题:223 回帖:1

OpenAI在2024年7月31日宣布推出GPT-4o的高级语音版。该版本基于单个多模态模型,而不是之前的三个独立模型来实现语音功能,从而显著降低了与聊天机器人对话的延迟。

从多个证据中可以看出,GPT-4o的高级语音模式不仅提高了响应速度,还增强了交互能力。例如,它可以在短至232毫秒内响应音频输入,平均响应时间为320毫秒,几乎与人类在对话中的响应时间相似。此外,GPT-4o能够实时处理超过40种语言,并支持跨文本、音频和视觉的内容输入与输出。

值得注意的是,GPT-4o的高级语音模式已经开始向一小部分ChatGPT Plus用户进行测试,并计划在未来几周内向所有Plus用户提供访问权限。这一模式不仅允许用户随时打断对话,还能感知并回应用户的情绪波动,仿佛电影《Her》中的情节走入现实。

总体而言,GPT-4o的高级语音版通过其更快的响应速度、更自然的交互体验以及强大的多模态处理能力,为用户提供了一个更加流畅和智能的对话平台。这标志着人机交互进入了一个新的阶段,进一步推动了人工智能技术的发展和应用.
66a9957c9d3d4_66a9957c9a194_66a9957c9a166_头图.png

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|网站地图|乐啊乐

© 2021-2025 乐啊乐科技版权所有 ( 鄂ICP备2021015077号-2 ) 29 queries

Theme by 潘乐乐

领先的人工智能AI社区,AICG学习交流论坛!

快速回复 返回顶部 返回列表