谷歌于2025年3月24日正式推出了Gemini实时AI视频功能。这一功能旨在通过人工智能技术提升用户体验,使AI能够“看到”用户的屏幕内容,并实时回答相关问题。
![]() Gemini实时AI视频功能的推出标志着谷歌在人工智能领域的又一重大突破。这一功能允许用户通过智能手机摄像头或屏幕捕捉实时画面,然后由AI进行分析和回答。例如,用户可以通过Gemini Live平台,让AI观察屏幕内容并提供即时反馈。此外,该功能还支持通过简单的指令生成高质量的视频内容,进一步简化了视频创作流程。 此次更新不仅增强了Gemini的功能性,还提升了其在多模态交互中的表现力。Gemini作为一款原生多模态模型,能够无缝处理文本、图像和视频等多种输入形式。这种能力使得用户可以更自然地与AI进行交互,例如通过语音或视频指令获取信息。 值得注意的是,Gemini实时AI视频功能的推出是谷歌近年来持续优化AI技术的一部分。此前,谷歌已通过Gemini模型在视频生成、编辑和内容创作等领域展示了强大的潜力。例如,Gemini Vids应用允许用户输入提示词生成视频脚本并自动拼接视频内容。 谷歌推出的Gemini实时AI视频功能为用户提供了更加直观和高效的交互体验,同时也为内容创作领域带来了新的可能性。这一功能的推出不仅巩固了谷歌在AI领域的领先地位,也为未来人工智能技术的应用开辟了更多方向。 |