Gemini Live变得更聪明：屏幕共享，视频流和改进的语言理解

Google是

制作它的双子座Live AI助手甚至更聪明，更具吸引力，具有屏幕共享和实时视频流的新功能，以及其语言理解能力的重大改进。

在给用户的电子邮件中，Google透露，Gemini Live已通过其最新的AI模型进行了升级，提高了其了解不同语言，口音和方言的能力。该更新还包括改进翻译，以及使用屏幕共享和实时视频流的能力。

双子座实时更新电子邮件。

就像我们都知道的那样，这些AI助手越好，他们从我们那里得到的个人信息越多，因此Google希望将用户的音频，视频和屏幕屏幕共享数据在其Gemini Apps活动中共享数据也就不足为奇了。值得庆幸的是，您可以选择将其关闭。当前，如果您启用了Gemini Apps活动，则仅保存对话成绩单。

深入矩阵

至于这些新功能的发展，它们很可能由多式联运API提供动力，该API于去年年底以Gemini 2.0发行。该API允许开发人员处理各种输入，包括文本，音频和视频，并生成文本或音频响应。

不过，这种开发并不令人惊讶，因为它与多模式AI的行业趋势保持一致，在该趋势中，系统可以无缝处理并响应不同类型的输入，从而使它们更加通用和用户友好。

称为双子座2.0“代理时代”的开始，AI可以自己做更多的事情。该模型与OpenAI的O1相当，但具有本地生成图像，语音，文本等的增加能力。

阵容中的第一个是Gemini 2.0 Flash，它的速度是其前身Gemini Pro 1.5的两倍。从简单的对话和内容产生的“聊天机器人时代”转变为推理和独立行动的时代，它标志着AI功能迈出的重要一步。

“代理时代”表示向AI的转变，不仅可以理解和响应请求，还可以预测需求并主动完成任务，使其成为我们数字生活中更加集成和不可或缺的一部分。

AI的这种发展有可能彻底改变各个部门，从客户服务和教育到医疗保健和个人生产力。但这也是朝着进步的令人担忧的一步，因为这是以隐私为代价的。

这些对Gemini Live的更新目前正在向用户推出，并承诺具有更直观和动态的AI体验，这就是您愿意启用它们。