Google是
制作它的双子座Live AI助手甚至更聪明,更具吸引力,具有屏幕共享和实时视频流的新功能,以及其语言理解能力的重大改进。
在给用户的电子邮件中,Google透露,Gemini Live已通过其最新的AI模型进行了升级,提高了其了解不同语言,口音和方言的能力。该更新还包括改进翻译,以及使用屏幕共享和实时视频流的能力。

双子座实时更新电子邮件。
就像我们都知道的那样,这些AI助手越好,他们从我们那里得到的个人信息越多,因此Google希望将用户的音频,视频和屏幕屏幕共享数据在其Gemini Apps活动中共享数据也就不足为奇了。值得庆幸的是,您可以选择将其关闭。当前,如果您启用了Gemini Apps活动,则仅保存对话成绩单。
深入矩阵
至于这些新功能的发展,它们很可能由多式联运API提供动力,该API于去年年底以Gemini 2.0发行。该API允许开发人员处理各种输入,包括文本,音频和视频,并生成文本或音频响应。
不过,这种开发并不令人惊讶,因为它与多模式AI的行业趋势保持一致,在该趋势中,系统可以无缝处理并响应不同类型的输入,从而使它们更加通用和用户友好。
称为双子座2.0“代理时代”的开始,AI可以自己做更多的事情。该模型与OpenAI的O1相当,但具有本地生成图像,语音,文本等的增加能力。
阵容中的第一个是Gemini 2.0 Flash,它的速度是其前身Gemini Pro 1.5的两倍。从简单的对话和内容产生的“聊天机器人时代”转变为推理和独立行动的时代,它标志着AI功能迈出的重要一步。
“代理时代”表示向AI的转变,不仅可以理解和响应请求,还可以预测需求并主动完成任务,使其成为我们数字生活中更加集成和不可或缺的一部分。
AI的这种发展有可能彻底改变各个部门,从客户服务和教育到医疗保健和个人生产力。但这也是朝着进步的令人担忧的一步,因为这是以隐私为代价的。
这些对Gemini Live的更新目前正在向用户推出,并承诺具有更直观和动态的AI体验,这就是您愿意启用它们。