谷歌推出 Android 版“Expressive Captions”,具有人工智能驱动的情感和声音识别功能

图片来源——谷歌

安卓用户

现在可以体验“表达性字幕”的发布将字幕提升到了一个全新的水平。这项新功能不仅仅显示人们所说的话,它实际上还捕捉了他们说话的方式。想象一下,即使您听不到,也能看到某人声音中的情感和强度。

多年来,字幕只是简单地显示口头文字,但现在,借助人工智能,它们可以做更多的事情。富有表现力的字幕可以分析语气、响度甚至背景声音等内容,让您更深入地了解正在发生的事情。这对于实时视频和社交媒体帖子特别有用,因为这些地方的字幕经常丢失或不太准确。

新的表达性字幕最有趣的事情之一是它如何使用大写字母来表达强烈的情感。因此,如果您的朋友向您发送生日消息并大喊“生日快乐!”您会在标题中看到这些单词全部大写,就像我们了解到的那样,在文本中使用全部大写意味着您在大喊大叫。该功能还可以捕捉背景中的叹息、喘息,甚至鼓掌或欢呼等内容,让您更好地了解整个场景。

富有表现力的字幕内置于最新的

,因此它们几乎可以与您可以观看视频的任何应用程序配合使用。从今天开始,任何正在运行的 Android 设备都可以使用该功能

及以上并且已打开实时字幕功能。目前,它仅在美国提供英语版本。

这意味着您可以将它们用于直播、Google 照片中的视频,甚至来自朋友的视频消息。最棒的是,它们可以立即工作,即使您处于离线状态(例如在飞机上)。

谷歌表示,为了创造这个超级有用的功能,Android 和谷歌 DeepMind 的团队共同努力弄清楚人们如何观看没有声音的视频。他们使用特殊的人工智能技术不仅可以捕获单词,还可以将它们转化为表达情感并包含所有额外声音的字幕。

这是确保每个人都能欣赏在线视频(无论他们的听力有多好)方面向前迈出的一大步。它展示了如何利用人工智能让每个人的生活变得更好。

我在手机上观看了很多视频,因此我对表达字幕感到非常兴奋。能够通过字幕看到情感并听到背景声音将使在嘈杂的地方观看视频获得更好的体验。我迫不及待地想看看这是否很快就会出现在其他语言和地区。