谷歌推出 Android 版“Expressive Captions”,具有人工智慧驅動的情感和聲音識別功能

圖片來源——谷歌

安卓用戶

現在可以體驗「表達性字幕」的發布將字幕提升到了一個全新的水平。這項新功能不僅顯示人們所說的話,它實際上還捕捉了他們說話的方式。想像一下,即使您聽不到,也能夠看到某人聲音中的情感和強度。

多年來,字幕只是簡單地顯示口頭文字,但現在,借助人工智慧,它們可以做更多的事情。富有表現力的字幕可以分析語氣、響度甚至背景聲音等內容,讓您更深入地了解正在發生的事情。這對於即時視訊和社交媒體貼文特別有用,因為這些地方的字幕經常丟失或不太準確。

新的表達性字幕最有趣的事情之一是它如何使用大寫字母來表達強烈的情感。因此,如果您的朋友向您發送生日訊息並大喊“生日快樂!”您會在標題中看到這些單字全部大寫,就像我們了解到的那樣,在文字中使用全部大寫意味著您在大喊大叫。此功能還可捕捉背景中的嘆息、喘息,甚至鼓掌或歡呼等內容,讓您更了解整個場景。

富有表現力的字幕內建於最新的

,因此它們幾乎可以與您可以觀看影片的任何應用程式配合使用。從今天開始,任何正在運行的 Android 裝置都可以使用該功能

以上且已開啟即時字幕功能。目前,它僅在美國提供英語版本。

這意味著您可以將它們用於直播、Google 照片中的視頻,甚至來自朋友的視訊訊息。最棒的是,它們可以立即工作,即使您處於離線狀態(例如在飛機上)。

Google表示,為了創造這個超級有用的功能,Android 和Google DeepMind 的團隊共同努力弄清楚人們如何觀看沒有聲音的影片。他們使用特殊的人工智慧技術不僅可以捕獲單詞,還可以將它們轉化為表達情感並包含所有額外聲音的字幕。

這是確保每個人都能欣賞線上影片(無論他們的聽力有多好)方面向前邁出的一大步。它展示瞭如何利用人工智慧讓每個人的生活變得更好。

我在手機上觀看了很多視頻,因此我對錶達字幕感到非常興奮。能夠透過字幕看到情感並聽到背景聲音將使在嘈雜的地方觀看影片獲得更好的體驗。我迫不及待地想看看這是否很快就會出現在其他語言和地區。