[星島綜合報道]想像一下:你在辦公室工作,戴著降噪耳機以減少周圍的噪音。一位同事走到你的辦公桌前,問了一個問題,而你不需要摘下耳機,也不會說「什麼?」就能清楚聽到問題。同時,遠處的飲水機邊聊天聲依然被靜音。或者,想像自己在一間嘈雜的餐廳,能清楚聽到桌上每個人的談話,但餐廳裡其他的聲音被減弱。
由華盛頓大學研究人員領導的團隊開發了一款耳機原型,讓使用者能創建這樣的「聲音氣泡」。團隊運用人工智慧算法結合耳機原型,讓佩戴者能清楚聽到氣泡內、半徑3至6英尺內的人說話的聲音,而氣泡外的聲音則被平均降低49分貝(約等於吸塵器聲與樹葉沙沙聲之間的差異),即使氣泡外的聲音比氣泡內的聲音更大聲也能如此。
團隊於11月14日在《自然電子學》(Nature Electronics)上發表了研究成果,並將這款概念證明裝置的代碼公開,供其他人改進和應用。目前,研究人員正在創建一家初創公司以將這項技術商業化。
「在人類周圍有多種聲音來源的情況下,我們並不擅長通過聲音感知距離,」華盛頓大學保羅·G·艾倫電腦科學與工程學院教授,也是此研究的資深作者Shyam Gollakota說。「在像嘈雜的餐廳這樣的地方,我們專注於身邊人的能力有限,所以在可穿戴設備上創建聲音氣泡以往是不可能的。我們的AI系統能實時學習房間內每個聲源的距離,並在耳機裝置本身內以8毫秒的速度進行處理。」
研究人員利用市面上的降噪耳機創建了原型,並在頭帶上附加了六個小型麥克風。團隊的神經網絡運行在耳機附帶的小型嵌入式電腦上,負責追蹤不同聲音到達各個麥克風的時間差。系統會遏制來自氣泡外的聲音,同時回放並略微增強氣泡內的聲音(因為降噪耳機會物理性地允許一些聲音通過)。

「我們曾在一個智能音箱系統中將麥克風分散在桌子上,因為我們認為需要麥克風之間有較大的距離來提取聲音的距離信息,」Gollakota說,「但後來我們開始質疑這一假設。我們真的需要大的距離來創建這種‘聲音氣泡’嗎?我們在這裡證明,其實不需要。我們只使用耳機上的麥克風就能實現,而且是實時的,這相當令人驚訝。」
為了訓練系統在不同環境中創建聲音氣泡,研究人員需要基於距離的聲音數據集,而這樣的數據集在現實中並不存在。為此,他們將耳機戴在假人頭上,並將假人頭固定在一個可旋轉的機械人平台上,讓一個移動的喇叭從不同距離播放聲音。團隊使用假人系統以及人類用戶在22個不同的室內環境中(包括辦公室和生活空間)收集了數據。
研究人員發現,系統能成功運作有以下幾個原因。首先,佩戴者的頭部會反射聲音,這幫助神經網絡區分不同距離的聲音。其次,聲音(如人類語音)具有多種頻率,每種頻率在從聲源傳播時經歷不同的相位變化。研究人員認為,團隊的AI算法正在比較這些頻率的相位來判斷聲源的距離(例如說話的人)。
像蘋果的AirPods Pro 2這樣的耳機可以增強佩戴者面前說話者的聲音,並減少一些背景噪音。但這些功能是通過追蹤頭部位置並增強來自特定方向的聲音實現的,而不是基於距離測量。因此,這類耳機無法同時增強多個說話者的聲音,且當佩戴者將頭部轉向目標說話者時功能會丟失,對減少來自該方向的大聲音的效果也不如本系統。
目前該系統僅訓練用於室內環境,因為在戶外收集乾淨的訓練音頻更加困難。接下來,研究團隊正致力於讓技術能運用於助聽器和降噪耳塞,這需要一種新的麥克風佈置策略。
圖片:Nature Electronics
T10