科技| AI耳機打造「聲音氣泡」隔絕幾英尺外所有聲音

[星島綜合報道]想像一下：你在辦公室工作，戴著降噪耳機以減少周圍的噪音。一位同事走到你的辦公桌前，問了一個問題，而你不需要摘下耳機，也不會說「什麼？」就能清楚聽到問題。同時，遠處的飲水機邊聊天聲依然被靜音。或者，想像自己在一間嘈雜的餐廳，能清楚聽到桌上每個人的談話，但餐廳裡其他的聲音被減弱。

由華盛頓大學研究人員領導的團隊開發了一款耳機原型，讓使用者能創建這樣的「聲音氣泡」。團隊運用人工智慧算法結合耳機原型，讓佩戴者能清楚聽到氣泡內、半徑3至6英尺內的人說話的聲音，而氣泡外的聲音則被平均降低49分貝（約等於吸塵器聲與樹葉沙沙聲之間的差異），即使氣泡外的聲音比氣泡內的聲音更大聲也能如此。

團隊於11月14日在《自然電子學》（Nature Electronics）上發表了研究成果，並將這款概念證明裝置的代碼公開，供其他人改進和應用。目前，研究人員正在創建一家初創公司以將這項技術商業化。

「在人類周圍有多種聲音來源的情況下，我們並不擅長通過聲音感知距離，」華盛頓大學保羅·G·艾倫電腦科學與工程學院教授，也是此研究的資深作者Shyam Gollakota說。「在像嘈雜的餐廳這樣的地方，我們專注於身邊人的能力有限，所以在可穿戴設備上創建聲音氣泡以往是不可能的。我們的AI系統能實時學習房間內每個聲源的距離，並在耳機裝置本身內以8毫秒的速度進行處理。」

研究人員利用市面上的降噪耳機創建了原型，並在頭帶上附加了六個小型麥克風。團隊的神經網絡運行在耳機附帶的小型嵌入式電腦上，負責追蹤不同聲音到達各個麥克風的時間差。系統會遏制來自氣泡外的聲音，同時回放並略微增強氣泡內的聲音（因為降噪耳機會物理性地允許一些聲音通過）。

「我們曾在一個智能音箱系統中將麥克風分散在桌子上，因為我們認為需要麥克風之間有較大的距離來提取聲音的距離信息，」Gollakota說，「但後來我們開始質疑這一假設。我們真的需要大的距離來創建這種‘聲音氣泡’嗎？我們在這裡證明，其實不需要。我們只使用耳機上的麥克風就能實現，而且是實時的，這相當令人驚訝。」

為了訓練系統在不同環境中創建聲音氣泡，研究人員需要基於距離的聲音數據集，而這樣的數據集在現實中並不存在。為此，他們將耳機戴在假人頭上，並將假人頭固定在一個可旋轉的機械人平台上，讓一個移動的喇叭從不同距離播放聲音。團隊使用假人系統以及人類用戶在22個不同的室內環境中（包括辦公室和生活空間）收集了數據。

研究人員發現，系統能成功運作有以下幾個原因。首先，佩戴者的頭部會反射聲音，這幫助神經網絡區分不同距離的聲音。其次，聲音（如人類語音）具有多種頻率，每種頻率在從聲源傳播時經歷不同的相位變化。研究人員認為，團隊的AI算法正在比較這些頻率的相位來判斷聲源的距離（例如說話的人）。

像蘋果的AirPods Pro 2這樣的耳機可以增強佩戴者面前說話者的聲音，並減少一些背景噪音。但這些功能是通過追蹤頭部位置並增強來自特定方向的聲音實現的，而不是基於距離測量。因此，這類耳機無法同時增強多個說話者的聲音，且當佩戴者將頭部轉向目標說話者時功能會丟失，對減少來自該方向的大聲音的效果也不如本系統。

目前該系統僅訓練用於室內環境，因為在戶外收集乾淨的訓練音頻更加困難。接下來，研究團隊正致力於讓技術能運用於助聽器和降噪耳塞，這需要一種新的麥克風佈置策略。

圖片：Nature Electronics

T10