June 06, 2025 2134
「我們是視覺的生物,視覺的事物是固定的,而聲音則會消逝。」哈佛大學心理學家 Steven Pinker 如此表示。這或許是個具爭議的說法(尤其對於音樂家來說!),但研究顯示,在面對面的交流中,至少有 50% 的溝通是非語言的。這意味著在會議中,視覺部分在視聽技術(AV)中至關重要。
這給我們帶來了一個問題。
一種新型會議室麥克風誕生了(如 Sennheiser TCC2、Yamaha RM-CG、Shure MXA920、Nureva HDL410 等)。這些產品採用了 DOA(到達方向)技術,可以檢測聲音來源的位置。這為何如此重要?
1. 語音追蹤麥克風有助於消除常見的會議問題,例如聲音模糊、聲音過遠或語音重疊。它們確保每位參與者無論身處何處,都能清晰地被聽見。
2. 語音追蹤也可幫助視訊攝影機自動對準說話者。
這對視訊會議來說是一個突破。語音追蹤正在改變攝影機與現場討論的整合與互動方式。
藉由語音追蹤的強大功能,麥克風陣列的定位數據會即時傳送至外部處理器,並進一步連接多台 PTZ 攝影機。這種攝影機和麥克風的組合,能使攝影機立即對準會議空間中的主動聲音。這是透過將攝影機角度與麥克風數據協調來實現的。會議影片可以自動產出,並被 Teams、Zoom 或其他會議平台即時使用。
• 視訊畫面切換至攝影機 1。
• 另一位與會者開始說話 → 攝影機 2 自動放大該說話者。
• 系統自動切換至攝影機 2。
這種 AV 系統正在創造類似電視節目的效果,且不需用戶干預。它還能管理大型會議:每台攝影機可分配多個與會者,覆蓋整個會議空間。
將麥克風與攝影機連接並非新概念。多年前,開發人員就已能夠編程 AV 控制器以回應即時語音追蹤數據。但由於每個安裝環境的複雜性和獨特性,此過程通常相當昂貴。
然而,Lumens 的創新使這一切變得簡單:CamConnect 可以輕鬆連接至網路,並在數分鐘內配置完成,最多支援 4 台 PTZ 攝影機和多組麥克風陣列,無需編程。
隨著 VC-TR60A 攝影機的推出,Lumens 將說話者追蹤整合到 PTZ 攝影機內。無需依賴天花板或牆壁安裝的麥克風來檢測聲音位置,這款攝影機在其底座內內建了一組聲音檢測器。透過 AI 驅動的影像分析工具,VC-TR60A 可以辨識聲音是否來自房間內的人,而非關門聲或外面汽車發動聲。
說話者追蹤技術在理想環境中非常精確,但仍受多種因素影響:
• 空間大小: 距離麥克風越遠,定位數據的精度越低。好消息是,像 CamConnect 這樣的系統可以支援多組麥克風,這些麥克風可以安裝在天花板或牆壁上。
• 音響效果: 需要特別注意回音和反射。聲音隔離良好的房間效果更佳,而 DSP 處理器可以最小化這些問題。
人們會移動,會調整座椅,而這些動態可能會影響鏡頭構圖。CamConnect Pro 等新一代 AI 系統可以自動重新構圖,確保最佳畫面。
沒有觀眾喜歡觀看鏡頭不斷在發言者之間快速切換的會議影片。為避免這種「乒乓效應」,一些系統可以啟用多聲道構圖模式,自動切換到更廣的鏡頭,覆蓋所有活躍說話者。
多聲道構圖僅僅是開始。隨著自動化技術的進步,說話者追蹤有望演變為全自動 AV 製作系統,媲美專業電視節目製作。目前,這項技術已經在改變我們體驗虛擬會議的方式。