Written by Kieron Seth, Product Marketing Director at Lumens
4월 02, 2025 4178
인기 있는 PTZ 카메라 초보자 가이드를 쓴 지 3년이 넘었습니다. 당시 우리는 이 카메라가 이미지 품질의 타협을 거의 또는 전혀 하지 않으면서 원격 제작, 신중한 포지셔닝, 운영 비용 절감에서 어떻게 획기적인 역할을 했는지 생각해 보았습니다. 다큐멘터리 텔레비전 프로그램, 강의 캡처, 회의 공간, 음악 공연장 및 예배당의 중심이 된 것은 이러한 기능이었습니다.
그러나 이때부터 PTZ 카메라는 두 번째 혁명을 경험했지만 반드시 우리가 예측했던 방식은 아닙니다.
2021년에는 라이브 이벤트와 방송사의 요구를 충족하기 위해 PTZ 카메라가 점점 더 많이 개발되고 있었습니다. 센서는 점점 더 커져 아름다운 영화 같은 화질을 제공했습니다. 더 높은 비트 전송률(풀 NDI 및 SMPTE 2110), 방송 친화적인 12G-SDI 및 XLR 오디오 입력, 심지어 렌즈 교환 옵션까지 추진했습니다. 업계는 분명히 TV 스튜디오 카메라를 대체하기 위해 PTZ 카메라로 이동하고 있었습니다.
그러나 그 사이에 상황이 바뀌었습니다. 왜 업계는 영화적 품질을 궁극적인 목표로 추구하지 않았을까요? 몇 가지 예외를 제외하고는 PTZ 업계는 무엇보다 최고의 화질을 달성하는 데 집착하지 않았습니다. 여기에는 세 가지 주요 이유가 있습니다.
1. 더 작은 센서의 부상
풀프레임 또는 차세대 1인치 센서는 확실히 더 작은 유형보다 성능이 뛰어나지만 실제 이점은 주로 극도로 저조도 조건, 대비가 극도인 장면 또는 매우 얕은 피사계 심도가 필요한 장면에서 볼 수 있습니다. 대형 센서를 선택하면 전자 장치, 이미지 필터, 정교한 초점 엔진 및 렌즈의 비용이 크게 증가하며, 특히 조직이 줌의 광각과 장쪽 모두에서 중요한 선명도를 유지하는 20배 또는 30배 범위를 원하는 경우 더욱 그렇습니다. 특히 주요 스튜디오나 국제적으로 중요한 콘서트 홀, 극장, 오페라 하우스 및 컨벤션 센터에서는 이 기술이 제공할 수 있는 미묘한 화질을 요구하는 사용자가 있지만 점점 더 많은 대다수의 경우 다른 요소가 우선합니다.
업계는 압도적으로 매우 다르지만 틀림없이 훨씬 더 흥미로운 경로를 택했습니다. 표준(1/3" 및 1/2") 센서는 최근 몇 년 동안 이미지 품질, 효율성 및 비용 효율성이 크게 향상되었습니다. 초기 세대 마이크로 포서드 센서 또는 1인치에서 본 성능은 이제 저조도 기능, 다이내믹 레인지 및 전반적인 이미지 품질 측면에서 오늘날의 더 작은 구성 요소와 일치합니다. 결론은 새로운 소형 센서가 많은(또는 대부분의) 응용 분야에 쉽게 '충분'하다는 것입니다.
2. PTZ의 민주화 효과
회의 공간, 교육실, 강의실, 예배당, 유튜버의 침실 등 모든 곳에서 비디오가 제공되면서 PTZ 산업이 바뀌었습니다. 사용자 경험은 좋은 이미지 품질만큼 중요해졌습니다: 많은 고객은 방송용 샷을 얻기 위해 휘도, 감마 또는 받침대 레벨을 조정할 기술이나 성향이 없습니다. 그들은 단순히 완전 자동 모드에서 멋진 이미지를 원합니다. 요컨대, 대부분의 고객은 iPhone이 제공하는 것과 동일한 사용자 직관적 인 경험을 원합니다.
3. 튀길 수 있는 더 큰 생선이 있습니다!
인공 지능의 등장은 거의 하룻밤 사이에 이론적으로 가능한 것을 현실로 바꿔 놓았습니다. 자동 추적 기술을 예로 들어 보겠습니다.
모션 트래킹 카메라는 새로운 것이 아닙니다. 초기(비지능) 모델은 특히 강의 캡처 및 라이브 프레젠테이션에서 인기가 있었습니다. 그들은 전형적인 인간의 모양, 움직임 및 피부색을 식별하고 개인의 중앙 무대를 유지하기 위해 카메라가 움직이도록 지시할 수 있는 알고리즘을 사용했습니다. 이는 깨끗한 배경과 최소한의 사람이 보이는 조명이 밝은 공간에서 효과적으로 작동했습니다. 그러나 이상적이지 않은 환경에 배치되어 신뢰성이 흔들리고 때때로 추적 대상을 잃거나 무작위로 잘못된 개인을 선택했습니다.
AI를 통해 차세대 추적 카메라는 개인(군중 속에서도)을 인식하고, 그 사람을 고정하고, 가끔 등을 돌리거나 물체 뒤를 잠시 걸어가더라도 안정적으로 추적하는 놀라운 능력을 가지고 있습니다. 새로운 AI 알고리즘은 모션 트래킹을 진정한 클릭 앤 포스트 단위로 변화시켰습니다.
자동 추적 카메라는 매우 대중화되어 이제 다중 발표자 환경에서 널리 사용됩니다. 많은 모델이 직면하는 문제는 한 피사체에서 다음 피사체로 전환할 때 카메라가 다음 대상을 찾아 고정하기 전에 축소해야 한다는 것입니다. 해결책은 파노라마/분석 카메라와 주요 PTZ 헤드를 특징으로 하는 새로운 모션 트래킹 카메라와 함께 2대의 카메라 설계를 구현하는 것이었습니다. 이 접근 방식을 사용하면 카메라가 불필요하고 산만한 사냥 없이 발표자에서 발표자로 즉시 빠르게 이동할 수 있습니다.
HD를 4K 추적 센서로 교체하면 프로세서는 자연스럽게 4배 더 많은 이미지 데이터를 생성합니다. 이는 장면 분석의 획기적인 발전으로, 이제 카메라가 4배 더 많은 세부 사항을 검사할 수 있어 큰 이점이 있습니다. HD 카메라에서 최대 8미터 떨어진 곳에서 개인을 추적하는 대신 4K 장치는 추적 거리를 18미터 이상으로 두 배 이상 늘릴 수 있습니다.
이제 모션 트래킹 카메라는 회의실 및 강의실 뒤쪽, 대성당 및 극장 등 더 많은 위치에 설치할 수 있습니다.
따라서 지난 5년 동안 모션 추적 기술이 성숙해졌지만 잠재적으로 훨씬 더 강력한 발전은 음성 추적이었습니다. 왜 그럴까요? 왜냐하면 압도적인 대부분의 환경에서 인간은 단순히 움직이지 않기 때문입니다! 화자 추적을 사용하면 카메라가 개인의 움직임이 아닌 대화를 따라갈 수 있습니다.
음성 추적이 구현되는 방법에는 두 가지가 있습니다. 첫째, 카메라는 도착 방향(DOA) 마이크 어레이(Sennheiser TCCM 또는 TCC2, Yamaha의 RMCG 및 Nureva, Shure 및 Audio Technica의 많은 모델 등)에 연결되었습니다. 이들은 소리가 나오는 방향을 분석하기 위해 여러 개의 마이크를 캡슐화합니다. Lumens CamConnect AI-Box1과 같은 처리 장치를 사용하여 카메라(또는 여러 대의 카메라)가 방의 능동 음성에 초점을 맞추고 각도를 전환하여 활발한 토론을 캡처할 수 있습니다.
PTZ 카메라는 즉시(그리고 자동) 사람의 개입 없이 다중 카메라 이벤트를 생성할 수 있는 기능을 부여받았습니다. 수동 컨트롤러는 사라졌고, 누가 말하고 있는지 파악하기 어렵게 만드는 불가피한 와이드 샷도 사라졌습니다.
다중 스피커 추적은 방송 스튜디오 비용의 일부만으로 회의 공간에 TV 스타일의 제작 가치를 제공했습니다. 여러 개의 마이크 어레이와 4개의 카메라를 지원하는 이러한 종류의 설치는 카메라 각도 간 전환으로 원격 시청 경험을 변화시킬 수 있는 회의실 및 강의실에 매우 적합합니다.
음성 추적에 대한 두 번째 접근 방식은 아주 최근의 혁신입니다. 이 접근 방식은 이 소리 감지 기술을 카메라 자체에 내장합니다. 소규모 회의 공간, 팟캐스트 스튜디오 및 브이로그 제품군에서 Lumens VC-TR60A와 같은 장치는 카메라 헤드를 자동으로 두 개의 스피커 사이를 번갈아 가며 지시하거나 다중 음성 프레이밍 모드로 전환하여 모든 활성 참가자를 포착하는 정확한 프레임의 샷으로 토론을 촬영할 수 있습니다.
AI를 지원하는 카메라는 소리의 위치를 감지한 다음 사람이 내는 소음과 예를 들어 문을 쾅 닫는 소리, 꽥꽥거리는 새 소리 또는 짖는 개를 구별할 수 있습니다! 카메라를 기준 오디오 라인에 연결하면 이 장치는 소리 감지에서 실내 스피커를 더욱 제거하여 음성 추적을 정확하게 만들 수 있습니다.
보조 파노라마 카메라를 포함하면 PTZ 헤드가 움직여야 할 때마다 시스템이 와이드 샷으로 전환할 수 있습니다. 이렇게 하면 원격 시청자에게 불안할 수 있는 눈에 보이는 모든 카메라 움직임이 제거됩니다.
앞서 살펴본 바와 같이 파노라마 카메라는 다기능으로, 인체 감지 및 추적을 위한 AI 분석 도구로, 지능형 샷 전환을 위한 와이드 샷 역할을 합니다. 보조 카메라는 최신 모델에서 세 번째 역할을 수행하며, HDMI, USB 및 SDI 출력(사용 가능한 경우)에서 직접 PIP(Picture-in-Picture) 출력을 가능하게 합니다.
카메라에서 직접 PIP를 생성하는 것은 투샷 뷰가 필요하고 사용자가 워크플로를 단순화하려는 많은 응용 분야에서 획기적인 발전입니다. 이러한 개발은 동기화된 동시 클로즈업과 넓은 시야가 필수적인 심문실과 훈련실에서 고객의 요구에 따른 결과입니다.
고대역폭 비디오 스트리밍(VC-A71P-HN 참조)은 여전히 방송 TV, 고급 디지털 사이니지 및 티어 1 라이브 이벤트 캡처에서 그 자리를 차지하고 있지만, 압축과 이미지 품질의 균형을 맞추는 저지연 형식에 대한 관심이 급증하고 있습니다. NDI HX3의 등장으로 비디오 스트리밍과 협업은 새로운 시대에 접어들었습니다. 1GbE 네트워크를 통해 최대 4K 전송을 지원하는 HX3는 비디오 품질, 대기 시간 및 대역폭의 완벽한 균형을 이룹니다.
광범위한 멀티 벤더 지원을 통해 HX3는 다른 IP 형식이 따라올 수 없는 창의적인 생태계를 통해 라이브 프로덕션에 매우 적합합니다.
NDI HX3 형식은 이제 최신 PTZ 카메라에 내장되어 있으며 최신 버전으로 업그레이드할 수 없는 이전 모델의 미니 인코더를 통해 사용할 수 있습니다.
새로운 Dante AV-H는 현재 PTZ 카메라에 구현되고 있습니다. 기존 근거리 통신망에서 실행되도록 설계된 대기 시간이 짧은 H.26X 코덱인 NDI HX3의 많은 특성을 공유합니다. NDI가 창의적인 제작 워크플로우로 유명한 반면, Dante AV-H는 IP 오디오(Dante 오디오) 및 제어 에코시스템(Dante Manager 및 Dante 컨트롤러)과의 호환성 측면에서 타의 추종을 불허합니다.
Dante AV-H를 지원하는 PTZ 카메라를 통해 관리자는 익숙한 Dante 애플리케이션을 사용하여 비디오 및 오디오 신호를 라우팅, 관리 및 보호할 수 있습니다. 또한 PTZ 카메라를 마이크, 스피커 및 DSP와 같은 타사 제품과 통합할 수 있으므로 Dante 오디오가 이미 설치된 회의 공간, 교육실 및 이벤트 공간에서 작업하는 AV 관리자에게 매우 매력적인 형식을 만들 수 있습니다.
이미지 품질과 센서 크기에 대한 집착에서 무엇보다 생산성 향상에 중점을 두는 것으로 강조점이 바뀔 것이라고 예측할 수 있는 사람은 거의 없었습니다. AI 채택이 가속화되고 인공 지능의 능력이 계속해서 기대치를 뛰어넘으면서 자동화 측면에서 누릴 수 있는 이익이 확실히 더 많습니다. 미래는 확실히 계획되어 있지는 않지만 흥미진진할 것은 확실합니다.
추신: 이 기사는 인간이 썼습니다!