PTZカメラの新しいガイド - なぜそれがすべて変更されたのか

Written by Kieron Seth, Product Marketing Director at Lumens

April 02, 2025 4200






 



人気の「PTZカメラ初心者向けガイド」を書いてから3年以上が経ちました。当時、私たちは、これらのカメラが、画質にほとんどまたはまったく妥協することなく、リモート制作、目立たないポジショニング、運用コストの削減においていかに画期的な進歩であったかを振り返りました。これらの特徴により、ドキュメンタリーテレビ番組、講義の撮影、会議スペース、音楽会場、礼拝堂の主力となりました。

しかし、この時以来、PTZカメラは2度目の革命を経験しましたが、必ずしも私たちが予測していたような形ではありませんでした。
 

▶ 何よりも画質

2021 年当時、PTZ カメラはライブ イベントや放送局のニーズを満たすためにますます開発されていました。センサーは大型化し、美しい映画のような画質を実現しました。より高いビットレート(フルNDIとSMPTE 2110)、放送に適した12G-SDIとXLRオーディオ入力、さらには交換レンズのオプションも求められました。業界は明らかに、テレビスタジオカメラの代替品としてPTZカメラに移行していました。

▶ ユーザーを第一に考える

しかし、その間に状況は変わりました。なぜ業界は映画の品質を究極の目標として追求していないのでしょうか?いくつかの例外を除いて、PTZ業界は何よりも究極の画質を実現することにこだわっていません。これには主に3つの理由があります。

1. 小型センサーの台頭

フルフレームまたは新世代の 1 インチ センサーは確かに小型タイプよりも優れていますが、本当の利点は主に、極端な暗い場所、極端なコントラストのあるシーン、または非常に浅い被写界深度を必要とするショットで見られます。大型センサーを選択することの見返りは、電子機器、イメージフィルター、高度なフォーカスエンジン、レンズのコストが大幅に増加し、特にズームの広端と長端の両方で重要なシャープネスを維持する20倍または30倍の範囲を必要とする場合です。特に主要なスタジオや国際的に重要なコンサートホール、劇場、オペラハウス、コンベンションセンターでは、このテクノロジーが提供できる微妙な画質を求めるユーザーがいますが、ますます大多数にとって、他の要因が優先されます。

業界は圧倒的に大きく異なる、しかしおそらくはるかにエキサイティングな道を歩んでいます。標準(1/3インチおよび1/2インチ)センサーは、近年、画質、効率、費用対効果が劇的に向上しています。初期世代のマイクロフォーサーズセンサーまたは1インチから見られたパフォーマンスは、低照度機能、ダイナミックレンジ、および全体的な画質の点で、今日の小型コンポーネントに匹敵するようになりました。結論は、新しい小型センサーは、多くの(またはほとんどの)アプリケーションにとって簡単に「十分」であるということです。

2. PTZの民主化効果

会議スペース、トレーニングスイート、教室、礼拝堂、YouTuberの寝室など、あらゆる場所でビデオが約束されたことで、PTZ業界は変わりました。ユーザーエクスペリエンスは、優れた画質と同じくらい重要になっていますが、多くの顧客は、放送可能なショットを実現するために輝度、ガンマ、または台座レベルを微調整するスキルも傾向もありません。彼らは単にフルオートモードで素晴らしい画像を求めています。つまり、ほとんどの顧客は、iPhone が提供するのと同じユーザー エクスペリエンスを望んでいます。

3. 揚げる大きな魚があります!

PTZ業界は、過去5年間で、イノベーション(および成長)の点でスタジオカメラとビデオカメラマーケットをはるかに上回っています。では、より大きなセンサーの使用でなければ、この急速な発展はどこで見られるのでしょうか?一言で言えば、自動化です。

▶ 自動化の紹介

一人のリモートマルチカメラ制作を可能にするために発明されたこの分野では、自動化が最大の原動力であり続けていることは驚くべきことではありません。PTZカメラは、どんな場所にも迅速かつ目立たないように設置できるように考案されました。1人のオペレーターが1台から20台のカメラを制御できることで人気を博しました。

したがって、これらのカメラが人間の介入をまったく必要とせずに設置および操作できるのであれば、考えられるすべてのプロセスを自動化することがメーカーの頭の最前線にあることは驚くべきことではありません。

▶ AIの実現

人工知能の登場により、理論的には可能なことがほぼ一夜にして現実になりました。自動追跡技術を例に挙げてみましょう。

モーショントラッキングカメラは新しいものではありません。初期の(非知的)モデルは、特に講義のキャプチャやライブプレゼンテーションで人気がありました。彼らは、典型的な人間の形、動き、肌の色を識別し、カメラを動かして個人を舞台の中心に保つことができるアルゴリズムを使用しました。これは、明るい空間で、背景がきれいで、人が視界を最小限に抑えた場所で効果的に機能しました。しかし、理想的とは言えない環境に配置され、信頼性が低下し、追跡対象を失ったり、間違った個体をランダムに選択したりすることがありました。

AI により、新世代の追跡カメラは、(人混みの中でも) 個人を認識し、その人に固定し、時折背を向けたり、物体の後ろを一瞬歩いたりしても確実に追跡する驚異的な能力を備えています。新しい AI アルゴリズムは、モーション トラッキングを真のクリック アンド フォージ ユニットにするほど変革しました。

▶ 2 は 1 よりも優れています

自動追跡カメラは非常に人気があり、現在ではマルチプレゼンター環境で広く使用されています。多くのモデルが直面する問題は、ある被写体から次の被写体に切り替えるとき、カメラが次のターゲットを見つけてロックする前にズームアウトする必要があることです。解決策は、パノラマ/分析カメラと主要なPTZヘッドを備えた新しいモーショントラッキングカメラを備えた2カメラ設計を実装することでした。このアプローチにより、カメラは不必要で気を散らす狩りをすることなく、プレゼンターからプレゼンターへとすぐに素早く移動できます。

▶ 超ファインモーショントラッキング

HDを4Kトラッキングセンサーに置き換えることで、プロセッサは自然に4倍の画像データを生成します。これはシーン分析の画期的な進歩であり、カメラは4倍の詳細を検査できるようになり、大きなメリットがあります。HDカメラから最大8メートルの距離で個人を追跡する代わりに、4Kユニットは追跡距離を2倍以上、18メートル以上にすることができます。

現在では、モーショントラッキングカメラは、会議室や講義室の裏側、大聖堂や劇場など、さらに多くの場所に設置できます。

▶ 健全な投資

したがって、過去 5 年間でモーション トラッキング テクノロジーは成熟しましたが、さらに魅力的な進歩が音声 追跡にある可能性があります。なぜそうなるのでしょうか?なぜなら、圧倒的多数の環境では、人間は単に動いていないからです。話者追跡により、カメラは個人の動きではなく会話を追跡できます。

音声追跡の実装には 2 つの方法があります。まず、カメラは到着方向(DOA)マイクアレイ(Sennheiser TCCMTCC2YamahaのRMCGニューエバShureオーディオテクニカの多くのモデルなど)にリンクされています.これらは複数のマイクをカプセル化して、音が来る方向を分析します。Lumens CamConnect AI-Box1などの処理ユニットを使用すると、カメラ(または複数のカメラ)が部屋の能動態に焦点を合わせ、角度を切り替えて活発な議論を捉えることができます。

PTZカメラは、人間の介入を必要とせずに、即座に(そして自動的に)マルチカメライベントを生成する機能を与えられています。手動コントローラーはなくなり、誰が話しているのかを判断するのが難しい避けられないワイドショットもなくなりました。

マルチスピーカートラッキングは、放送スタジオの数分の一のコストで、テレビスタイルの制作価値を会議スペースに提供しました。複数のマイクアレイと4台のカメラをサポートするこの種の設置は、カメラアングルを切り替えることでリモート視聴体験を変えることができる役員室や講堂に最適です。

▶ スマートハドルルームカメラ

音声追跡の 2 番目のアプローチは、ごく最近のイノベーションです。このアプローチでは、この音検出技術がカメラ自体に組み込まれています。小規模な会議スペース、ポッドキャストスタジオ、Vlogスイートでは、Lumens VC-TR60Aなどのユニットがカメラヘッドを自動的に2つのスピーカーを交互に向けたり、マルチボイスフレーミングモードに移行して、すべてのアクティブな参加者を捉えた正確にフレーム化されたショットでディスカッションを撮影したりできます。

AI対応のカメラは、音の位置を検出し、人間が発する騒音と、ドアをバタンと閉める音、鳥の鳴き声、犬の鳴き声などを区別することができます。カメラを基準オーディオラインにリンクすることで、室内のスピーカーを音検出からさらに排除し、音声追跡を確実に正確に行うことができます。

セカンダリ パノラマ カメラの搭載により、PTZ ヘッドを動かす必要があるときはいつでもシステムがワイド ショットに切り替えることができます。これにより、遠隔地の視聴者にとって不安になる可能性のある目に見えるカメラの動きがすべて排除されます。

▶ ピクチャー・イン・ピクチャー

これまで見てきたように、パノラマカメラは多機能であり、人間の検出と追跡のためのAI分析ツールとして、またインテリジェントなショット切り替えのためのワイドショットとして機能します。セカンダリカメラは最新モデルで3番目の役割を果たしており、HDMI、USB、および(利用可能な場合)SDI出力から直接ピクチャーインピクチャー(PIP)出力が可能です。

カメラから直接 PIP を生成することは、ツーショット ビューが必要で、ユーザーがワークフローを簡素化したい多くのアプリケーションにとって画期的な進歩です。この開発は、同期した同時クローズアップとワイドビューが不可欠な尋問室やトレーニングルームの顧客からの要求の結果です。

▶ IP ストリーミングと接続

IP生産の台頭は長年避けられず、3〜4年前に利用可能なテクノロジーはまだ最新であるか、進化しています。これは、常に人気のある NDI 形式に特に当てはまります。

▶ NDI HX3

高帯域幅のビデオストリーミング(VC-A71P-HNを参照)は、放送テレビ、ハイエンドデジタルサイネージ、ティア1ライブイベントのキャプチャで依然としてその地位を占めていますが、圧縮と画質のバランスが取れた低遅延フォーマットへの関心が急増しています。NDI HX3 の登場により、ビデオ ストリーミングとコラボレーションは新しい時代に入りました。1GbEネットワーク上で最大4K伝送をサポートするHX3は、ビデオ品質、遅延、帯域幅の完璧なバランスです。

幅広いマルチベンダーサポートにより、HX3はライブプロダクションに非常に適しており、他のIPフォーマットには匹敵しないクリエイティブなエコシステムを備えています。

NDI HX3フォーマットは、最新のPTZカメラに組み込まれ、最新バージョンにアップグレードできない古いモデルではミニエンコーダーを介して利用できます。

▶ AV統合:Dante AV-H

新しいDante AV-Hは現在、PTZカメラに実装されています。NDI HX3 の多くの特性を共有しており、既存のローカル エリア ネットワーク上で動作するように設計された低遅延の H.26X コーデックです。NDIがクリエイティブな制作ワークフローで高く評価されているのに対し、Dante AV-HはIPオーディオ(Danteオーディオ)とコントロールエコシステム(DanteマネージャーとDanteコントローラー)との互換性において比類のない存在です。

Dante AV-HをサポートするPTZカメラを使用すると、管理者は使い慣れたDanteアプリケーションを使用してビデオ信号とオーディオ信号をルーティング、管理、保護できます。また、PTZカメラをマイク、スピーカー、DSPなどのサードパーティ製品と統合することもできるため、Danteオーディオがすでに設置されている会議スペース、トレーニングルーム、イベントスペースで働くAVマネージャーにとって非常に魅力的なフォーマットになります。

▶ 未来

画質とセンサーサイズへのこだわりから、何よりも生産性の向上に重点が置かれることを予測できる人はほとんどいませんでした。AIの導入が加速し、人工知能の能力が期待を上回り続けるにつれて、自動化の面では確かにより多くの利益を享受できます。未来は確かに計画されていませんが、エキサイティングなものになることは間違いありません。

PS. この記事は人間によって書かれました!

 

 
 

 
戻る