By Lumens
April 02, 2025 1316
Es ist über drei Jahre her, dass wir unseren beliebten Einsteigerleitfaden für PTZ-Kameras geschrieben haben. Damals dachten wir darüber nach, wie diese Kameras einen Durchbruch in der Remote-Produktion, bei der diskreten Positionierung und bei der Senkung der Betriebskosten darstellten, ohne dass die Bildqualität beeinträchtigt wurde. Es waren diese Merkmale, die sie zu einer festen Größe in dokumentarischen Fernsehprogrammen, Vorlesungsaufzeichnungen, Versammlungsräumen, Musikveranstaltungsorten und Gotteshäusern machten.
Seitdem haben PTZ-Kameras jedoch eine zweite Revolution erlebt, aber nicht unbedingt auf eine Weise, die wir vorhergesagt hätten.
Bereits im Jahr 2021 wurden zunehmend PTZ-Kameras entwickelt, um den Anforderungen von Live-Events und Sendern gerecht zu werden. Die Sensoren wurden immer größer und sorgten für eine wunderschöne Kinobildqualität. Es gab einen Vorstoß in Richtung höherer Bitraten (vollständiges NDI und SMPTE 2110), Broadcast-freundliche 12G-SDI- und XLR-Audioeingänge und sogar die Option von Wechselobjektiven. Die Branche bewegte sich eindeutig in Richtung PTZ-Kameras als Ersatz für TV-Studiokameras.
Aber in der Zwischenzeit haben sich die Dinge geändert. Warum hat die Branche nicht die Qualität des Kinos als oberstes Ziel verfolgt? Mit wenigen Ausnahmen war die PTZ-Branche nicht davon besessen, vor allem die ultimative Bildqualität zu erreichen. Dafür gibt es drei Hauptgründe.
1. Der Aufstieg des kleineren Sensors
Ein Vollformat- oder 1-Zoll-Sensor der neuen Generation wird sicherlich besser abschneiden als ein kleinerer Typ, aber die wirklichen Vorteile zeigen sich vor allem bei extrem schlechten Lichtverhältnissen, Szenen mit extremem Kontrast oder bei Aufnahmen, die eine sehr geringe Schärfentiefe erfordern. Der Nachteil für die Auswahl eines großen Sensors sind die stark gestiegenen Kosten für Elektronik, Bildfilter, ausgeklügelte Fokussierer und Objektive, insbesondere wenn das Unternehmen einen 20- oder 30-fachen Bereich wünscht, der die kritische Schärfe sowohl am breiten als auch am langen Ende des Zooms beibehält. Vor allem in großen Studios oder international bedeutenden Konzertsälen, Theatern, Opernhäusern und Kongresszentren gibt es Anwender, die die nuancierte Bildqualität dieser Technologie verlangen, aber für die wachsende Mehrheit stehen andere Faktoren im Vordergrund.
Die Branche hat mit überwältigender Mehrheit einen ganz anderen, aber wohl weitaus spannenderen Weg eingeschlagen. Standard-Sensoren (1/3" & 1/2") haben sich in den letzten Jahren in Bezug auf Bildqualität, Effizienz und Wirtschaftlichkeit drastisch verbessert. Die Leistung, die wir von einem Micro-Four-Thirds-Sensor der frühen Generation oder einem 1-Zoll-Sensor gesehen haben, wird jetzt von der heutigen kleineren Komponente in Bezug auf schlechte Lichtverhältnisse, Dynamikbereich und Gesamtbildqualität erreicht. Die Schlussfolgerung ist, dass neue, kleinere Sensoren für viele (oder sogar die meisten) Anwendungen leicht "gut genug" sind.
2. Die demokratisierende Wirkung der PTZ
Das Versprechen, dass Video überall verfügbar ist – in Besprechungsräumen, Schulungsräumen, Klassenzimmern, Gotteshäusern und den Schlafzimmern von YouTubern – hat die PTZ-Branche verändert. Die Benutzererfahrung ist genauso wichtig geworden wie eine gute Bildqualität: Viele Kunden haben weder die Fähigkeit noch die Lust, Luminanz, Gamma oder Sockel zu optimieren, um eine sendereife Aufnahme zu erzielen. Sie wollen einfach nur ein großartiges Bild im vollautomatischen Modus. Kurz gesagt, die meisten Kunden wünschen sich die gleiche benutzerfreundliche Erfahrung, die ihnen ihr iPhone bietet.
3. Es gibt größere Fische zu braten!
Die PTZ-Branche hat den Markt für Studiokameras und Camcorder in Bezug auf Innovation (und Wachstum) in den letzten 5 Jahren weit übertroffen. Wo finden wir also diese rasante Entwicklung, wenn nicht beim Einsatz größerer Sensoren? In einem Wort: Automatisierung.
In einem Sektor, der erfunden wurde, um die Remote-Produktion von mehreren Kameras für eine Person zu ermöglichen, ist es kaum verwunderlich, dass die Automatisierung nach wie vor die größte treibende Kraft ist. Die PTZ-Kamera wurde für eine schnelle und diskrete Installation an jedem Ort entwickelt. Es wurde populär für die Fähigkeit, zwischen einer und zwanzig Kameras von einem einzigen Bediener zu steuern.
Wenn diese Kameras also ohne menschliches Eingreifen installiert und betrieben werden können, ist es nicht verwunderlich, dass die Automatisierung aller möglichen Prozesse im Vordergrund der Köpfe der Hersteller steht.
Mit dem Einzug der künstlichen Intelligenz ist das, was theoretisch möglich ist, quasi über Nacht in die Realität umgesetzt worden. Schauen wir uns als Beispiel die Auto-Tracking-Technologie an.
Motion-Tracking-Kameras sind nicht neu. Frühe (nicht-intelligente) Modelle waren beliebt, insbesondere bei der Aufzeichnung von Vorlesungen und Live-Präsentationen. Sie verwendeten Algorithmen, die typische menschliche Formen, Bewegungen und Hauttöne erkennen und die Kamera so lenken konnten, dass sie sich bewegte, um eine Person im Mittelpunkt zu halten. Dies funktionierte effektiv in gut beleuchteten Räumen mit einer sauberen Kulisse und mit minimaler Sicht auf Personen. Sie waren jedoch in nicht idealen Umgebungen positioniert und ihre Zuverlässigkeit schwankte, gelegentlich verlor sie das Tracking-Subjekt oder wählte zufällig die falsche Person aus.
Mit AI haben Tracking-Kameras der neuen Generation eine unheimliche Fähigkeit, eine Person zu erkennen (selbst in einer Menschenmenge), sich auf diese Person zu fixieren und sie zuverlässig zu verfolgen, selbst wenn sie gelegentlich den Rücken zudreht oder kurz hinter einem Objekt herläuft. Neue AI-Algorithmen haben die Bewegungsverfolgung so weit verändert, dass sie zu echten Click-and-Forget-Einheiten geworden sind.
Auto-Tracking-Kameras sind so beliebt geworden, dass sie heute in Umgebungen mit mehreren Präsentationen weit verbreitet sind. Ein Problem, mit dem viele Modelle konfrontiert sind, ist der Wechsel von einem Motiv zum nächsten: Die Kamera müsste herauszoomen, bevor sie das nächste Ziel findet und anvisiert. Die Lösung bestand in der Implementierung eines Zwei-Kamera-Designs mit neuen Bewegungsverfolgungskameras mit einer Panorama-/Analysekamera sowie einem Haupt-PTZ-Kopf. Mit diesem Ansatz kann sich die Kamera sofort schnell von Moderator zu Moderator bewegen, ohne unnötige und ablenkende Jagd.
Durch den Ersatz eines HD- durch einen 4K-Tracking-Sensor erzeugt der Prozessor natürlich viermal mehr Bilddaten. Dies ist ein Durchbruch für die Szenenanalyse – die Kamera kann jetzt viermal mehr Details untersuchen, was enorme Vorteile mit sich bringt. Anstatt Personen in einer Entfernung von maximal 8 Metern von einer HD-Kamera zu verfolgen, kann ein 4K-Gerät die Tracking-Entfernung auf 18 Meter oder mehr als verdoppeln.
Jetzt können Motion-Tracking-Kameras an viel mehr Orten installiert werden – zum Beispiel im hinteren Bereich von Konferenz- und Vortragsräumen, Kathedralen und Theatern.
In den letzten fünf Jahren ist die Motion-Tracking-Technologie also gereift, aber ein möglicherweise noch überzeugenderer Fortschritt war die Sprachverfolgung. Warum so? Denn in den allermeisten Umgebungen ist der Mensch einfach nicht in Bewegung! Die Sprecherverfolgung ermöglicht es der Kamera lediglich, einem Gespräch zu folgen und nicht der Bewegung einer Person.
Es gibt zwei Möglichkeiten, wie Voice Tracking implementiert wurde. Erstens wurden Kameras mit DOA-Mikrofonarrays (Direction-of-Arrival) in Verbindung gebracht (denken Sie an Sennheiser TCCM oder TCC2, Yamaha's RMCG und viele Modelle von Nureva, Shure und Audio Technica). Diese kapseln mehrere Mikrofone ein, um die Richtung zu analysieren, aus der ein Klang kommt. Mit einer Verarbeitungseinheit, wie z. B. der Lumens CamConnect AI-Box1, kann eine Kamera (oder mehrere Kameras) auf die aktive Stimme in einem Raum fokussieren und den Blickwinkel wechseln, um eine lebhafte Diskussion einzufangen.
Sofort (und automatisch) sind PTZ-Kameras in der Lage, ein Ereignis mit mehreren Kameras zu erzeugen, ohne dass ein menschliches Eingreifen erforderlich ist. Verschwunden sind die manuellen Controller, und weg ist die unvermeidliche Weitwinkelaufnahme, die es schwierig macht, herauszufinden, wer spricht.
Das Multi-Speaker-Tracking hat in Besprechungsräumen Produktionswerte im TV-Stil zu einem Bruchteil der Kosten eines Sendestudios geliefert. Mit der Unterstützung mehrerer Mikrofon-Arrays und vier Kameras eignet sich diese Art von Installation gut für Sitzungssäle und Hörsäle, in denen das Umschalten zwischen Kamerawinkeln das Remote-Viewing-Erlebnis verändern kann.
Der zweite Ansatz für die Sprachverfolgung ist eine sehr neue Innovation. Bei diesem Ansatz wird diese Schallerkennungstechnologie in die Kamera selbst eingebettet. In kleineren Besprechungsräumen, Podcast-Studios und Vlogging-Suiten können Geräte wie das Lumens VC-TR60A seinen Kamerakopf automatisch so ausrichten, dass er zwischen zwei Lautsprechern wechselt, oder in den mehrstimmigen Framing-Modus wechseln, um eine Diskussion mit einer präzise gerahmten Aufnahme zu filmen, die alle aktiven Teilnehmer erfasst.
AI-fähig ist die Kamera in der Lage, den Ort eines Geräusches zu erkennen und dann zwischen Geräuschen, die von einem Menschen gemacht werden, und beispielsweise einer zuschlagenden Tür, einem krächzenden Vogel oder einem kläffenden Hund zu unterscheiden! Durch die Verbindung der Kamera mit einer Referenz-Audioleitung kann das Gerät die Lautsprecher im Raum von der Geräuscherkennung ausschließen, wodurch die Sprachverfolgung zielsicher genau wird.
Auch hier zahlt sich die Integration der sekundären Panoramakamera aus, die es dem System ermöglicht, auf eine Weitwinkelaufnahme umzuschalten, wenn sich der PTZ-Kopf bewegen muss. Dadurch entfallen alle sichtbaren Kamerabewegungen, die für entfernte Betrachter verunsicherbar sein können.
Wie wir gesehen haben, ist die Panoramakamera multifunktional und fungiert als AI-Analysewerkzeug für die Erkennung und Verfolgung von Personen und als Weitwinkelaufnahme für eine intelligente Bildumschaltung. Die zweite Kamera hat bei den neuesten Modellen eine dritte Rolle und ermöglicht die Bild-in-Bild-Ausgabe (PIP) direkt über die HDMI-, USB- und (sofern verfügbar) SDI-Ausgänge.
Das Generieren eines PIP direkt von der Kamera aus ist ein Durchbruch für viele Anwendungen, bei denen eine Zwei-Schuss-Ansicht erforderlich ist und bei denen Benutzer ihren Arbeitsablauf vereinfachen möchten. Diese Entwicklung ist das Ergebnis der Nachfrage von Kunden nach Verhörräumen und Schulungsräumen, bei denen eine synchronisierte und gleichzeitige Nah- und Weitsicht unerlässlich ist.
Der Aufstieg der IP-Produktion war seit vielen Jahren unvermeidlich und die Technologien, die vor 3-4 Jahren verfügbar waren, sind entweder immer noch aktuell oder haben sich weiterentwickelt. Dies ist insbesondere bei dem allseits beliebten NDI-Format der Fall.
Obwohl Video-Streaming mit hoher Bandbreite (siehe VC-A71P-HN) immer noch seinen Platz im Broadcast-TV, in High-End-Digital Signage und bei der Aufzeichnung von Tier-One-Live-Events hat, ist das Interesse an Formaten mit geringer Latenz, die Komprimierung und Bildqualität in Einklang bringen, gestiegen. Mit der Einführung von NDI HX3 traten Video-Streaming und Zusammenarbeit in eine neue Ära ein. Mit seiner Unterstützung von bis zu 4K-Übertragungen über ein 1-GbE-Netzwerk bietet HX3 die perfekte Balance zwischen Videoqualität, Latenz und Bandbreite.
Mit seiner breiten Unterstützung mehrerer Anbieter eignet sich HX3 sehr gut für Live-Produktionen und verfügt über ein kreatives Ökosystem, mit dem kein anderes IP-Format mithalten kann.
Das NDI HX3-Format ist jetzt in die neuesten PTZ-Kameras eingebettet und über Mini-Encoder in älteren Modellen verfügbar, die nicht auf die neueste Version aktualisiert werden können.
Die neue Dante AV-H wird nun in PTZ Kameras implementiert. Es teilt viele der Eigenschaften von NDI HX3, da es sich um einen H.26X-Codec mit geringer Latenz handelt, der für die Ausführung in bestehenden lokalen Netzwerken entwickelt wurde. Während NDI für seine kreativen Produktionsabläufe gefeiert wird, ist Dante AV-H konkurrenzlos, wenn es um die Kompatibilität mit IP Audio (Dante Audio) und seinem Steuerungsökosystem (Dante Manager und Dante Controller) geht.
Mit PTZ Kameras, die Dante AV-H unterstützen, können Administratoren Video- und Audiosignale mit vertrauten Dante Anwendungen routen, verwalten und sichern. Sie können PTZ-Kameras auch in Produkte von Drittanbietern wie Mikrofone, Lautsprecher und DSPs integrieren, was das Format für AV-Manager, die in Besprechungsräumen, Schulungsräumen und Veranstaltungsräumen arbeiten, in denen Dante-Audio bereits installiert ist, äußerst attraktiv macht.
Nur wenige hätten vorhersagen können, dass sich der Schwerpunkt von einer Besessenheit von Bildqualität und Sensorgröße hin zu einem Fokus auf Produktivitätssteigerungen vor allem anderen verlagert. In Bezug auf die Automatisierung gibt es sicherlich noch weitere Vorteile, da sich die Einführung von AI beschleunigt und die Fähigkeit der künstlichen Intelligenz, die Erwartungen zu übertreffen, weiterhin übertrifft. Die Zukunft ist sicherlich nicht vorgezeichnet, aber sie wird mit Sicherheit spannend.
PS. Dieser Artikel wurde von einem Menschen geschrieben!