Barrierefreiheit von Videokonferenzsystemen

Übersicht und Empfehlungen zur Barrierefreiheit und zur Live Transkription in Videokonferenzsystemen.

Durch Corona bedingt gibt es einen großen Bedarf an Videokonferenzsystemen (VCS). Das Angebot auf den Markt ist sehr unterschiedlich – so wie sich auch der Bedarf unterscheidet.
Große bekannte Lösungen sind die von Microsoft und Zoom. Hier wird die VC im Normalfall als „Software as a Service“ (SaaS) verkauft, läuft also auf Servern dieser Firmen.
Auch andere Firmen arbeiten auf diese Weise, was für den Anwender oder die Organisation die ein VCS benötigt natürlich besser hinsichtlich dem Aufwand und dem Unterhalt ist: Denn VCS brauchen auch performante Server auf denen sie laufen, eine sehr gute Anbindung ans Internet und dazu auch wieder Menschen, die diese Systeme betreuen, warten und weiterentwickeln könnnen.

Demgegenüber stehen Open Source Lösungen, die ein Download der Software erlauben und dann den Betrieb auf einer selbst verwalteten Systemarchitektur verlangen. Mit eben den Notwendigkeiten an Infrastruktur und Menschpower, die eben auch die SaaS Angebote mitbringen.
Viele sehen die selbst betriebenen Lösungen als vorteilhaft gegenüber fremd betreuten Systemen an, weil man hier scheinbar einen höheren Datenschutz hat. Denn keine böse Firma aus den USA kann da mithören und aufzeichnen!

Vorab: Datenschutzrechtliche Aspekte

In der Datenschutzszene ist das Thema Datenschutz der VCS schon seit Monaten ein kontroverses Thema. Dementsprechend gibt es hierzu auch eine Menge an Artikeln, Empfehlungen und auch Warnungen von Datenschutzbehörden und viele, viele Kommentare im Social Media.

Ich möchte auf diese Diskussionen nicht auch noch eingehen. Es reicht vollkommen, was andere ausgearbeitet haben.

Folgende Artikel kann ich empfehlen:

Nicht empfehlen und nicht verlinken werde ich hingegen solche Texte, die sich nur oberflächlich mit dem Thema beschäftigten oder noch auf dem Stand von März 2020 verharren.
Dazu gehören auch vermeintliche Empfehlungen, die sich nur mit der syntaktischen und inhaltlichen Form der Datenschutzerklärung befassten, aber sich nicht eingehend mit der Technik und dem Einsatzkonzept befassten.  Ich setze ein #NonMention hier.

Als Quintessenz der Diskussionen und Artikel -zumindest der sachlichen und nicht einiger mit eher dogmatischen-datenschutzreligiösen Ansatz- sehe ich eine ähnliche Antwort wie sie bei der IT-Sicherheit bekannt ist:

Je sicherer ein System ist, um so unbedienbarer ist es.
Die sicherste IT ist dann erreicht, wenn es keine IT gibt.

So auch beim Datenschutz: Den höchsten Stand des Datenschutzes bei VCS haben wir, wenn keine VCS verwendet wird.

Diese lange Einführung führt mich nun zu dem Thema, das ich ansprechen wollte. Für ein VCS ist es ja nicht nur wichtig, dass es sicher ist und das ich sicher sein kann, dass meine Daten und Gespräche nicht danach von Dritten angeschaut, ausgewertet und analysiert werden:
Es ist auch wichtig, dass das System nutzbar und leicht bedienbar ist.

Und das es überhaupt ein System gibt. (Protipp für eine Berliner Behörde: Nein, das Telefon ist kein Ersatz für ein Videokonferenzsystem).

Barrierefrei Videokonferenzsysteme

Sarkastische Stimmen könnten auch behaupten, dass die Bedienbarkeit und die verfügbaren Funktionen viel wichtiger sind als Datenschutz und Sicherheit. Das diese Faktoren sogar maßgeblich sind hinsichtlich dessen, ob das System ankommt und erfolgreich ist…

In folgenden Artikeln wurde die Barrierefreiheit von gängigen Videokonferenzsystemen geprüft:

Weiterhin gibt es Stellungnahmen von Firmen über ihre eigenen Produkte.  Diese sind naturgemäß voreingenommen. Jedoch läßt allein die Feststellung, welche Firmen eine entsprechende Dokumentation zur Barrierefreiheit ihrer Produkte geben, zwei Schlüsse folgern: 1. Welche Firmen das Thema überhaupt auf dem Radar haben und 2. welche Firmen das Thema für nicht mal für würdig genug halten, um eine kurze Dokumentation zu schreiben.

Die folgenden Firmen haben das Thema Barrierefreiheit jedenfalls auf dem Radar:

  • Google Meet accessibility
    Erläuterung zur Barrierefreiheit von Google zu ihrem Produkt Google Meet. Google hat, ebenso wie Microsoft, eine langjährige Kompetenz darin, Software, Dokumente und Webangebote barrierefrei zu gestalten,
  • BigBlueButton Accessibility
    (Kurze) Barrierefreiheitserklärung von BigBlueButton.
  • Zoom Accessibilty Features
    Zoom hat eine umfangreiche Dokumentation ihrer Funktionen zur Barrierefreiheit und bietet, wie jede amerikanische Firma auch eine Barrierefreiheitserklärung (VPAT) an, die hier ebenfalls gefunden werden kann.
  • Accessibility support for Microsoft Teams
    Auch Microsoft bietet umfangreiche Informationen zur Barrierefreiheit an. Im Gegensatz zu vielen anderen Dienstleistern kann Microsoft über langjährige Kompetenz auf diesem Gebiet zurückgreifen. In den letzten Jahren hat Microsoft die Barrierefreiheit ihrer Office-Produkte deutliche verbessert und auch Funktionen für Nutzer bereit gestellt, die es diesen ermöglichen, die Barrierefreiheit der Dokumente aus Office zu verbessern.

Für die Auswahl einer barrierefreien VCS hat der DBSV eine Checkliste entworfen: Barrierencheck für Konferenzplattformen (vom 9. Juli 2020). Hier werden keine konkreten Produkte genannt, jedoch die wichtigsten Features aufgeführt, die ein System vorweisen muss, um für Blinde Menschen zugänglich zu sein.

Audiotranskription (Live)

Eine Videokonferenz lebt nicht nur davon, dass man sich zuwinken kann.
Ohne Ton geht es nicht. Doch was machen Menschen, die nicht hören können? Hier kommt dann Frage nach der Audiotranskription ins Spiel. Diese sorgt dafür, dass die von einem Teilnehmer gesprochene Sprache zeitgleich in lesbaren Worten auf dem Bildschirm gezeigt wird.

  • Bei Zoom wird die Live-Transkription derzeit nur für Kunden freigeschaltet, die den Kontotyp Pro, Business oder Enterprise haben. Für alle anderen Nutzer soll die Option erst ab Herbst 2021 freigeschaltet werden. Die entsprechende Einstellung kann über das Online-Profil geändert werden. Sie findet sich unter den Punkt „In Meeting (Erweitert)“.
    Screenshot mit den erweiterten Einstellungen in Zoom; Hier sind die Optionen für Live-Transkription zu sehen
  • In MS Teams ist die Funktion seit kurzem frei verfügbar. Allerdings nur für englischsprachige Nutzer der Desktop App verfügbar, die ihre Default Sprache auf Englisch eingestellt haben. Eine Ausnahme sind dabei die Live Events in MS Teams. Hier werden bereits 6 Sprachen angeboten.
  • Für Cisco Webex befindet sich eine Live-Transkription gerade in Erprobung; diese soll im Mai ausgerollt werden.

Worarounds für Live Transkriptionen

Wenn das VCS keine Live-Audiotranskription ambietet, kann man es mit ein paar Tricks und Workarounds versuchen.

Web Captioner

Die webbasierte Spracherkennungssoftware Web Captionier erlaubt es mit Hilfe der Web Speech API von Google gesprochene Sprache zu übersetzen. Es stellt diese dann in der Textfassung in einem gesonderten Fenster dar. Hierzu bedarf es jedoch eines Chrome-Browesers unter Windows, MacOS oder Chrome OS.

Screenshot einer Demonstration der Nutzung von Web Captioner in einem Vortrag auf Twitch. Man erkennt den gesprochenen Text in einem Fenster oberhalb der Präsentationsansicht
Screenshot: Vortrag mit Web Captioner

Mathias Magdowski hat dies in einem Twitch-Video demonstriert. Näheres hierzu kann man auch in einem Twitter-Thread nachlesen, in der er auch weitere Tipps und Hinweise gibt. Um den Start des Programmes zu vereinfachen, kann man in mit Chrome im App-Modus starten.
Hierzu legt man sich eine Verknüpfung an, die folgenden Aufruf beinhaltet:

Chrome.exe --app="https://webcaptioner.com/captioner"

Live Transkription mit Powerpoint

In Microsoft 365 kann Powerpoint die Präsentation während des Vortrags transkribieren und auf dem Bildschirm als Beschriftungen in der Sprache des Redners oder in eine andere Sprache übersetzte Untertitel anzeigen.
Siehe hierzu die Anleitung von Microsoft: Präsentationen mit automatischen Echtzeit-Beschriftungen oder -Untertiteln in PowerPoint.

In einem Videokonferenzsystem, welches keine Live-Transkription bietet, wäre es daher denkbar, dass diese über deum Umweg über Powerpoint dargestellt wird. So könnte der Moderator oder der Präsentator der Sitzung Powerpoint nicht nur für eine aktuelle Präsentation geöffnet haben, sondern eben auch nur um die Live Transkription zu nutzen – die dann als Text in einer Präsentation über das VCS gesendet wird.

Screenshot eines Vortrags in Zoom mit Audiotranskription
Screenshot einer Präsentation in einer Videokonferenz mit Zoom

Das Ergebnis sieht dabei so aus, als ob es von dem Videokonferenzsysrem selbst kommt. Es sieht durchaus professionell aus und die Geschwindigkeit lässt (entsprechende Internet-Anbindung vorausgesetzt) keine Klagen aufkommen.

Automatische Transkription & Geräuschbenachrichtigungen auf Android-Devices

Für Nutzer von Android-Systemen bietet Google die App Automatische Transkription & Geräuschbenachrichtigungen an.
Die App klingt sich in das Mikrofon des mobilen Devices ein und übersetzt alle Gespräche in Echtzeit auf dem Bildschirm. Es benachrichtigt auch über andere Umgebungsgeräusche, wie beispielsweise der Türklingel oder einem Feueralarm.

Voice Control auf iPhone, iPad oder iPad Touch

Wie auch Google bietet Apple ebenfalls eine App zur Live Transktion an. Die App Voice Control kann dabei nicht nur Sprache darstellen, sondern auch auf Sprachkommandos reagieren.

Microsoft Translator

Auch Microsoft bietet eine App zur Live Transkription aber auch zur Übersetzung an. Der Translator wirbt damit, dass er Unterhaltungen auf verschiedenen Geräten, Chats zwischen zwei Personen oder größere Gruppendiskussionen live übersetzen kann.
Der Translator ist dabei aber nicht auf Windows beschränkt sondern ist auf Android, Amazon, iOS und Windows verfügbar.
Er lässt sich ebenfalls in Powerpoint einbinden.

[maincolor_box] All diesen Verfahren und Apps, die als Workaround eine Live Transkription durchführen, zugrunde liegt, dass diese das Audiosignal an den jeweiligen Dienstleister senden. Und somit also die gesprochenen Worte an einen externen Server. Wenn, wie im Fall von Web Captioner die Anwendung auch nur eine Middleware zur Anbindung an die Google Web Speech API darstellt, kann das Audiosignal sogar an zwei externe Beteiligte gehen.
Allen Nutzern sollte daher stets klar sein, dass dies Probleme mit dem Datenschutz und der Sicherheit der Worte darstellt.[/maincolor_box]

Nachträgliche Untertitelung für Aufzeichnungen

Für alle Nutzer möglich ist die nachträgliche Transkription einer Aufzeichnung:

Auch bei Produkten, die eine Transkription der Aufzeichnung nicht von Haus aus mitbringen, ist diese dann nachträglich machbar, wenn die Videokonferenz aufgezeichnet werden konnte. Dann könnte man nachträglich die Inhalte angezeigt bekommen.
Wenn die Aufzeichnung eine übliche Videodatei erzeugte, kann man sie entweder an einer professionellen Dienstleister senden oder aber sich eines Online-Tools bedienen, welches eine automatische Ergänzung der Untertitelung anbietet. Beispielsweise YouTube.

Dies ist natürlich nur dann sinnvoll, wenn es sich bei der Videokonferenz nicht um eine interaktive Veranstaltung und nicht um einen Dialog handelte, an der jeder Teilnehmer partizipieren können sollte; Es macht nur Sinn für Präsentationen ohne Interaktion.

Gebärdensprache in Videokonferenzen

Für viele, die sich noch nicht mit Taubheit auseinander gesetzt haben ist es verwunderlich, warum trotz Möglichkeiten zur Textdarstellung nach Gebärdensprachdolmetscher gefragt wird.
Der Hintergrund ist, dass viele taube Menschen nicht die Gebärdensprache als erste Sprache erlernt haben, Schriftsprache jedoch erst danach. Die Schriftsprache für taube Menschen ist daher wie die zweite Fremdsprache, die viele von uns in der Schule erlernten.
Und ja: Viele waren froh, als sie in der Schule endlich die leidigen Englischkurse abwählen konnten.

Bei Videokonferenzen, bei denen taube Menschen anwesend sind, ist es daher sinnvoll sich nicht auf nur eine automatische und teilweise auch etwas fehlerbehaftete Live Transkription zu verlassen, sondern tatsächlich auch Gebärdensprachdolmetscher dabei zu haben.
Diese „übersetzen“ dann das Gesagte in Gebärden. Wichtig für die Software des Videokonferenzsystems ist daher, dass man das Fenster mit dem Gebärdensprachdolmetscher fokussieren (oder „anheften“) kann und dass diese nicht durch Bildschirmpräsentationen oder durch wechselnde Redner überlagert oder ersetzt wird.
Bei großen Konferenzen die über mehrere Stunden laufen, sollte man mehr als einen Gebärdensprachdolmetscher dabei haben – so wie es auch bei Präsenzveranstaltungen der Fall ist.

Leider finden sich zu dem Thema nur wenige weiterführende Artikel: