Das neue KI-System mit Bildunterschriften von Microsoft ist genauer als Menschen

Der amerikanische Technologieriese Microsoft hat einen weiteren Meilenstein erreicht. Das Unternehmen hat ein neues KI-System mit Bildunterschriften entwickelt, das den Inhalt von Fotos ziemlich genau beschreibt.

In den meisten Fällen ist es sogar genauer als beim Menschen. Dies erleichtert vor allem die Zugänglichkeit für sehbehinderte Benutzer, die sich beim Online-Anzeigen von Bildern stark auf Bildschirmlesegeräte und „Alternativtext“ verlassen.

Lesen Sie: Microsoft bringt neue Funktionen für Teams

Anzeigen von AI –– Microsoft neues Bildunterschriften-System

Microsoft hat ein Bildunterzeichnungssystem entwickelt, das genauer ist als Menschen. In einem Blogbeitrag sagte Microsoft, dass das System „Untertitel für Bilder generieren kann, die in vielen Fällen genauer sind als die Beschreibungen, die von Menschen geschrieben werden. Der Durchbruch bei einer Benchmark-Herausforderung ist ein Meilenstein in Microsofts Bestreben, seine Produkte und Dienstleistungen inklusiv und für alle Benutzer zugänglich zu machen. “

Das Unternehmen verwendete das KI-System, um die Assistenten-App des Unternehmens zu aktualisieren, die insbesondere Sehbehinderten hilft – das System namens KI sehen. Die App ist beliebt bei Benutzern mit Sehbehinderungen, die mit ihrer Smartphone-Kamera einen Text lesen oder Objekte und ihre Umgebung beschreiben.

Anzeigen von AI –– Microsoft neues Bildunterschriften-SystemAnzeigen von AI –– Microsoft neues Bildunterschriften-System

In Kürze wird das System in andere Microsoft-Dienste wie Word, PowerPoint und Outlook integriert. In diesen Diensten wird das System für Aufgaben wie das Erstellen von Alternativtext für Bilder verwendet – eine Funktion, die für die Verbesserung der Zugänglichkeit des Benutzers wichtig ist.

“Im Idealfall würde jeder Alternativtext für alle Bilder in Dokumenten, im Internet oder in sozialen Medien einfügen – da dies blinden Menschen ermöglicht, auf den Inhalt zuzugreifen und an der Konversation teilzunehmen”, sagte Saqib Shaikh, Software-Engineering-Manager bei Microsoft KI-Team. „Aber leider tun es die Leute nicht. Es gibt also mehrere Apps, die Bildunterschriften verwenden, um Alternativtext auszufüllen, wenn dieser fehlt “, fügte er hinzu.

Die Seeing AI von Microsoft funktioniert mithilfe von Computer Vision, um die Welt mit der Smartphone-Kamera des Benutzers zu beschreiben. Die KI kann alles identifizieren – von Gegenständen bis zu Haushaltsgegenständen. Es scannt und liest Textnachrichten, beschreibt die Umgebung und kann sogar Freunde identifizieren.

Darüber hinaus können Sie Seeing AI auch verwenden, um Bilder in anderen Apps wie E-Mail-Clients, Social Media-Apps und Messaging-Apps wie WhatsApp zu beschreiben.

Microsoft erleichtert die Belastung für Sehbehinderte weiter

Microsoft erleichtert die Belastung für Sehbehinderte weiter

Bereits die Seeing AI App ist eine sehr hilfreiche App. Es ist eine der führenden Apps für Blinde oder Sehbehinderte. Der neue Bildunterschriften-Algorithmus von Microsoft wird die Leistung der Seeing AI jedoch weiter erheblich verbessern.

Es ist nicht nur in der Lage, Objekte zu identifizieren, sondern auch die Beziehung zwischen ihnen genau zu beschreiben. So betrachtet der Algorithmus beispielsweise ein Bild und beschreibt die Person oder Objekte darin, z. B. eine Person, einen Basketball oder ein Spielfeld. Gleichzeitig wird auch gezeigt, wie diese Dinge interagieren, z. B. wenn eine Person auf einem Platz Basketball spielt.

Microsoft ist sehr stolz auf diese neue App, da der Algorithmus doppelt so gut ist wie das seit 2015 verwendete Bildunterschriften-System.