Tiefes Lernen mit synthetischen Daten wird die Technologiebranche demokratisieren.

Tiefes Lernen mit synthetischen Daten wird die Technologiebranche demokratisieren.

September 12, 2018 0 Von Jan Eggers

Die visuellen Datensätze von Bildern und Videos, die von den mächtigsten Technologieunternehmen gesammelt wurden, waren ein Wettbewerbsvorteil, ein Graben, der die Fortschritte des maschinellen Lernens für viele unerreichbar hält. Dieser Vorteil wird durch das Aufkommen synthetischer Daten aufgehoben.

Die wertvollsten Technologieunternehmen der Welt, wie Google, Facebook, Amazon und Baidu u.a., trainieren ihre Computer mit Computervision und künstlicher Intelligenz. Sie sammeln riesige visuelle Datensätze von Bildern, Videos und anderen visuellen Daten von ihren Konsumenten.

Diese Datensätze waren ein Wettbewerbsvorteil für große Technologieunternehmen, da sie von den Fortschritten des maschinellen Lernens und den Prozessen, die es Computern und Algorithmen ermöglichen, schneller zu lernen, ferngehalten wurden.

Jetzt wird dieser Vorteil durch die Möglichkeit für jeden, synthetische Daten zu erstellen und zu nutzen, um Computer in vielen Anwendungsfällen, einschließlich Einzelhandel, Robotik, autonome Fahrzeuge, Handel und vieles mehr, zu trainieren, gestört.

Synthetische Daten sind computergenerierte Daten, die reale Daten nachahmen, also Daten, die von einem Computer und nicht von einem Menschen erzeugt werden. Software-Algorithmen können entworfen werden, um realistische simulierte oder „synthetische“ Daten zu erzeugen.

Diese synthetischen Daten helfen dann dabei, einem Computer beizubringen, wie er auf bestimmte Situationen oder Kriterien reagieren soll, und ersetzen die in der realen Welt erfassten Trainingsdaten. Einer der wichtigsten Aspekte von realen oder synthetischen Daten ist es, genaue Etiketten zu haben, damit Computer visuelle Daten übersetzen können, um Sinn zu haben.

Seit 2012 investieren wir bei LDV Capital in tiefe technische Teams, die Computer Vision, Machine Learning und künstliche Intelligenz nutzen, um visuelle Daten in allen Unternehmensbereichen wie Gesundheitswesen, Robotik, Logistik, Kartierung, Transport, Fertigung und vieles mehr zu analysieren. Viele Startups haben das „Kaltstart“-Problem, dass sie nicht genügend qualitätsgekennzeichnete Daten haben, um ihre Computeralgorithmen zu trainieren. Ein System kann keine Rückschlüsse auf Benutzer oder Objekte ziehen, über die es noch nicht genügend Informationen gesammelt hat.

Startups können ihre eigenen kontextrelevanten Daten sammeln oder sich mit anderen zusammenschließen, um relevante Daten zu sammeln, z.B. Einzelhändler für Daten zum menschlichen Einkaufsverhalten oder Krankenhäuser für medizinische Daten. Viele Frühphasen-Startups lösen ihr Kaltstartproblem, indem sie Datensimulatoren erstellen, um kontextrelevante Daten mit Qualitätslabels zu erzeugen, um ihre Algorithmen zu trainieren.

Große Technologieunternehmen haben nicht die gleiche Herausforderung, Daten zu sammeln, und sie erweitern ihre Initiativen exponentiell, um mehr einzigartige und kontextrelevante Daten zu sammeln.

Cornell Tech-Professor Serge Belongie, der seit mehr als 25 Jahren im Bereich Computer Vision forscht, sagt,

In der Vergangenheit warf unser Bereich der Computervision ein wachsames Auge auf die Verwendung von synthetischen Daten, da sie zu gefälscht aussahen. Trotz der offensichtlichen Vorteile, perfekte Bodenwahrheitsnotizen kostenlos zu erhalten, war unsere Sorge, dass wir ein System trainieren würden, das in der Simulation gut funktioniert, in der Wildnis aber kläglich scheitern würde. Jetzt hat sich das Spiel geändert: Die Lücke zwischen Simulation und Realität verschwindet rapide. Zumindest können wir sehr tiefe neuronale Faltungsnetze auf nahezu fotorealistische Bilder vortrainieren und sie auf sorgfältig ausgewählte reale Bilder abstimmen.

AiFi ist ein Startup-Unternehmen, das eine Plattform für Computer-Vision und künstliche Intelligenz entwickelt, um eine effizientere, kassenfreie Lösung sowohl für Convenience-Stores als auch für große Einzelhändler anzubieten. Sie bauen eine kassenfreie Shop-Lösung ähnlich wie Amazon Go.

Als Startup hatte AiFi die typische Kaltstart-Herausforderung mit einem Mangel an visuellen Daten aus der realen Welt, um mit dem Training ihrer Computer zu beginnen, im Gegensatz zu Amazon, die wahrscheinlich reale Daten sammelten, um ihre Algorithmen zu trainieren, während Amazon Go im Stealth-Modus war.

Die Lösung von AiFi, synthetische Daten zu erstellen, ist ebenfalls zu einem ihrer verteidigungsfähigen und differenzierten Technologievorteile geworden. Durch das System von AiFi können Käufer in ein Einzelhandelsgeschäft kommen und Artikel abholen, ohne Bargeld, eine Karte oder Barcodes scannen zu müssen.

Diese intelligenten Systeme müssen kontinuierlich Hunderte oder Tausende von Käufern in einem Geschäft verfolgen und sie während einer kompletten Einkaufssitzung erkennen oder „neu identifizieren“.

Ying Zheng, Mitbegründer und Chief Science Officer bei AiFi, arbeitete zuvor bei Apple und Google. Sie sagt,

Die Welt ist riesig und lässt sich kaum mit einer kleinen Auswahl an realen Bildern und Etiketten beschreiben. Ganz zu schweigen davon, dass die Beschaffung hochwertiger Etiketten sowohl zeitaufwendig als auch teuer und manchmal nicht durchführbar ist. Mit synthetischen Daten können wir einen kleinen, aber relevanten Aspekt der Welt in perfektem Detail erfassen. In unserem Fall erstellen wir großflächige Speichersimulationen und rendern hochwertige Bilder mit pixelgenauen Etiketten und trainieren damit erfolgreich unsere tiefgehenden Lernmodelle. Dies ermöglicht es AiFi, überlegene Checkout-freie Lösungen in großem Maßstab zu schaffen.

Robotik ist ein weiterer Sektor, der synthetische Daten nutzt, um Roboter für verschiedene Aktivitäten in Fabriken, Lagern und in der Gesellschaft auszubilden.

Josh Tobin ist Forscher bei OpenAI, einem gemeinnützigen Forschungsunternehmen für künstliche Intelligenz, das sich zum Ziel gesetzt hat, freundliche KI so zu fördern und zu entwickeln, dass sie der Menschheit als Ganzes zugute kommt. Tobin ist Teil eines Teams, das daran arbeitet, Roboter zu bauen, die lernen. Sie haben vollständig mit simulierten Daten trainiert und auf einem physischen Roboter eingesetzt, der nun erstaunlicherweise eine neue Aufgabe erlernen kann, nachdem er einmal eine Aktion gesehen hat.

Sie entwickelten und implementierten einen neuen Algorithmus namens One-Shot-Imitation-Learning, der es einem Menschen ermöglicht zu kommunizieren, wie er eine neue Aufgabe in der virtuellen Realität ausführen kann. Mit einer einzigen Demonstration ist der Roboter in der Lage, die gleiche Aufgabe von einem beliebigen Startpunkt aus zu lösen und dann die Aufgabe fortzusetzen.

Ihr Ziel war es, das Verhalten in der Simulation zu erlernen und dann in die reale Welt zu übertragen. Die Hypothese war zu sehen, ob ein Roboter aus simulierten Daten genau so gut arbeiten kann. Sie begannen mit 100 Prozent simulierten Daten und dachten, dass es nicht so gut funktionieren würde, wie mit echten Daten, um Computer zu trainieren. Die simulierten Daten für Trainingsroboteraufgaben funktionierten jedoch viel besser als erwartet.

Tobin sagt,

Einen genauen synthetischen Datensimulator zu erstellen ist wirklich schwierig. Es gibt einen Faktor von 3-10x in der Genauigkeit zwischen einem gut trainierten Modell für synthetische Daten und realen Daten. Es gibt immer noch eine Lücke. Für viele Aufgaben funktioniert die Leistung gut, aber für extreme Präzision wird sie nicht fliegen – noch nicht.

Osaro ist ein Unternehmen für künstliche Intelligenz, das Produkte entwickelt, die auf der Technologie für die Automatisierung von Industrierobotern basieren. Der Mitbegründer und CEO von Osaro, Derik Pridmore, sagt: „Es steht außer Frage, dass die Simulation Start-ups befähigt. Es ist ein weiteres Werkzeug im Werkzeugkasten. Wir verwenden simulierte Daten sowohl für das schnelle Prototyping und die Erprobung neuer Modelle als auch für den Einsatz in der realen Welt.“
Viele große Technologieunternehmen, Automobilhersteller und Start-ups rasen in Richtung der autonomen Fahrzeugrevolution. Die Entwickler haben erkannt, dass es nicht genug Stunden am Tag gibt, um genügend reale Daten über gefahrene Meilen zu sammeln, die benötigt werden, um Autos beizubringen, wie man selbst fährt.

Eine Lösung, die einige verwenden, sind synthetische Daten von Videospielen wie Grand Theft Auto; leider sagen einige, dass die Muttergesellschaft des Spiels Rockstar ist nicht glücklich über fahrerlose Autos Lernen aus ihrem Spiel.

May Mobility ist ein Startup, das einen selbstfahrenden Mikrotransitdienst aufbaut. Ihr CEO und Gründer, Edwin Olson, sagt,

Eine unserer Anwendungen für synthetische Daten ist die Bewertung der Leistung und Sicherheit unserer Systeme. Wir glauben jedoch nicht, dass eine vernünftige Menge an Tests (real oder simuliert) ausreicht, um die Sicherheit eines autonomen Fahrzeugs nachzuweisen. Funktionale Sicherheit spielt eine wichtige Rolle.

Die Flexibilität und Vielseitigkeit der Simulation macht es besonders wertvoll und viel sicherer, autonome Fahrzeuge unter diesen sehr unterschiedlichen Bedingungen zu trainieren und zu testen. Simulierte Daten können auch leichter beschriftet werden, da sie von Computern erstellt werden, was viel Zeit spart.

Jan Erik Solem ist CEO und Mitbegründer von Mapillary* und hilft bei der Erstellung besserer Karten für intelligentere Städte, Geodienste und die Automobilindustrie. Laut Solem,

Eine Datenbank zu haben und zu verstehen, wie Orte auf der ganzen Welt aussehen, wird eine immer wichtigere Komponente für Simulationsengines sein. Mit zunehmender Genauigkeit der trainierten Algorithmen wird der Detaillierungsgrad und die Vielfalt der für die Simulation verwendeten Daten immer wichtiger.

Neuromation baut eine verteilte synthetische Datenplattform für Deep-Learning-Anwendungen auf. Ihr CEO, Yashar Behzadi, sagt,

Bislang haben die großen Plattformunternehmen Datengräben genutzt, um ihren Wettbewerbsvorteil zu erhalten. Synthetische Daten sind ein großer Störfaktor, da sie die Kosten und die Geschwindigkeit der Entwicklung erheblich reduzieren und es kleinen, agilen Teams ermöglichen, zu konkurrieren und zu gewinnen.

Die Herausforderung und Chance für Start-ups, die gegen etablierte Unternehmen mit inhärenten Datenvorteilen antreten, besteht darin, die besten visuellen Daten mit korrekten Etiketten zu nutzen, um Computer für verschiedene Anwendungsfälle genau zu trainieren. Die Simulation von Daten wird das Spielfeld zwischen großen Technologieunternehmen und Start-ups ausgleichen. Im Laufe der Zeit werden große Unternehmen wahrscheinlich auch synthetische Daten erstellen, um ihre realen Daten zu ergänzen, und eines Tages könnte dies das Spielfeld wieder kippen. Viele Referenten auf dem jährlichen LDV Vision Summit im Mai in NYC werden uns erläutern, wie sie mit simulierten Daten Algorithmen trainieren, um Geschäftsprobleme zu lösen und Computern zu helfen, sich der allgemeinen künstlichen Intelligenz zu nähern.