Künstliche Intelligenz
20.11.2014, 08:35 Uhr
Google erkennt und beschreibt Bilder
Google will seine Bildersuche verbessern und dazu Computersystemen das Sehen beibringen. Die Forscher schalten dazu zwei neurale Netze hintereinander, die Objekte erkennen und beschreiben.
Menschen können ein Bild in einem einfachen Satz beschreiben. Das menschliche Gehirn erkennt dabei, was auf dem Bild zu sehen ist und was dort geschieht. Bei Google arbeiten nun Forscher daran, einem Computersystem das Sehen beizubringen. Ziel ist es, so der Konzern in einem Blog-Eintrag, sehbehinderten Menschen zu helfen sowie alternative Bildbeschreibungen - und dadurch auch bessere Ergebnisse in der Bildersuche - zu ermöglichen. Bislang katalogisiert Google Fotos nicht nach deren tatsächlichem Inhalt, sondern primär nach dem daneben stehenden Text.
Forscher greifen zur Entwicklung der Technologie auf ein sogenanntes Convolutional Neural Network (CNN) zurück, das darin trainiert wurde, Objekte auf Bildern zu erkennen. Das Ergebnis wird an ein rückgekoppelte neurales Netzwerk (RNN) weitergeleitet, das schliesslich die Beschreibung des Bildes erstellt. Das Endergebnis lautet dann etwa "Eine Katze liegt auf der Couch" oder "Zwei Hunde spielen im Gras", was als einfache Bildbeschreibung im Internet mehr als ausreichend ist.
Falls die Technologie marktreif wird, gibt es viele vorstellbare Einsatzmöglichkeiten, nicht nur für die Google-Webseite. Überwachungskameras etwa könnten auf einmal erkennen, was auf Aufnahmen passiert und bei bestimmten Wortphrasen wie "Mensch bedroht Angestellte mit Pistole" automatisch die Polizei benachrichtigen.