Neural Image Assessment 19.12.2017, 15:00 Uhr

Google arbeitet an neuronaler Bildbewertung Nima

Google arbeitet an einer neuen Technik zur Bildbewertung und -bearbeitung. Das Tool Nima soll neben technischen beziehungsweise qualitativen Kriterien auch die Ästhetik beurteilen können.
(Quelle: Denis Linine / shutterstock.com)
Google arbeitet an einer neuen Technik zur Bildbewertung, genannt Nima (Neural Image Assessment). Das auf Machine Learning basierende Tool soll Bilder nicht nur in Hinblick auf die messbare Qualität sondern auch anhand ästhetischer Aspekte beurteilen.
In einem Vergleichstest lagen die von NIMA errechneten Werte extrem nah an jenen, die bei einer Bewertung durch reale Personen ermittelt wurden.
(Quelle: Google)
Für gewöhnlich teilen derlei Technologien Fotos in zwei Klassen. Eine mit hoher sowie eine mit niedriger Qualität. Nima soll stattdessen vorhersagen können, ob ein Bild von einem Menschen eher als technisch gut oder aber besonders ästhetisch wahrgenommen wird. Dabei setze die Technologie auf hochmoderne Deep-Object-Recognition-Netzwerke, wie Google in seinem entsprechenden Blogpost schreibt.
Neben der Kategorisierung soll das Tool auch dabei helfen, die Bilder mittels Künstlicher Intelligenz zu bearbeiten. Dazu zählen unter anderem die Optimierung der visuellen Qualität sowie die Minimierung wahrgenommener visueller Fehler wie zum Beispiel Bildrauschen.
Für die Bewertung der Aufnahmen zieht Nima Referenzbilder heran. Ist für die vorliegende Grafik eine passende Referenz vorhanden, kommen Bildqualitätsmetriken wie PSNR (Peak-Signal-to-Noise-Ratio), SSIM (Structural Similarity) zum Einsatz. Gibt es hingegen kein passendes Referenzbild, werden "blinde" Ansätze, wie Google es nennt, angewendet. Dabei werden statistische Modelle herangezogen, um die Bildqualität vorherzusagen.

Menschliche Wahrnehmung steht im Fokus

Beide Ansätze verfolgen das Ziel, einen Qualitätsfaktor vorherzusagen, der mit der menschlichen Wahrnehmung übereinstimmt. Ähnliche Techniken ziehen meist den Durchschnittswert heran. Nima aber nutzt für die Bewertung der Bilder eine Skala von eins bis zehn, wobei für jede mögliche Punktzahl eine Wahrscheinlichkeit errechnet. Die Bewertung mit der höchsten Wahrscheinlichkeit wird als Ergebnis dargestellt.
Um die Genauigkeit von Nima zu bestätigen, hat Google die damit errechneten Ergebnisse mit einigen Bewertungen von realen Menschen verglichen. Als Referenz diente hierfür eine AVA-Datenbank. AVA steht für "Aesthetic Visual Analysis". Jedes der Testbilder wurde von durchschnittlich 200 Personen bewertet.
Im Vergleichstest lagen die so ermittelten Ergebnisse extrem nah an jenen, die NIMA angegeben hatte.
In der Praxis könne Nima künftig etwa Nutzern bei der Auswahl von Bildern behilflich sein. Auch ein Echtzeit-Feedback bei der Aufnahme von Fotos sei denkbar. So dient die Technologie im Wesentlichen als Schnittstelle für den menschlichen Geschmack.


Das könnte Sie auch interessieren