Chytrá technika Microsoftu ukáže emoce lidí na fotografii. Podívejte, jak se u nás trefila

Microsoft v rámci Project Oxford pracuje mimo jiné na algoritmech umělé inteligence pro rozpoznávání obrazu. Jednotlivá API zpřístupňuje vývojářům tak, aby mohli nové inteligentní funkce zakomponovat do svých řešení. Nejnověji v rámci projektu firma testuje schopnosti rozpoznávání emocí z fotografií osob. Podívejte, jak funguje, a k čemu vlastně je.

Microsoft Emotions API, jak se novinka jmenuje, je dalším důkazem toho, že umělá inteligence dělá výrazné pokroky, které se však mohou často zdát přinejmenším zvláštní. Vždyť poznat z fotografie emoce zachycených osob dovede do jisté míry každý. Jenže pro počítač je něco takového komplikovanou disciplínou. Tu se právě snaží Microsoft zvládnout.

Nová součást Project Oxford tak díky umělé inteligenci určuje emoce z fotografií. Algoritmus nejprve rozpozná na fotografii obličeje, jejich výrazy pak podrobí analýze a u každého vyhodnotí aktuální stav emocí. Chytrý program dovede rozpoznat zlobu, opovržení, znechucení, strach, štěstí, smutek, překvapení a neutrální výraz, ke každé z těchto emocí přiřadí hodnocení, nakolik ji daný obličej vyjadřuje. Součet všech hodnot je dohromady roven jedné, algoritmus tedy vyjádří přesný podíl jednotlivých emocí na daném výrazu.

Microsoft upozorňuje, že je projekt zatím v experimentální fázi a výsledky nemusí být spolehlivé. Podle toho, co jsem si vyzkoušel, však algoritmus dovede emoce rozpoznávat relativně dobře, byť někdy hodnocení trochu překvapí.

Zahrál jsem si tedy na herce, smartphonem jsem pořídil sadu selfie snímků, kde jsem se snažil tvářit co nejvíce dle dané emoce a výslednou fotku prohnal algoritmem. Bylo zajímavé pozorovat, co z daného obličeje usoudil počítačový program a co jsem si o svém výrazu myslel já. Ukázalo se, že strach opravdu přesvědčivě zahrát nedovedu a možná je i pro samotný algoritmus nejméně snadno identifikovatelný. Výsledky si můžete prohlédnout i s komentářem v galerii pod článkem. Najdete v ní i několik příkladů, kdy algoritmus danou emoci rozpoznal zvláštně, byť samozřejmě to opět vstupuje do hry mé subjektivní hodnocení.

Za předpokladu, že na obrázku správně algoritmus identifikuje obličej, funguje rozpoznávání docela dobře, byť určitě není stoprocentní. Jak upozorňují autoři, nejlépe samozřejmě algoritmus funguje u fotek s obličejem čelem k objektivu, jakékoli odchylky mohou rozpoznání znesnadnit a mohou znamenat nepřesné odhady. Program momentálně umí na snímku identifikovat až 64 obličejů, snímek musí být menší než 4 megabajty a obličej, u kterého umí systém emoce rozpoznat, na něm musí zabírat plochu minimálně 36 x 36 pixelů, což je překvapivě málo.

Ať už algoritmus funguje dobře, nebo stále potřebuje určitá vylepšení, výhoda počítačového přístupu při rozpoznávání emocí je jasná. Počítač totiž bude ve svých hodnoceních vždy zcela konzistentní. Zatímco dva lidé mohou emoce u jednoho výrazu obličeje hodnotit různě nebo naopak jeden obličej může hodnotiteli připadat bez objektivních příčin veselejší než jiný, počítačový algoritmus bude mít vždy stejný metr. Navíc není zatížen určitým dalším kontextem, ať už je to v tomto případě dobře, či nikoli.

Jednotné, emocemi nezatížené počítačové rozpoznávání emocí, může být užitečné pro mnoho účelů. Když pomineme všechny medicínské a bezpečnostní důvody a možná tak trochu orwellovskou realitu, je rozpoznávání emocí důležité i z hlediska možností interakce lidí s čím dál chytřejší počítačovou technikou. Ačkoli ta sama emoce nemá (byť se je učí emulovat), jejich rozpoznání u lidí je pro přirozenou interakci velmi důležité.

To, co tak vypadá jako hříčka programátorů, je tak ve skutečnosti důležitý krok kupředu v oblasti chytré techniky.

Diskuze k článku