Facebook chce utéct konkurenci a pracuje na elektronickém mozku

Objem dat, který systémy Facebooku každodenně zpracovávají, je obrovský. Přesně takový, jaký dokáže vygenerovat více než miliarda aktivních uživatelů, desítky milionů stránek a milion aktivních inzerentů.

Tím vším se musí systémy Facebooku prokousat, zpracovat to a setřídit, a nakonec uložit tak, aby data v případě potřeby mohly kdykoliv zase rychle načíst. Nadto navíc pak ještě algoritmy sociální sítě rozhodují, jaké příspěvky jsou pro kterého uživatele jak relevantní, aby mu ty nejzajímavější mohly zobrazit.

To vše se neobejde bez velmi rozsáhlých systémů pro vyhodnocování dat a práci s nimi. Facebook si ale evidentně pohrává s myšlenkou, že existují efektivnější způsoby jak k těmto problémům přistupovat, než které v současnosti využívá.

CML se už rodí

MIT Technology Review během víkendu informovalo, že největší sociální síť má nově speciální osmičlenný tým odborníků zaměřených na umělé nervové sítě. Tým pracuje na metodě zpracování dat, která se v počítačové hantýrce označuje jako deep learning. Metoda využívá počítačové sítě vytvořené po vzoru uspořádání lidského mozku, odkud také přišlo označení umělé nervové sítě.

Není divu, že se novému týmu ve Facebooku interně přezdívá „tým pro umělou inteligenci“. To, že je to poněkud nadnesené, protože deep learning sám o sobě pro tvorbu umělé inteligence nestačí, očividně nevadí.

Výhodou umělých nervových sítí je, že je pro ně třeba data mnohem méně předžvýkat, než u klasických technik strojového učení. Důkazem budiž podobný projekt Googlu, Google Brain. Neuronovou síť složenou z 16 tisíc procesorů byli její autoři schopni na základě momentek z videa z YouTube naučit rozeznávat kočky, aniž by ji k tomuto úkolu jakkoliv předem připravili. Systém dopředu neměl žádné indicie o tom, co je kočka, či podle jakých znaků ji ve videu identifikovat.

Umělý mozek by mohl řadit příspěvky v news feedu

Podobně chce nyní deep learning využít pro zpracovávání svých rozsáhlých souborů dat i Facebook. Tyto systémy se ukázaly vhodné k tomu, aby v takto rozsáhlých datech našly i souvislosti, které by v nich při klasičtějších způsobech strojového učení nikdo nehledal. Jednou z oblastí, kde deep learning dosahovalo v minulosti úspěchů, je rozeznávání emocí. Další je rozeznávání hlasu.

Facebook není příliš sdílný v tom, jaké úkoly nový tým bude řešit, několik příkladů ale přece jenom jeho technologický šéf Mike Schroepfer dal. Podle něj bude systém jistě používán při řazení news feedu, kde se situace pro sociální síť komplikuje. V současnosti vybírá pro každého uživatele 30 až 60 nejzajímavějších příspěvků z asi 1500, které připadají v úvahu. Počet příspěvků na výběr se ale neustále zvyšuje.

„Dat je stále víc, lidé mají stále více přátel, a s příchodem mobilů jsou také častěji online,“ řekl Schroepfer MIT Technology Review. „Už se nedíváme na news feed jednou denně na konci dne; neustále taháme telefon z kapsy, například když na někoho čekáme, nebo při sezení v kavárně. Máme pět minut na to, abychom uživatele potěšili.“

Dalšími variantami využití je řazení fotografií v albech. Nebo, ještě dříve, rozhodování o tom, které fotografie na sociální síť vůbec nahrávat.

Srinivas Narayanan, jeden z těch, kdo pomáhal nový tým Facebooku sestavit, tvrdí, že projekt má dva hlavní cíle. Podle něj by měl jak pomoci společnosti se zdokonalováním jejích produktů, tak také chce posunout kupředu výzkum v oblasti deep learning systémů.

Podle Narayanana je k tomu Facebook ideálně uzpůsobený díky své velikosti a objemu dat, které zpracovává. Efektivně zpracovávat takové objemy dat je totiž problém jak softwaru, tak hardwaru, a především jejich perfektního vzájemného vyladění a spolupráce. Na tomto vyladění již Facebook v minulosti pracoval, například v rámci Open Compute Project, díky kterému vytvořil nejefektivnější datové centrum na světě.

Výstupy, které Facebook vytvoří v oblasti obecného výzkumu, slibuje společnost v budoucnu zveřejnit.