Google koupil projekt reCAPTCHA

Google tento týden koupil společnost reCAPTCHA (viz. oficiální blog). Jak už název napovídá, společnost nabízí technologii CAPTCHA, využitelnou zejména v boji proti spamovým robotům. Jedná se o test, který na základě předpokladu, že robot nebude schopen rozeznat deformovaný text, ale lidský mozek ano, umožňuje odlišit lidské uživatele od robotů (více na Wikipedii).

Slova, které reCAPTCHA používá, často pocházejí z textů starších naskenovaných novin či knih, které jsou pro počítačové programy hůře rozpoznatelné (zejména díky zhoršené kvalitě jak inkoustu, tak papíru). Tento systém tedy jednak představuje oříšek pro spamové roboty, ale zároveň umožňuje vylepšení technologie OCR (optické rozeznávání znaků). Uživatelé tím, že vkládají text, který vidí na obrázku, de facto (laicky řečeno) učí počítač číst.

google recaptcha

Využití u Googlu

Pro Google je vylepšení technologie OCR důležité zejména díky tomu, že se velkoplošně užívá v Google Books nebo Google News Archive Search, projektech, které nabízí digitalizovanou podobu knih, respektive novin. Převod dokumentů do prostého textu je důležitý pro možnost hledání v rámci textů a možnost snadnějšího zobrazení na mobilních zařízeních a zrakově postiženým uživatelům. Produkty Googlu tedy od nynějška  budou lépe zabezpečené proti podvodům a spamovým robotům a zároveň bude postupně vylepšována technologie rozeznávání textu.

S CAPTCHOU si hraje i Microsoft. Ten nedávno oznámil, že bude bojovat o patent na reklamní využití technolgie CAPTCHY.