Textract od Amazonu rozpozná rukopis v několika jazycích

Služba Textract od Amazonu nově podporuje další jazyky a rozšiřuje své funkce o rozpoznávání rukopisu.

Společnost Amazon v pátek informovala o malých vylepšeních služby Textract, která pomocí strojového učení extrahuje tištěný text a data z dokumentů, tabulek a formulářů. Nyní dokáže Textract rozeznat také soubory ve španělštině, portugalštině, francouzštině, němčině a italštině. Navíc podporuje čtení rukopisu v anglicky psaných dokumentech.

Amazon právem konstatuje, že mnoho dokumentů, jako jsou například zprávy od lékařů nebo žádosti spojené se zaměstnáním, obsahuje obojí – kombinaci tištěného a ručně psaného textu. Konkurenti Google i Microsoft nabízejí své služby rozeznávání rukopisu už nějakou dobu, ale Amazon říká, že požadavky zákazníků podnítily vznik vlastního řešení, které funguje jak s volným textem, tak s textem vloženým do tabulek a formulářů.

Zákazníci Amazon Web Services (AWS) mohou vyzkoušet funkci Textract rozpoznávání rukopisu ve spojení s Amazon Augmented AI (A2I). A2I umožňuje uživatelům vytvářet pracovní postupy pro kontrolu předpovědí systémů strojového učení, ať už výsledky kontrolují zaměstnanci nebo externí dodavatelé AWS Marketplace. Dokumenty lze nahrát na Amazon Textract nebo je odeslat pomocí AWS Command Line Interface či softwaru AWS.

Textract zůstává méně holistickým řešením než nově spuštěná platforma Google Doc AI (DocAI), nástroj pro zpracování dokumentů hostovaný v Google Cloud. Podporuje vytváření a customizaci procesů souvisejících se zpracováním s předdefinovanou taxonomií, aniž by bylo potřeba provádět další mapování nebo učení. DocAI nabízí základní zpracování dat; například analýzu formulářů, optické rozpoznávaní znaků (OCR), rozdělovače dokumentů i vlastní procesy pro specifické dokumenty. Analyzátory umí rozlišit citlivé informace v dokumentech, jako jsou adresy, čísla účtů či podpisy, i extrahovat důležitá data jako jména dodavatelů, datum vydání faktur a platební podmínky.

Podle některých odhadů utratí společnosti v USA za uložení a archivaci papírů průměrně 20 dolarů za dokument a pouhých 18 % firem se považuje za bezpapírové. Zpráva IDC ukázala, že americké společnosti celkem utratí 8 miliard dolarů ročně za papírování a správu dokumentů. To má za následek nejen rozšíření AI produktů od technologických gigantů Amazon a Google, ale domácí průmysl má také co nabídnout – v čele se startupy jako Rossum, Anvil, PandaDoc – které se snaží svými cenami a přesností při zpracování dokumentů získat své klienty.

Amazon dále oznámil, že aktualizuje služby Amazon Lex a Amazon Polly. Platforma pro vytváření konverzačních rozhraní a chatbotů, Lex, nově podporuje také francouzštinu, španělštinu, italštinu a kanadskou francouzštinu. Polly, která dokáže přeměnit text v realistickou řeč, se rozšířila o australský (anglický) hlas nazvaný Olivia. Jedná se o syntetizovanou řeč fungující na stejné technologii jako služba Brand Voice od Amazonu.

Zdroj: Venturebeat

Diskuze k článku