Inteligentní vyhledávač Exalead si poradí i s obsahem videí

Redakce STROJIRENSTVI.CZ vydáno dne 27. srpna 2012

Jako v realitním byznysu hraje hlavní roli poloha nemovitosti, ve světě informačních technologií je to rychlost, co rozhoduje. A v současnosti se k tomu přidala relevantnost vyhledaných informací.

Množství informací je naopak na závadu. Proto je ve výsledcích na Googlu důležité být v prvních deseti výsledcích. Hledající si totiž myslí, že je to ta správná informace, kterou hledá. Přitom roste procento dokumentů multimediálních (video, rozhovory) a nestrukturovaných (tabulky v Excelu, technické výkresy, zápisy z porad). Zásadní roli ve vyhledávání hraje tedy algoritmus, který si každá organizace pečlivě střeží.

 Firem, poskytujících nástroje na prohledávání dokumentů na lokálním počítači, je celá řada. Namátkou třeba Windows Desktop Search, Google Desktop Search, Turbo Searcher. Složitější je situace ve firemní síti, kdy bez zavedených pravidel například pro pojmenování souborů se můžete dostat do situace, že ač dokument existuje, tak jej nenajdete, nebo dostanete příliš mnoho dokumentů, ze kterých si nevyberete. Vynásobte tuto situaci například tisícem, a máte před sebou obrovské snížení produktivity celé firmy.

 Proto jsou v současnosti vyhledávána řešení pro firemní prohledávání a „dolování dat“, tzv. data mining, kdy z nestrukturovaných dat dostanete strukturovaný výstup. Ačkoliv je dlouhodobě prokázáno, že většinu dokumentů (až 90 %) po jejich vytvoření pravděpodobně v budoucnu nebudete potřebovat, firmy a instituce si z nejrůznějších důvodů uschovávají většinu vyprodukovaných informací.

Inteligentní systém pomůže data nejen vyhledat, ale také je uspořádat a nabídnout ta správná. Ilustrace: Exalead

Vyhledávání na vyšší úrovni

Globální korporace Dassault Systèmes, mezi čtenáři našich časopisů známá jako producent programů jako je Enovia či Catia, právě z důvodů lepšího prohledávání nestrukturovaných dokumentů vloni v červnu koupila firmu Exalead.

 Podnik se 140 zaměstnanci a přibližně 250 zákazníky, mezi nimiž najdeme například i poradenskou společnost PriceWaterhouseCoopers nebo skotskou vládu, se specializuje na segment, označovaný jako „enterprise search“. V on-line prohledávání většina uživatelů webu zná Google nebo Yahoo!, v institucionální sféře se snaží prosadit právě Exalead.

Zakladatelem Exaleadu se v roce 2000 stal François Bourdoncle, který předtím v 90. letech 20. století pracoval v AltaVistě (vzpomínáte si na první vyhledávací stroj webu, ještě než na začátku 21. století nastoupil Google?). V průběhu následujících let se firma specializovala na vyhledávání ve firemních sítích a vytváření jednoduššího vyhledávání na firemních webech.

 O složitosti prohledávacího algoritmu svědčí to, že jen samotný Google ročně udělá v algoritmu tři sta vylepšení. Exalead, ač ve srovnání s Googlem relativně neznámá firma, poskytuje firmám nástroje na zjednodušení vyhledávání. Dalo by se říct, že je to takový „Google pro firmy“, pokud chceme najít nějakou vhodnou metaforu.

 Pro vyhledávání ve firemní síti obsahuje software Exaleadu 300 konektorů pro nejrůznější typy dokumentů. Základním produktem je vyhledávací stroj CloudView, který vedle vyhledávání obsahuje také nástroje pro reporting a tzv. business intelligence.

Exalead poskytuje nástroje pro tvorbu tzv. mashupů, které kombinují různé zdroje dat. Ilustrace: Exalead

Opravdu netušené možnosti

Protože řada zákazníků Exaleadu pracuje s citlivými daty, většinou se o nich nedozvíte (pojištovny, banky, státní bezpečnostní agentury, armádní rozvědky). Pro malou ukázku toho, co Exalead umí, se proto podíváme na největší francouzskou internetovou cestovní agenturu Voyages-sncf.com. Ta v červenci představila novou službu Hexago, umožňující zákazníkům vytvořit si vlastní itinerář. Pro vytvoření Hexago byl použit CloudView 360 a funkce pro tvorbu mashupů. Pokud si vedle sebe dáte standardní web Voyage-SNCF.com a jejich Hexago službu, je vidět, že se vyhledávání razantně zjednodušilo.

 Podle Dominique Topaleva z Exaleadu, který o možnostech vyhledávání v průmyslovém kontextu přednášel letos na jaře na pražském Dassault Systèmes PLM Fóru, je nasazení vyhledávání otázkou v řádu měsíců. O rychlosti svědčí aktuální projekt pro Dassault Aviation. V něm se dají prohledávat a vyhodnocovat letová data, čítající stovky tisíc záznamů, uložených v různých typech databází.

 Z uvedeného příkladu je jasné, proč Dassault koupil Exalead. V celé řadě jejich produktů a služeb napříč celým průmyslovým spektrem chybělo jednoduché a přitom rychlé precizní vyhledávání v různých typech dat. Do budoucna se tak možná dočkáme také sofistikovanějšího vyhledávání v CAD výkresech, doprovodné dokumentaci či produktových katalozích.

Příspěvek zatím nikdo neokomentoval. Buďte první.