Morfix Index Manager

Fulltextový morfologický indexovaný vyhľadávací systém

Morfix – je založený na pokročilej technológii indexovaného vyhľadávania v plných textoch za pomoci lingvistických modulov.

Úlohou Morfix Index Managera je vytvárať a modifikovať fulltextové indexy nad rozsiahlymi súbormi textov za pomoci lematizátora, v ktorých je možné potom vyhľadávať pomocou modulu Morfix Search.
Použitie lematizátora už pri vytváraní indexu výrazne zlepšuje jeho možnosti použitia na jazyky, ktoré majú veľké množstvo ohybov slov (skloňovanie, časovanie, stupňovanie...) ako slovenčina, čeština a ďalšie.

Má jednoduché a dobre zdokumentované programové rozhranie (API) a vie pracovať nielen v prostredí pracovných staníc, ale aj ako súčasť rozsiahlych client/server a internetových projektov.

Hlavné vlastnosti sú:

  • lingvistické indexovanie
  • inkrementálne indexovanie
  • podpora skupín
  • šumový zoznam
  • kódové stránky
  • multilingválnosť
  • vysoký výkon
  • podpora 32 aj 64-bitových verzií Windows

Inkrementálne indexovanie – vytvorené indexy je možné kedykoľvek meniť (rozširovať o nové dokumenty, rušiť alebo meniť dokumenty) bez nutnosti preindexovania (rebuildovania) kompletného indexu. Indexy je možné aj spájať, takže pri indexovaní veľkého množstva dokumentov (napr. internet) môže paralelne pracovať viac indexerov na jednom alebo viacerých počítačoch a na konci sa môžu jednotlivé indexy spojiť do jedného.

Skupiny – (grupy) indexované dokumenty je možné združovať do skupín a vyhľadávanie sa dá robiť aj v jednej alebo viacerých skupinách. Jeden index môže obsahovať až 32 takýchto skupín.

Šumový zoznam – (Stop Words, Noise List) zoznam slov, ktoré sú vylúčené z vyhľadávania. Sú to slová, ktoré sa príliš často vyskytujú a ich vyhľadávanie nemá význam – spojky, predložky, ... Tento zoznam je v obyčajnom textovom súbore a je možné ho ľubovoľne rozširovať.

Kódovanie – systém podporuje väčšinu štandardných kódovaní textov používaných v západnej a východnej Európe – Win-1250, ISO-8859-2, CP852, Mac-CE, ...

Multilingválnosť – jednotlivé indexy môžu byť vytvárané nad textami v rôznych jazykoch; okrem slovenčiny sú priamo k dispozícii aj lematizátory anglického a nemeckého jazyka. Je možné objednať si lematizátor českého jazyka, ktorý partnersky dodáva Lingea, s.r.o.
Okrem toho je možné dodať aj modul otvoreného lematizátora, v ktorom si môže zákazník vytvoriť svoj vlastný jazykový modul so svojou špecifickou slovnou zásobou.