Na této stránce máte možnost získat podklady k přednášce M. Holuba a R. Base:

Teorie a praxe latentně sémantické indexace (LSI) textových dokumentů

ABSTRAKT:

Latentně sémantická indexace textových dokumentů je metoda vyvinutá začátkem 90. let a má pomoci potlačit nežádoucí důsledky synonymie v přirozeném jazyce. Je založena algebraicky, na SVD-rozkladu (singular value decomposition) matice representující četnosti výskytů termů v dokumentech. Získame-li SVD-rozklad, můžeme tuto matici aproximovat drastickým snížením její dimenze. To přináši dva užitečné důsledky, za prvé zefektivnění výpočtu podobnosti dotazu a dokumentu, a za druhé nalezení některých dokumentů, které jsou relevantní, přestože neobsahují termy použité v dotazu.

Obsah:


Vytvořeno 1.2.2002
Poslední změny 1.2.2002
michal.kratky@vsb.cz