Latente semantische Analyse
aus Wikipedia, der freien Enzyklopädie
Unter Latente Semantische Analyse (LSA) versteht man ein statistisches Verfahren aus dem Fachgebiet der automatischen Sprachverarbeitung zur Analyse von Textkorpora.
Die LSA wurde 1990 von Scott Deerwester, Susan Dumais, George Furnas, Thomas Landauer und Richard Harshman entwickelt [1].
Die Wörter und Dokumente des Textkorpus werden auf der Basis ihrer Auftretenshäufigkeit mit anderen Wörtern und Dokumenten in einem n-dimensionalen Raum (semantischer Raum) angeordnet. Je häufiger verschiedene Wörter und Dokumente in ähnlichen Kontexten auftreten, desto näher liegen ihre Koordinaten beieinander. Berechnet man den Cosinus des Zwischenwinkels zwischen den Vektoren zweier Koordinaten des semantischen Raumes, so erhält man ein Maß für die semantische Ähnlichkeit der beiden Wörter oder Dokumente, wobei ein Wert von 1 maximale Übereinstimmung und von 0 keine Übereinstimmung bedeutet.
[Bearbeiten] Siehe auch
[Bearbeiten] Weblinks
- LSA Research Group der Universität Boulder/Colorado, USA
- Forschungsgruppe SUMMA zur Anwendung der LSA im pädagogisch-psychologischen Bereich, Institut für Psychologie, Universität Würzburg