Die Vision hinter der Sprachtechnologie ist der Einsatz alten und neuen Wissens zum computergestützten Sprachverstehen.
Maschinell lernende Systeme nutzen dabei statistische Methoden, um über das Vorkommen von Worten/Phrasen etc. in dem System bekannten Dokumenten - Trainingsdokumenten - Wissen über neue Dokumente zu generieren. Diese Methoden werden zur Klassifikation, Clustering, Sprachenerkennung etc. genutzt. Sie sind sprachenunabhängig, verstehen allerdings nichts von den Dokumenteninhalten.
Linguistisch arbeitende Systeme nutzen linguistische Ressourcen, wie z.B. Lexika, Wortnetze, Thesaurie, Grammatiken, etc., und führen "wirkliche" Analysen von Texten durch. Sie verstehen Dokumenteninhalte, sind allerdings sprachenabhängig. schmeier.com konzentriert sich derzeit auf Deutsch.
Durch Kombination beider Technologien, lassen sich Texte wirklich automatisch verarbeiten.
|
 |
|