Letzte Entwicklungen
Die Aktivitäten der schmeier.com befassten sich in den letzten Monaten mehr und mehr mit dem Thema Linguistik.
Hauptarbeiten flossen hier in der Entwicklung eines englischen und deutschen Syntaxparsers. Ziel des Parsers ist die Erkennung und Extraktion von wesentlichen Informationen innerhalb von Dokumenten und die Darstellung der Ergebnisse in maschinenlesbarer Form.
Hier nun die Hauptmerkmale der Parser:
(1) Robustheit und Anwendbarkeit auf verschiedene Anwendungsgebiete.
(2) Performanz/Geschwindigkeit: Pro Satz werden etwa 20-50ms auf einem Standard PC benötigt (zzgl. IO Aktivitäten)
(3) Zwischenergebnisse wie: Part Of Speech, Satzteilzerlegung, Phrasenbestimmung, Kasusbestimmung und Pronomen- und Anapherresolutionen sowohl innerhalb von Sätzen als auch satzübergreifend sind abrufbar.
(4) Tiefster syntaktischer Level: Erkennung von Subjekt - Prädikat - Objekt Relationen.
(5) In wissenschaftlicher Hinsicht konnten die Ergebnisse der Arbeit erfolgreich auf der Konferenz AIA 2007 - Artificial Intelligence and Applications untergebracht werden
Für einen Überblick über die verwendeten Technologien klicken Sie bitte hier
Praktischer Nutzen
Mit einem syntaktischen Parser ist es möglich, inhaltliche Zusammenhänge innerhalb von Dokumenten explizit in maschinenlesbarer Form zu extrahieren.
Anwendungsbeispiele:
(a) Automatische Erkennung von Firmenübernahmen, -verkäufen, -fusionierungen etc.
(b) Extraktion von Hauptthemen zum Beispiel zur automatischen Weiterverarbeitung von Nachrichten
(c) Realisierung semantischer Suchmaschinen und Question-Answering Systemen
(d) Automatisches Erstellen strukturierter Informationssammlungen aus unstrukturiertem, i.e. natürlichsprachlichem Text
|