Dissertation/ Thesis

Language model driven analysis : simplifying text on an individual scale ; Benutzerzentrierte Modelle - Versuch unbekannte Wörter zu finden

التفاصيل البيبلوغرافية
العنوان: Language model driven analysis : simplifying text on an individual scale ; Benutzerzentrierte Modelle - Versuch unbekannte Wörter zu finden
المؤلفون: Strelzow, Alexej
المساهمون: Hanbury, Allan, TU Wien, Österreich, Lupu, Mihai
بيانات النشر: Wien
سنة النشر: 2020
المجموعة: TU Wien: reposiTUm
مصطلحات موضوعية: Computerlinguistik, natürliche Sprachverarbeitung, Informationsrückgewinnung, computational linguistics, natural language processing, information retrieval
الوصف: Abweichender Titel nach Übersetzung der Verfasserin/des Verfassers ; Zusammenfassung in deutscher Sprache ; Das Ziel dieser Arbeit ist es ein Tool bereit zu stellen, das Personen (Benutzern) beim Verstehen von schweren Texten, z.B. Publikationen eines Forschers, individuell unterstützt. Basierend auf einer Sammlung von Dokumenten des Benutzers stellen wir eine neuartige Methode vor Wörter in einem neuen Dokument, welcher er oder sie lesen möchte, zu finden, welche dem Benutzer mit großer Wahrscheinlichkeit unbekannt sind. Außerdem erklären wir diese Wörter mit Hilfe von externen Datenquellen. Unser Tool stellt das analysierte Dokument Seite für Seite dar und zeigt dem Benutzer eine Liste von gefundenen, unbekannten Wörtern und deren Erklärung zu der jeweiligen Seite. Wir implementierten einen Prototypen, welcher Sprachmodelle (Benutzer- und Dokumentenmodelle) aus Text generiert, diese miteinander vergleicht und die als unbekannt befundenen Wörter erklärt. Das Benutzermodell ist eine Abstraktion von seinen Sprachkenntnissen im Sinne von bekanntem Vokabular. Wir schätzen die Menge an bekannten Wörtern mit Hilfe der geschriebenen Dokumenten vom Benutzer (domänenspezifische Komponente) und einer sehr umfassenden Wortliste, bestehend aus zeitgenössischem amerikanischen Englisch (generelle Komponente). Der Algorithmus, der die Modelle vergleicht, nimmt die Sprachmodelle als Eingabe und identifiziert mögliche unbekannte Wörter basierend auf semantischen und statistischen Methoden. Um unbekannte Wörter erklären zu können verwenden wir BabelNet, ein großes semantisches Wörterbuch. Um herauszufinden ob unsere Vorgehensweise funktioniert haben wir zuerst ein Testset aus Sprachmodellen erstellt und danach quantitative und qualitative Experiment durchgeführt. Dokumente für die Generierung von Benutzermodellen stammen von der DBLP Computerwissenschaftsbibliographie, einer Datenbank für bibliographische Metadaten. In unseren Experimenten haben wir Benutzermodelle (aus der IT Domäne) mit den Dokumentenmodellen aus den Domänen ...
نوع الوثيقة: thesis
وصف الملف: xiii, 90 Seiten
اللغة: English
Relation: https://doi.org/10.34726/hss.2016.35681; http://hdl.handle.net/20.500.12708/6392; AC13386803; urn:nbn:at:at-ubtuw:1-92858
DOI: 10.34726/hss.2016.35681
الاتاحة: https://doi.org/10.34726/hss.2016.35681
https://hdl.handle.net/20.500.12708/6392
Rights: open
رقم الانضمام: edsbas.9920B1C6
قاعدة البيانات: BASE