التفاصيل البيبلوغرافية
العنوان: |
Συστήματα ανάκτησης πληροφορίας από αδόμητο κείμενο: ευρετήρια και κώδικες συμπίεσης ; Free text information retrieval systems: indexes and compression codes |
المؤلفون: |
Νίτσος, Ηλίας |
المساهمون: |
Ευαγγελίδης, Γεώργιος, Μανωλόπουλος, Ιωάννης, Μαργαρίτης, Κωνσταντίνος, Πάγκαλος, Γεώργιος, Παπαρρίζος, Κωνσταντίνος, Σατρατζέμη, Μαρία Αικατερίνη, Στεφανίδης, Γεώργιος, Πανεπιστήμιο Μακεδονίας Οικονομικών και Κοινωνικών Επιστημών. Τμήμα Εφαρμοσμένης Πληροφορικής. (ΕΠ) |
بيانات النشر: |
Πανεπιστήμιο Μακεδονίας Οικονομικών και Κοινωνικών Επιστημών |
سنة النشر: |
2005 |
المجموعة: |
University of Macedonia: Psepheda - Digital Library & Institutional Repository |
مصطلحات موضوعية: |
ανάκτηση πληροφορίας, αδόμητο κείμενο, αναζήτηση σε κείμενο, ευρετήρια, δομές ευρετηρίων, κώδικες συμπίεσης, αντεστραμμένα αρχεία-ευρετήρια, αρχεία υπογραφών, information retrieval, free text indexing, full text search, indexes, index structures, compression codes, inverted files, signature files |
الوصف: |
Περιλαμβάνει βιβλιογραφικές αναφορές (σ.185-192). ; Διατριβή (Διδακτορική)--Πανεπιστήμιο Μακεδονίας, Θεσσαλονίκη, 2005. ; Η βιβλιοθήκη διαθέτει αντίτυπο της διατριβής σε έντυπη μορφή. ; 018/2005 ; Αντικείμενο της διατριβής αποτελούν τα συστήματα ανάκτησης πληροφορίας από αδόμητο κείμενο και ιδιαίτερα οι δομές των ευρετηρίων που χρησιμοποιούνται από τα συστήματα αυτά: τα Αρχεία Υπογραφών (ΑΥ) και τα Αντεστραμμένα Αρχεία-Ευρετήρια (ΑΑΕ). Ένα μέρος της διατριβής επικεντρώνεται στη μελέτη της S-Index, μιας υβριδικής μεθόδου ευρετηριοποίησης που συνδυάζει στοιχεία από τις προαναφερθείσες δομές. Η S-Index υλοποιείται σε χαμηλό επίπεδο κι εξετάζονται οι επιδόσεις της, καθώς η μόνη γνωστή υλοποίηση που υπήρχε ήταν μια προσομοίωση με δυνατότητες ευρετηριοποίησης συλλογών κειμένου μικρού μεγέθους. Επίσης προτείνεται μια παραλλαγή της μεθόδου, η S-Index2, ώστε να ενισχυθεί η ικανότητα της αρχικής στη συμπίεση του παραγόμενου ευρετηρίου. Η περιορισμένη δυνατότητα εντοπισμού των όρων στα κείμενα μιας συλλογής, που χαρακτηρίζει την S-Index και την S-Index2, αντιμετωπίζεται στο Bitmap-tree, μια νέα μέθοδο ευρετηριοποίησης που βασίζεται στην S-Index κι έχει το πλεονέκτημα της ταχύτατης επεξεργασίας ειδικού τύπου ερωτημάτων. Στη συνέχεια το επίκεντρο της έρευνας μετατοπίζεται στους κώδικες συμπίεσης των ΑΑΕ, με τη βοήθεια των οποίων ελαχιστοποιούνται οι απαιτήσεις σε αποθηκευτικό χώρο κι επιταχύνονται οι διαδικασίες επεξεργασίας ερωτημάτων. Προτείνονται τρεις νέοι κώδικες συμπίεσης: ο uγ-Golomb, βελτιωμένη παραλλαγή του δημοφιλούς κώδικα Golomb για το τοπικό μοντέλο Bernoulli και οι g-binary και compact-binary, μη-παραμετροποιημένοι κώδικες με βελτιωμένες επιδόσεις σε βαθμό συμπίεσης και ταχύτητα αποκωδικοποίησης σε σχέση με όλους τους κώδικες της κατηγορίας τους. ; The scope of the thesis is the Information Retrieval Systems which retrieve information from non-structured text, and, specifically, the index structures used by these systems: Signature Files (SF) and Inverted File Indexes (IF). A part of this thesis focuses on the ... |
نوع الوثيقة: |
thesis |
وصف الملف: |
192 σ.; 2499636 bytes; application/pdf |
اللغة: |
Greek, Modern (1453-) |
Relation: |
http://dspace.lib.uom.gr/handle/2159/192 |
الاتاحة: |
http://dspace.lib.uom.gr/handle/2159/192 |
رقم الانضمام: |
edsbas.E0DDDB96 |
قاعدة البيانات: |
BASE |