Academic Journal

Optimizando FOIL para la Extracción de Información de la Web?

التفاصيل البيبلوغرافية
العنوان: Optimizando FOIL para la Extracción de Información de la Web?
المؤلفون: J. L. Arjona, J. L. Álvarez
المساهمون: The Pennsylvania State University CiteSeerX Archives
المصدر: http://scholar.tdg-seville.info/Resources/Jimenez09.pdf.
المجموعة: CiteSeerX
مصطلحات موضوعية: Key words, extracción de información, EAI, FOIL 1 Introducción Las soluciones de Integración de Aplicaciones Empresariales permiten la sin
الوصف: Para abaratar los costes de las soluciones de Integración de aplicaciones web amigables necesitamos sistemas automáticos que per-mitan navegar hasta la información de interés, extraerla, estructurarla y verificarla. Los extractores de información son los elementos que permiten extraer la información de la web, y existe mucho trabajo en investigación que tiene como objetivo automatizar su construcción a partir de técnicas de aprendizaje automático. El algoritmo FOIL, ha demostrado ser una buena solución al problema anterior, sin embargo, su ineficiencia en este contexto, imposibilita su uso desde un punto de vista ingenieril. En este art́ıculo presentamos una serie de ideas originales que tienen como objetivo la optimización del algoritmo FOIL, lo que permitira ́ su uso, abaratando la construcción de extractores de información usados en soluciones de integración.
نوع الوثيقة: text
وصف الملف: application/pdf
اللغة: English
Relation: http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.591.2230; http://scholar.tdg-seville.info/Resources/Jimenez09.pdf
الاتاحة: http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.591.2230
http://scholar.tdg-seville.info/Resources/Jimenez09.pdf
Rights: Metadata may be used without restrictions as long as the oai identifier remains attached to it.
رقم الانضمام: edsbas.3BC03FD2
قاعدة البيانات: BASE