Academic Journal
Optimizando FOIL para la Extracción de Información de la Web?
العنوان: | Optimizando FOIL para la Extracción de Información de la Web? |
---|---|
المؤلفون: | J. L. Arjona, J. L. Álvarez |
المساهمون: | The Pennsylvania State University CiteSeerX Archives |
المصدر: | http://scholar.tdg-seville.info/Resources/Jimenez09.pdf. |
المجموعة: | CiteSeerX |
مصطلحات موضوعية: | Key words, extracción de información, EAI, FOIL 1 Introducción Las soluciones de Integración de Aplicaciones Empresariales permiten la sin |
الوصف: | Para abaratar los costes de las soluciones de Integración de aplicaciones web amigables necesitamos sistemas automáticos que per-mitan navegar hasta la información de interés, extraerla, estructurarla y verificarla. Los extractores de información son los elementos que permiten extraer la información de la web, y existe mucho trabajo en investigación que tiene como objetivo automatizar su construcción a partir de técnicas de aprendizaje automático. El algoritmo FOIL, ha demostrado ser una buena solución al problema anterior, sin embargo, su ineficiencia en este contexto, imposibilita su uso desde un punto de vista ingenieril. En este art́ıculo presentamos una serie de ideas originales que tienen como objetivo la optimización del algoritmo FOIL, lo que permitira ́ su uso, abaratando la construcción de extractores de información usados en soluciones de integración. |
نوع الوثيقة: | text |
وصف الملف: | application/pdf |
اللغة: | English |
Relation: | http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.591.2230; http://scholar.tdg-seville.info/Resources/Jimenez09.pdf |
الاتاحة: | http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.591.2230 http://scholar.tdg-seville.info/Resources/Jimenez09.pdf |
Rights: | Metadata may be used without restrictions as long as the oai identifier remains attached to it. |
رقم الانضمام: | edsbas.3BC03FD2 |
قاعدة البيانات: | BASE |
الوصف غير متاح. |