martes, 13 de noviembre de 2012

Mineria de datos y twitter

La minería de datos consiste en deducir aquella información que es de alta calidad dentro de un texto. En este contexto definimos alta calidad como aquella información que combina relevancia, novedad e interés.
Actualmente las tareas de minería de texto incluyen la categorización, agrupación de texto, extracción de la entidad, producción de taxonomías granulares (clasificaciones granulares), análisis de sentimientos, resumen del documento y modelización de la relación de la entidad.

Por otro lado Twitter no solo es una herramienta social, es una fuente de información, inmediata, directa, y que puede llegar a generar un exceso de información. Este gran volumen de información hace que aumente la información no útil y que la información de alta calidad sea más difícil de localizar. Aquí es donde entra en juego la minera de datos, la cual juega, como vemos, un papel muy útil en twitter a la hora de recuperar información de calidad.

No hay comentarios:

Publicar un comentario