miércoles, 6 de junio de 2012

Etapas principales del proceso de mineria de datos.

Los principales procesos de la minería de datos son:


• Filtrado de datos.
• Selección de Variables.
• Extracción de Conocimiento.
• Interpretación y Evaluación.

1)Filtrado de datos: se filtran los datos (de forma que se eliminan
valores incorrectos, no válidos, desconocidos... según las necesidades y el algoritmo a usar), se obtienen muestras de los mismos (en busca de una mayor
velocidad de respuesta del proceso), o se reducen el número de valores posibles
(mediante redondeo, clustering,...).


2) Selección de variable: La selección de características reduce el tamaño de los datos eligiendo las variables más influyentes en el problema.


Los métodos para la selección de características son básicamente dos:
• Aquellos basados en la elección de los mejores atributos del problema,
• Y aquellos que buscan variables independientes mediante tests de sensibilidad, algoritmos de distancia o heurísticos.

3)Algoritmos de Extracción de Conocimiento: Mediante una técnica de minería de datos, se obtiene un modelo de conocimiento, que representa patrones de comportamiento observados en los valores de las variables del problema o relaciones de asociación entre dichas variables.

4)Interpretación y evaluación: Una vez obtenido el modelo, se debe proceder a su validación, comprobando que las conclusiones que arroja son válidas y suficientemente satisfactorias.
En el caso de haber obtenido varios modelos mediante el uso de distintas
técnicas, se deben comparar los modelos en busca de aquel que se ajuste mejor
al problema. Si ninguno de los modelos alcanza los resultados esperados, debe
alterarse alguno de los pasos anteriores para generar nuevos modelos.


0 comentarios:

Publicar un comentario