¿ Por que usar mineria de datos?

Esta es una tecnologia emergente la cual ayuda a los procesos de toda empresa en distintas funciones.

¿Para que sirve?

tiene utilidad empresarial,sirve para predecir y describir cosas.

Campos de aplicación de la minería de datos

Puede ser útil en prácticamente todas las facetas de la actividad humana por ejemplo en las empresas ya que estas pueden optimizar procesos y mejorar sus productos y ventas.

beneficios de minería de datos

Descubre relaciones entre datos, mediante modelos avanzados y reglas de induccion puede examinar grandes cantidades de datos y encontrar patrones dificiles de identificar a simple vista.

¿Que se busca con minería de datos?

Normas,tendencias y patrones desde los cuales lo programas mineros realizaran en el proceso de selección y búsqueda en los datos históricos.

domingo, 17 de junio de 2012

¿Por qué usar data mining?

Si bien la data mining se presenta como una tecnología emergente, posee ciertas ventajas, como estas:


1-resulta un buen punto de encuentro entre los investigadores y las personas de negocios.
Este punto hace referencia a que aparece nueva tecnología la cual muchas veces es adquirida por empresas grandes las cuales financian estos proyectos.

2- ahorra grandes cantidades de dinero a una empresa y abre nuevas oportunidades de negocios.
Prácticamente esto apoya al punto anterior ya que cuando un proyecto es bueno este es financiado por una empresa la cual adquiere más dinero del que invirtió y gracias a esta tecnología una empresa puede abrir otras oportunidades en el mercado.

3- trabajar con esta tecnología implica cuidar un sin número de detalles debido a que el producto final involucra "toma de decisiones".
 Tienes la tecnología y esta te abrió paso en el mercado, también esta crea un producto el cual tu estas ofreciendo, pero hay que ver que tan efectiva fue la implementación la empresa ¿va creciendo o decreciendo? , ha eso hace referencia el punto 3.
4- contribuye a la toma de decisiones tácticas y estratégicas proporcionando un sentido automatizado para identificar información clave desde volúmenes de datos generados por procesos tradicionales y de e-Business.

5- permite a los usuarios dar prioridad a decisiones y acciones, mostrando factores que tienen un mayor en un objetivo, también muestra qué segmentos de clientes son desechables y qué unidades de negocio son sobrepasados y el ¿por qué?
 Hace referencia a que gracias a Data Mining solo hay que preocuparse de las tomas de decisiones ya que gracias a esta tecnología va mostrando las diversas ventajas y desventajas como son algunas señaladas en este punto. (Punto 5)
6- proporciona poderes de decisión a los usuarios del negocio que mejor entienden el problema y el entorno y es capaz de medir las acciones y los resultados de la mejor forma.
Gracias a Data Mining se pueden dividir los problemas en distintos sectores y esto provocara que en diversos sectores deba haber distintos grupos de trabajo especializados en el ámbito de ese problema para así optimizar el tiempo y recursos.

7- genera Modelos descriptivos: en un contexto de objetivos definidos en los negocios permite a empresas, sin tener en cuenta la industria o el tamaño, explorar automáticamente, visualizar y comprender los datos e identificar patrones, relaciones y dependencias que impactan en los resultados finales de la cuenta de resultados (tales como el aumento de los ingresos, incremento de los beneficios, contención de costes y gestión de riesgos).

8 genera Modelos predictivos: permite que relaciones no descubiertas e identificadas a través del proceso del Data Mining sean expresadas como reglas de negocio o modelos predictivos. Estos outputs pueden comunicarse en formatos tradicionales (presentaciones, informes, información electrónica compartida, embebidos en aplicaciones, etc.) para guiar la estrategia y planificación de la empresa. 
Glosario:
Outputs: Producto que resulta de la combinación de los diversos factores o inputs de producción.
Inputs: sistema de entrada de información..-Elemento que participa en un determinado proceso productivo. 'INPUT' también aparece en estas entradas..


.


  logramos observar la imagen de la izquierda una empresa sin tecnología Data Mining y a la derecha una empresa con tecnología Data Mining es decisión de ustedes cual funciona mejor


miércoles, 6 de junio de 2012

Etapas principales del proceso de mineria de datos.

Los principales procesos de la minería de datos son:


• Filtrado de datos.
• Selección de Variables.
• Extracción de Conocimiento.
• Interpretación y Evaluación.

1)Filtrado de datos: se filtran los datos (de forma que se eliminan
valores incorrectos, no válidos, desconocidos... según las necesidades y el algoritmo a usar), se obtienen muestras de los mismos (en busca de una mayor
velocidad de respuesta del proceso), o se reducen el número de valores posibles
(mediante redondeo, clustering,...).


2) Selección de variable: La selección de características reduce el tamaño de los datos eligiendo las variables más influyentes en el problema.

Los métodos para la selección de características son básicamente dos:
• Aquellos basados en la elección de los mejores atributos del problema,
• Y aquellos que buscan variables independientes mediante tests de sensibilidad, algoritmos de distancia o heurísticos.

3)Algoritmos de Extracción de Conocimiento: Mediante una técnica de minería de datos, se obtiene un modelo de conocimiento, que representa patrones de comportamiento observados en los valores de las variables del problema o relaciones de asociación entre dichas variables.

4)Interpretación y evaluación: Una vez obtenido el modelo, se debe proceder a su validación, comprobando que las conclusiones que arroja son válidas y suficientemente satisfactorias.
En el caso de haber obtenido varios modelos mediante el uso de distintas
técnicas, se deben comparar los modelos en busca de aquel que se ajuste mejor
al problema. Si ninguno de los modelos alcanza los resultados esperados, debe
alterarse alguno de los pasos anteriores para generar nuevos modelos.


sábado, 2 de junio de 2012

Reglas de asociación

Las reglas de asociación en la minería de datos se utilizan para encontrar hechos que ocurren en común dentro de un conjunto de datos. Dicho de otra manera que debe ocurrir ciertas condiciones para que se produzca cierta condición.

Para encontrar estas reglas de debe considerar cada posible combinación de condiciones para que halla una consecuencia. Al hablar de reglas de asociación también cumple un rol importante la cobertura o también llamado soporte que es el número de instancias predichas correctamente y la precisión o confianza que es la proporción de numero de instancias que es aplicada la regla.

                                                           {Confianza}       →         {Soporte}
                                                                           {X}       →        {Y}


Reglas significativas de soporte y confianza

Se tiene la siguiente tabla:

Ambiente Temperatura Humedad Viento Clase
soleado alta alta no N
soleado alta alta si N
nublado alta alta no P
lluvia media alta no P
lluvia baja normal no P
lluvia baja normal si N
nublado baja normal si P
soleado media alta no N
soleado baja normal no P
lluvia media normal no P
soleado media normal si P
nublado media alta si P
nublado alta normal no P
lluvia media alta si N

Se llama ítem a la cantidad de condiciones que se encuentran en este caso serian 4 ambiente, temperatura, humedad y viento

En esta tabla anterior se dan las siguientes probabilidades y el soporte:

humedad=normal
y
viento=no
entonces
clase=P
4/4
humedad=normal
y
clase=P
entonces
viento=no
4/6
viento=no
y
clase=P
entonces
humedad=normal
4/6
humedad=normal
entonces
viento=no
y
clase=P
4/7
viento=no
entonces
clase=P
y
humedad=normal
4/8
clase=P
entonces
viento=no
y
humedad=normal
4/9

Eso solo son algunas ya que en este ejemplo existen cerca de 55 reglas de asociación