¿ Por que usar mineria de datos?

Esta es una tecnologia emergente la cual ayuda a los procesos de toda empresa en distintas funciones.

¿Para que sirve?

tiene utilidad empresarial,sirve para predecir y describir cosas.

Campos de aplicación de la minería de datos

Puede ser útil en prácticamente todas las facetas de la actividad humana por ejemplo en las empresas ya que estas pueden optimizar procesos y mejorar sus productos y ventas.

beneficios de minería de datos

Descubre relaciones entre datos, mediante modelos avanzados y reglas de induccion puede examinar grandes cantidades de datos y encontrar patrones dificiles de identificar a simple vista.

¿Que se busca con minería de datos?

Normas,tendencias y patrones desde los cuales lo programas mineros realizaran en el proceso de selección y búsqueda en los datos históricos.

sábado, 26 de mayo de 2012

Herramientas primitivas de la minería de datos

Data mining a lo largo de la historia ha sido llamado de distintas maneras. A partir de los años sesenta los estadísticos utilizaban el termino de data fishing (pesca de datos) o data dredging (filtración de datos) con la idea de encontrar correlaciones sin una hipótesis previa en bases de datos con ruido.

En 1989, Gregory Piatetsky-Shapiro utilizo el termino Knowledge Discovery in Databases (descubrimiento de conocimiento en base de datos) mas conocido pro sus siglas KDD, sin embargo al usarlo indistintamente se entra en un error porque  el proceso de data mining es la aplicación de algoritmos para extraer patrones de datos y KDD es el proceso completo.

El termino de Data mining se empezó a usar a partir de los años noventa además también se uso data Archaeology (arqueología de datos), Information Harvesting (recolección de información), Information Discovery (Descubrimiento de Información), Knowledge Extraction (Extracción de conocimiento), entre otros. Antes de esto existió otro termino que era Database MiningTM, pero esta frase fue registrada por la empresa HNC, y por ese motivo los investigadores decidieron cambiarlo por data mining que es el termino que mas se usa actualmente.

sábado, 19 de mayo de 2012

Áreas relacionadas con la minería de datos.

" la minería de datos es una actividad en expansión aplicada cada vez en más disciplinas, que han visto la utilidad del estudio de datos para apoyar la toma de decisiones. Especial énfasis está teniendo en aquellas áreas relacionadas con la Economía, mediante la Econometría, y dentro del campo de inteligencia de los negocios"1
Algunas de las tareas mas importantes de la minería de datos incluyen la identificación de aplicaciones para las técnicas existentes, y desarrollar nuevas técnicas para dominios tradicionales o  de nueva aplicación, como el comercio electrónico y la bioinformatica .
Existen numerosas áreas  donde la minería de datos se puede aplicar, practicamente a todas las actividades humanas que generen datos:


_Comercio y banca:  Segmentación de clientes, previsión de ventas, análisis de riesgos.
_Medicina y farmacia: diagnostico de enfermedades y la efectividad de tratamientos.
Ejemplo 
 "Supongamos un hospital donde hay unos datos de pacientes y un diagnóstico. Se puede tener una tabla de datos que incluya por ejemplo datos como Paciente / Edad / Glóbulos rojos / Glóbulos blancos / Tensión / Azúcar / Diagnóstico. ¿Para qué le serviría la minería de datos al hospital? Pues por ejemplo para hacer un prediagnóstico de la dolencia que con mayor probabilidad pueda tener un paciente en base a sus datos asociados. Un tipo de dolencia se dice que es un dato discreto porque solo puede tomar unos valores concretos (por ejemplo que haya 30 tipos de dolencias). Estudiando y tratando los datos se pueden llegar a conclusiones, por ejemplo que si un paciente tiene más de 60 años, los glóbulos blancos muy altos y el azúcar alto es muy probable que esté desarrollando diabetes. Si el paciente corresponde a ese perfil, la decisión puede ser hacer unas pruebas específicas o poner cierto tratamiento preventivo"2


_Seguridad y detección de fraudes: reconocimiento facial, identificación biometricas, accesos a redes no permitidos etc.
_Recuperación de información no numérica: minería de texto, minería de web, búsqueda e identificación de imagenes, video, voz y texto en bases de datos multimedia.
_Astronomía: identificacion de nuevas galaxias y estrellas.
_Geología, minería, agricultura y pesca: identificacion de áreas de uso para distintos cultivos o de pesca o de explotación minería en bases de datos de imagenes satelitales.
_Ciencias sociales: Estudios de los flujos de la opinión publica, identificar barrios con conflictos en funcion de valores sociodemograficos.
_Ciencias ambientales: Identificacion de modelos de funcionamientos de ecosistemas naturales y/o artificiales para mejorar su observacion, gestión y/o control.


sábado, 12 de mayo de 2012

Origen y propósito de la minería de datos

En general, la estadística es la primera ciencia que históricamente extrae información de los datos básicamente mediante metodologías procedentes de las matemáticas. Cuando se empezó a usar los ordenadores como apoyo para esta tarea surgió el concepto de Machine learning traducido como aprendizaje automático. Posteriormente con el incremento de tamaño y la estructuración de las datos es  cuando se empieza a hablar de minería de datos. La idea de data mining no es nueva. Ya desde los años sesenta los estadísticos manejaban términos como data fishing, data mining o data archaeology
con la idea de encontrar correlaciones.
 A principios de los años ochenta, Rakesh Agrawal, Gio Wiederhold, Robert Blum y Gregory Piatetsky-Shapiro, entre otros, empezaron a consolidar los términos de data mining, finales de los años ochenta
sólo existían un par de empresas dedicadas a esta tecnología; actualmente existen más de 100 empresas en el mundo que ofrecen alrededor de 300 soluciones.

Propósito de la minería de datos:


-Explorar los datos se encuentran en las profundidades de las bases de
datos, como los almacenes de datos, que algunas veces contienen información almacenada durante varios años.
-En algunos casos, los datos se consolidan en un almacén de datos y en
mercados de datos; en otros, se mantienen en servidores de Internet e intranet.

-Las herramientas de la minería de datos ayudan a extraer el mineral de
la información enterrado en archivos corporativos o en registros públicos,
archivados
-Clasificar un dato dentro de una de las clases categóricas predefinidas, preguntas tales como: ¿Cual es el riesgo de conceder un crédito a este cliente?
-Agrupar registros, observaciones o casos en clases de objetos similares.
-Generar reglas en referencia al descubrimiento de relaciones de asociación

sábado, 5 de mayo de 2012

Concepto de dato, información y conocimiento.

Antes de profundizar en el tema de la minería de datos es necesario que se tengan en conocimientos los siguientes conceptos:
1°Dato: Se denomina dato a los elemementos principales o que respaldan la información, estos datos estarán conformados por símbolos (letras. Números, dibujos, señas, gestos).
Los datos son símbolos que describen condiciones, hechos, situaciones o valores.
Se caracterizan por no contener ninguna información.
Un ejemplo:
Si el sujeto “X” dice 18 es un dato al cual si se le agrega "años de edad" entonces se convierte en información.

2.- conceptos de información:
Esta se constituye por un grupo de datos ya supervisados y ordenados, que sirven para construir un mensaje basado en cierto tema. La información permite resolver problemas y tomar decisiones, ya que su ocupa miento racional es la base del conocimiento (el cual será el siguiente tema)
Ejemplo de aplicación de los conceptos de dato e información:





Se logra  ver que en la columna clave dice 1 , 2 , 3 , 4 ,5 . estos son datos al igual que en la columna siguiente la que dice nombre y aparece una gran cantidad de ellos , por ultimo se muestra una ultima columna que dice edad  estos elementos separados son datos pero si se juntan estos se convierten en información.

Ejemplo:
Si se toma la clave 4 :
 n esa clave se encuentra pato y tiene 5 años <---- información.

Lo que se obtiene de conocer datos e informaciones es el conocimiento.

3.- concepto de conocimiento:
el conocimiento es un conjunto de información almacenada mediante la experiencia o el aprendizaje.
Si se ve de un punto más amplio el conocimiento es (son) múltiples datos relacionados que, al ser tomados por si solos, poseen un menor valor cuantitativo.

De manera más sencilla:
La base de el conocimiento es la información pero la base de la información son los datos
Bueno. Un ejemplo clarísimo es el siguiente!

Tú sabes que el dólar tiene un valor de: $483. <---- conocimiento-
Información seria: que un amigo del sujeto “X” vio las noticias y te hablo de el valor del dólar y por ultimo el dato seria 483.

Bueno si se quiere llevar esto a la informática diaria o ocupacional:
 Se busca en Google: la palabra álgebra.
Se obtienen 81.900.000 resultados los cuales poseerán información basada en el dato “Álgebra” (el dato seria en este caso la palabra álgebra).


Google un motor de búsqueda basado en datos busca estos  y  muestra un pequeño resumen en la parte inferior del link para que se pueda observar si la información de la pagina tiene relación con el dato que se busco.