Data mining o minería de datos
Conjunto de técnicas y tecnologías que permiten explorar grandes bases de datos, con el objetivo de encontrar patrones repetitivos que expliquen el comportamiento de estos .
Ventajas y desventajas el uso en las empresas
Ventajas
Permite descubrir información inesperada debido al funcionamiento con algoritmos.
Capaz de analizar bases de datos con una enorme cantidad.
La empresa puede mejorar la atención al cliente a partir de la información obtenida
Da a las empresas la posibilidad de ofrecer a los clientes los productos o servicios que necesitan.
Ahorra costes a la empresa y abre nuevas oportunidades de negocio.
Los resultados son muy fáciles de interpretar y no es necesario tener conocimientos en ingeniería informática.
Desventajas
Dependiendo del tipo de datos que se quieran recopilar, puede llevar mucho trabajo
La inversión inicial para obtener las tecnologías necesarias para la recopilación de datos puede tener un coste elevado.
Beneficios de la minería de datos
Se puede aplicar a diferentes escenarios empresariales.
Contribuye a gestionar y organizar la información.
Ayuda a prevenir situaciones adversas futuras.
Facilita el conocimiento.
Brinda la posibilidad de desarrollar estrategias.
Aplicación de la minera de datos en las siguientes areas
Comercio y banca
Segmentación de clientes, previsión de ventas
Medicina y Farmacia
Diagnóstico de enfermedades y la efectividad de los tratamientos.
Recuperación de información no numérica
Minería de texto, minería web, búsqueda
Geología, minería, agricultura y pesca
Identificación de áreas de uso para distintos cultivos o de pesca o de explotación minera
Ciencias Ambientales
Identificación de modelos de funcionamiento de ecosistemas naturales y/o artificiales
Ciencias Sociales
Estudio de los flujos de la opinión pública
Etapas del análisis de data mining
Determinación de los objetivos
El cliente determina qué objetivos quiere conseguir gracias al uso
Procesamiento de los datos
Selección, reducción y transformación de la base
Determinación del modelo
Se hace un análisis estadístico de los datos y después visualización gráfica de los mismos.
Análisis de los resultados
Se verifica si los resultados obtenidos son coherentes.