• La minería de datos es un subcampo de las ciencias de la computación que combina muchas técnicas de estadística, ciencia de datos, teoría de bases de datos y aprendizaje automático.
  • Las aplicaciones de la minería de datos incluyen la elaboración de perfiles y segmentación de clientes, el análisis de la cesta de la compra y la detección de anomalías.

La minería de datos no tiene un único inventor. En cambio, ha evolucionado a lo largo del tiempo gracias a las contribuciones de varios investigadores y profesionales de distintos ámbitos. El desarrollo de la minería de datos implica una combinación de avances en estadística, aprendizaje automático, inteligencia artificial y ciencias de la computación. En este blog, puede ver algunas figuras clave e hitos en la historia de la minería de datos.

Los orígenes de la minería de datos

John Tukey (1915-2000): Estadístico estadounidense, las contribuciones de Tukey al análisis exploratorio de datos (EDA) fueron revolucionarias. Su desarrollo de métodos para resumir y visualizar datos proporcionó una base crucial para las técnicas posteriores de minería de datos. El trabajo de Tukey enfatizó la importancia de mirar más allá de los datos brutos para comprender su estructura y patrones subyacentes.

Primeras contribuciones a las técnicas estadísticas

A medida que la minería de datos evolucionó, se basó en gran medida en métodos estadísticos para analizar e interpretar datos. Jerome Friedman, Robert Tibshirani y Trevor Hastie: Este trío de estadísticos hizo avanzar significativamente el campo con su trabajo en técnicas de clasificación y regresión. Su desarrollo de algoritmos como los árboles de clasificación y los métodos de conjunto, incluido el boosting, se convirtieron en componentes fundamentales de la minería de datos moderna. Sus contribuciones proporcionaron los fundamentos teóricos de muchas técnicas utilizadas para extraer información de los datos.

Lea también: 5 riesgos esenciales de la minería de datos que necesita conocer

Lea también: Comprender la minería de datos y su importancia en los negocios

La llegada del aprendizaje automático

Arthur Samuel (1901-1990): A menudo se le atribuye haber acuñado el término "aprendizaje automático". El trabajo de Samuel en la década de 1950 sobre algoritmos que mejoran con la experiencia sentó las bases de muchos métodos de minería de datos. Su investigación en la creación de programas que pudieran aprender de los datos fue fundamental para dar forma a los algoritmos utilizados en la minería de datos actual.

Sistemas de bases de datos y reglas de asociación

La década de 1990 vio avances significativos en los sistemas de bases de datos y algoritmos, lo que impactó enormemente en las prácticas de minería de datos. Rakesh Agrawal, Tomasz Imielinski y Arun Swami: Estos investigadores desarrollaron el algoritmo Apriori, un método pionero para la minería de reglas de asociación en grandes bases de datos. Su trabajo permitió a empresas e investigadores descubrir relaciones entre variables en conjuntos de datos, como encontrar qué productos se compran a menudo juntos. Este desarrollo se convirtió en una piedra angular de la minería de datos, particularmente en el análisis de la cesta de la compra.

Minería de datos moderna: Formalización del campo

A medida que la minería de datos continuó evolucionando, se hicieron esfuerzos para formalizar y estandarizar las técnicas y metodologías utilizadas. Jiawei Han y Micheline Kamber: Su influyente libro de texto, "Data Mining: Concepts and Techniques" ("Minería de datos: Conceptos y técnicas"), se ha convertido en un referente en el campo. El trabajo de Han y Kamber ayudó a sintetizar y articular los métodos y aplicaciones de la minería de datos, haciéndolo accesible tanto a estudiantes como a profesionales. Sus contribuciones proporcionaron una visión general completa de las técnicas y mejores prácticas de minería de datos.