Data mining, o poder para comprender os datos

No ano 2017, máis de medio mundo se conectara a Internet. É dicir, ao redor de 3.800.000 persoas teñen xa acceso ao, posiblemente, invento máis importante do século XX (e un dos maiores da historia). Nun día envíanse 280 mil millóns de correos, nun minuto soben máis de 300 horas de vídeo a Youtube e nun segundo xéranse case 50.000 GB de tráfico.

Internet, segundo algunhas estimacións, pesaría máis dun zettabyte (10 elevado a 9 terabytes), unha auténtica loucura, algo abafador, e espera que aumente exponencialmente. Por iso, os datos, cun gran poder económico, convertéronse por dereito propio no ouro do século XXI. E, como todos saben, o ouro necesita da minería para ser extraído. Como os datos.

Data mining -minería de datos, en español-, son “aqueles procedementos algorítmicos para avaliar datos aplicados a bloques cun tamaño e complexidade determinados”. O seu obxectivo final é o de extraer a información de calquera conxunto de datos mediante algún dos programas informáticos que nos mostran aquí e, como por arte de maxia, transformalos para a súa mellor comprensión posterior.

Así mesmo, a pesar de utilizar a estatística para algunhas das súas funcións, non é unha ferramenta analítica. É máis: nútrese da intelixencia artificial, o machine learning ou dos sistemas de bases de datos para os seus procesos. Por outro lado, nunca hai que confundir o Big Data co data mining. Mentres que o primeiro representa o almacenamento de grandes cantidades de datos -a tecnoloxía que os capta, os xestiona e os procesa-, o segundo encárgase de identificalos e extraelos.

O caso é, ¿para que? Pois, por exemplo, o data mining pode atopar aqueles clientes bancarios que sempre contesten aos seus correos, en vez de que a entidade bancaria teña que buscar, mandar e esperar de xeito aleatorio e ininterrompido; deste xeito, optimízase o tempo. Do mesmo modo, esta tecnoloxía tamén se pode utilizar no mundo do comercio: grazas ao data mining un supermercado pode incrementar as súas vendas de forma exponencial detectando que clase de clientes visitan as súas instalacións a certa hora e a certo día. Loxicamente, pola cantidade de datos que manexan, poderíase colocar a tenda de modo que os produtos que máis lle interesen á maioría de clientes, que van nese mesmo momento, estean a man.

Exemplos españois

O data mining, unha tecnoloxía que pode parecer afastada, tamén se atopa dentro das nosas fronteiras. E con aplicacións interesantes. GMV, compañía española, ten unha plataforma que contribúe á mellora da vixilancia epidemiolóxica, a asistencia clínica, a xestión e a investigación médica. Explotando a inxente cantidade de información do que dispón calquera sistema de saúde pódese extraer información e obter resultados dos pacientes dun xeito óptimo. De feito, por medio de técnicas de data mining establécense correlacións de causa e efecto en diferentes enfermidades, axudando a predicir e detectar posibles contaxios.

Ademais, no noso país atópase tamén a compañía Innova-tsn, que o ano pasado participou na KDD 2017, a “copa mundial” de data mining conseguindo o primeiro posto de EMEA e o sétimo do mundo.

Isto só quere dicir que, mentres arredor do mundo miles e millóns de persoas clican ao mesmo tempo en calquera páxina de rexistro dunha rede social, poñendo os seus datos ao servizo do Big Data, os mineiros, os que extraen ese “ouro”, xa sexa españois ou non, clasificarán e analizarán esa información para dotar á economía actual dun novo sentido.

Predicións, regresións, correlacións… Todas as tarefas posibles do data mining van dirixidas a iso: a ordenar (para ben ou para mal) ese pouco máis de 1 zettabyte no que se atopan todos datos de humanidade. E crecendo.

(Fonte: Innovaspain)