La Ciencia de los Datos

Autora: Beatriz Guzmán Asenjo

La Ciencia de los Datos (Data Science o Big Data) se ha convertido en un concepto omnipresente en los últimos años. Se define como el conjunto de herramientas informáticas (tanto hardware como software) destinadas a la manipulación, gestión y análisis de grandes volúmenes de datos que no pueden ser gestionados por las herramientas informáticas tradicionales. Se trata pues de una de las disciplinas más innovadoras y atractivas de los desarrollos científicos recientes.

La ciencia de los datos (1)Los avances tecnológicos han revolucionado la generación de datos. A diario se generan datos mediante redes sociales, teléfonos móviles, dispositivos inteligentes, contadores, motores aeronáuticos, satélites, equipos atmosféricos, cajas registradoras, sensores, … Cualquier clase de dispositivo capaz de procesar y clasificar información es una fuente generadora de datos a gran escala. La capacidad para ordenar y aprovechar estas cantidades crecientes de datos está transformando por completo nuestra capacidad para comprender el mundo.

Los avances en el análisis de grandes volúmenes de datos nos permiten, por ejemplo, decodificar el ADN humano en cuestión de minutos, predecir con precisión el comportamiento humano, establecer claramente los esfuerzos de marketing y prevenir enfermedades. La gestión de toda la información generada (de la cual hoy en día el 90% no se analiza y el 60% se pierde milisegundos después de haber sido generada) es muy interesante para las grandes empresas y ha destacado su potencial de desarrollo en sectores como la salud, las finanzas, las redes sociales, las aplicaciones y juegos para móviles y las actuaciones relacionadas con el comportamiento de los usuarios.

En Big Data se habla de las 4 Vs como las señas de identidad de este fenómeno:

  • Volumen – la enorme cantidad de datos generados (3 trillones de datos cada 24h).
  • Velocidad – la velocidad se refiere al ritmo en que los datos de entrada fluyen desde las diversas fuentes como procesos de negocio, máquinas y sensores, redes sociales, dispositivos móviles, etc. El flujo de datos es masivo y continuo. La detección de fraude en el uso de tarjetas de crédito es un buen ejemplo pues millones de transacciones se comprueban casi en tiempo real para detectar patrones inusuales.
  • Variedad – la gran variedad de información digital (estructurada y no estructurada) proveniente de diferentes fuentes y en diferentes formatos (video, audio o texto).
  • Veracidad – la veracidad se refiere al sesgo, el ruido y la alteración de datos. Big Data ha de ser capaz de tratar y analizar inteligentemente este vasto y desordenado volumen de datos con la finalidad de obtener una información verídica y útil que nos permita mejorar nuestra toma de decisiones.

Big Data está, hoy en día, presente en muy diversos campos de la actividad humana. Algunos ejemplos reales son:

  • Policía – Utiliza la combinación de datos de medios de comunicación, cámaras de seguridad, llamadas telefónicas y mensajes de texto para localizar a los delincuentes o predecir el próximo ataque terrorista.
  • Facebook – está usando herramientas de reconocimiento facial para encontrar posibles amigos.
  • Política – se realizan análisis de medios sociales para determinar dónde hacer campaña para ganar las elecciones.
  • Fútbol – el análisis de vídeos y datos de sensores se utilizan para mejorar el rendimiento de los jugadores y equipos.
  • Artistas – utilizan los datos de nuestras preferencias musicales y secuencias para determinar la lista de reproducción para sus conciertos en directo.
  • Coche de auto-conducción de Google – analiza una cantidad gigantesca de datos en tiempo real, provenientes de sensores y cámaras, para permanecer en carretera con seguridad.
  • Tráfico – La geolocalización de nuestro teléfono y el registro de la velocidad con la que se está moviendo se utiliza para proporcionar información sobre el estado del tráfico en tiempo real.
  • Supermercados – combinan los datos de tarjetas de fidelización con información de medios sociales para detectar y aprovechar el cambio de los patrones de compra. Por ejemplo, es fácil predecir que una mujer está embarazada, simplemente analizando los cambios en sus patrones de compra. Esto permite dirigirse a las mujeres embarazadas con promociones de productos relacionados con el bebé.
  • Y estos ejemplos son sólo el comienzo.

Big Data está cambiando la forma en que las personas interactúan dentro de las organizaciones. Es la creación de una cultura en la que los líderes de negocios y de la Tecnología de la Información deben unir sus fuerzas para procesar eficientemente grandes cantidades de datos. Dicho procesamiento eficiente de grandes volúmenes de datos puede permitir tomar mejores decisiones, adquirir compromisos más profundos con los clientes, optimizar las operaciones evitando las amenazas y el fraude, y la capitalización de nuevas fuentes de ingresos.

 


Beatriz Guzmán Asenjo es Doctora en Ciencias Biológicas por la UCM, Licenciada en Gestión Medioambiental, especialista en Gestión Ambiental de Producto y Monitora de Ensayos Clínicos. Experta en el diseño y gestión de proyectos con una dilatada experiencia en el área de investigación Medioambiental. Y en la actualidad introduciéndose en el apasionante mundo del Big Data.

<Nota del Editor (Juan Jesús Ros Guzmán): Agradecimientos por la contribución en el Blog de Sistemas de Información>


Bibliografía :

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s