¿Quién puede usar la ciencia de datos?

70

Los términos Ciencia de Datos e Ingeniería de Datos a menudo se utilizan incorrectamente y se confunden, así que comencemos por aclarar que estos campos son dominios distintos.

  • La Ciencia de Datos es la ciencia computacional de la extracción de información significativa de los datos en bruto y luego la comunicación efectiva de éstos para generar valor.
  • La Ingeniería de Datos, por otro lado, es un dominio de ingeniería dedicado a crear y mantener sistemas que soportan los cuellos de botella en el procesamiento de datos y los problemas de manejo de datos para aplicaciones que consumen, procesan y almacenan grandes volúmenes, variedades y velocidades de datos.

Tanto en la ciencia de datos como en la ingeniería de datos, comúnmente se trabaja con estas tres variedades de datos:

  • Estructurado: los datos se almacenan, procesan y manipulan en un sistema tradicional de administración de bases de datos relacionales (RDBMS).
  • No estructurado: los datos que se generan comúnmente a partir de actividades humanas y que no encajan en un formato de base de datos estructurada.
  • Semiestructurado: los datos no encajan en un sistema de base de datos estructurado, pero aún así están estructurados por etiquetas (tags) que son útiles para crear una forma de orden y jerarquía en los datos.

Mucha gente cree que solo las grandes organizaciones que cuentan con financiamiento masivo están implementando metodologías de ciencia de datos para optimizar y mejorar su negocio, pero ese no es el caso. La proliferación de datos ha creado una demanda de ideas, y esta demanda está integrada en muchos aspectos de nuestra cultura moderna, desde el pasajero de Uber que espera que su conductor lo recoja exactamente en el momento y la ubicación predicha por la aplicación Uber, hasta el comprador en línea que espera que la plataforma de Amazon recomiende las mejores alternativas de productos para que pueda comparar productos similares antes de realizar una compra. Los datos y la necesidad de información basada en datos son omnipresentes. Debido a que las organizaciones de todos los tamaños están comenzando a reconocer que están inmersas en un entorno competitivo, basado en datos, hundirse o nadar, el conocimiento de los datos surge como una función esencial y necesaria en casi todas las líneas de negocios.

¿Qué significa esto para la persona común? En primer lugar, significa que se espera cada vez más que los empleados se respalden en un conjunto avanzado de requerimientos tecnológicos. ¿Por qué? Bueno, eso se debe a que casi todas las industrias dependen cada vez más de las tecnologías de datos y de la información que generan. En consecuencia, muchas personas tienen la necesidad continua de incrementar sus habilidades tecnológicas, o bien se enfrentan a la posibilidad real de ser reemplazadas por un empleado más experto en tecnología.

La buena noticia es que la mejora de las habilidades tecnológicas no suele requerir que las personas vuelvan a la universidad, o que obtengan un título universitario en estadística, ciencias de la computación o ciencias de la información. La mala noticia es que, incluso con capacitación profesional o auto-aprendizaje, siempre se requiere trabajo adicional para mantener la relevancia en la industria y la tecnología. En este sentido, la revolución de los datos no es tan diferente de cualquier otro cambio que haya afectado a la industria en el pasado. El hecho es que, para mantenerse relevante, necesita tomarse el tiempo y el esfuerzo para adquirir solo las habilidades que lo mantienen actualizado. Cuando estás aprendiendo a hacer ciencia de datos, puedes tomar algunos cursos, aprender a usar recursos en línea, leer libros y asistir a eventos en los que puedes aprender lo que necesitas saber para estar al tanto del juego.

¿Quién puede usar la ciencia de datos? Tú puedes. Tu organización puede. Su empleador puede. Cualquier persona que tenga un poco de comprensión y capacitación puede comenzar a usar información de datos para mejorar sus vidas, sus carreras y el bienestar de sus negocios. La ciencia de datos representa un cambio en la forma en que te acercas al mundo. Cuando exigían resultados, las personas solían hacer sus mejores conjeturas, actuar y luego esperar el resultado deseado. Sin embargo, con información de datos, las personas ahora tienen acceso a la visión predictiva de que realmente necesitan impulsar el cambio y lograr los resultados que necesitan. Puede usar información de datos para lograr cambios en las siguientes áreas:

  • Sistemas empresariales: optimice los rendimientos de la inversión (esos ROIs cruciales) para cualquier actividad medible.
  • Desarrollo de la estrategia técnica de marketing: utilice la información de los datos y el análisis predictivo para identificar las estrategias de marketing que funcionan, eliminar los esfuerzos de bajo rendimiento y probar nuevas estrategias de marketing.
  • Mantenga a las comunidades seguras: las aplicaciones de vigilancia policial predictiva ayudan al personal encargado de hacer cumplir la ley a predecir y prevenir actividades delictivas locales.
  • Ayude a que el mundo sea un lugar mejor para los menos afortunados: los científicos de datos en países en desarrollo están usando datos sociales, datos móviles y datos de sitios web para generar análisis en tiempo real que mejoran la efectividad de la respuesta humanitaria ante desastres, epidemias, problemas de alimentos, y más.