InfoWorld
Definiendo la democratización de datos
La democratización de datos es la idea de que la información digital debe ser accesible y comprensible para el usuario final promedio como base para la toma de decisiones.
Esta idea se ha promovido como una ventaja competitiva en la economía global y un estado final deseable e igualitario donde todas las decisiones se basan en datos. ¿Pero ha sido esta la realidad?
En la práctica, este objetivo de acceso amplio se ha aislado a corporaciones y datos empresariales. La mayoría de los artículos sobre este tema pasan rápidamente de las declaraciones sobre accesibilidad a un enfoque más específico sobre las iniciativas organizacionales que hacen que la información esté disponible para los empleados.
Eso implica un ámbito restringido para la democratización de datos, específicamente no dentro del dominio público, sino limitado a las instituciones del sector privado. En su mayoría, la “democratización” de datos ha sido una palabra de moda para la “accesibilidad a los datos” sin participación pública o uso de datos en colaboración.
Hoy se mira una democratización de la información cada vez mayor a través del aumento de datos públicos fáciles de usar (como Data.gov); organizaciones que brindan contenido por medio de programas como OpenNASA, que hacen que todos los contenidos abiertos, códigos y API de la NASA, estén disponibles, o OpenData500, el seguimiento del uso de datos públicos; y científicos de datos ciudadanos.
Lea también: ¿Cómo pilotear automáticamente su centro de datos?
La evolución del acceso a los datos
Hace una décadas, los datos se escribían a mano en papel, se ingresaban en tarjetas perforadas y se leían en una computadora. Los programadores extrajeron esa información, convirtiéndola en informes de usuario.
A mediados de los años 80, muchas personas de negocios tenían acceso a computadoras personales, software de hoja de cálculo e informes comerciales para presupuestar y prever. Si bien, estos individuos y sus datos solían estar aislados de TI, creando silos distintos de los sistemas empresariales centrales, conocían los procesos comerciales y el contexto para esa información.
Las décadas siguientes trajeron nuevas alternativas de almacenamiento de información (como bases de datos, data warehouses y data marts). Estas incluyen aplicaciones para capturar datos entrantes y proporcionar procesos comerciales consistentes e interfaces especializadas tales como extraer, transformar y cargar (ETL), y elementos de inteligencia empresarial (BI) para conectar los datos entre las aplicaciones, las bases de datos y las hojas de cálculo que aún se usan activamente.
En ocasiones, surgieron estándares para ciertas categorías de herramientas (como SQL), pero el acceso a los datos era del dominio de los expertos técnicos, mientras que los usuarios comerciales aplicaban los datos para fines comerciales. Se mantuvieron silos aislados, divididos por distintas líneas de negocio, aplicaciones, almacenes de datos y la hoja de cálculo ubicua.
Hacer datos democráticos hoy
En los últimos 10 años, estos silos se han visto exacerbados por el aumento de volúmenes y variedad de datos, incluidos los sensores, las redes sociales, los registros de datos de llamadas y las tecnologías de integración de datos.
Las organizaciones quieren usar sus datos, junto con información de terceros, como cifras demográficas, geoespaciales o incluso meteorológicas, para impulsar el conocimiento del negocio.
Pero no hay suficientes expertos en almacenamiento de datos y herramientas que también entiendan el contexto empresarial a su alrededor para apoyar los objetivos de la compañía.
Habrá tres cambios en el panorama: equipos de ciencias de datos, científicos de datos ciudadanos y conocimiento público del uso de datos de las personas.
Los equipos de ciencia de datos incluyen empleados con y sin experiencia que integran el contexto empresarial y trabajan con instrumentos y números para producir análisis, modelos y algoritmos que anteriormente requerirían experiencia profesional en datos.
Muchas empresas están lanzando estos programas de capacitación; Sears es un ejemplo, enseñando a 400 miembros de sus tareas de segmentación de clientes de operaciones de BI. Al evitar la especialización, la compañía ahorró costos significativos de preparación de datos.
Los científicos de datos ciudadanos pueden (o no) tener títulos de ciencias, pero pueden usar información pública para generar conocimiento fuera de la estructura corporativa, o incluso para controlar sus propios datos.
Se han vuelto tan prolíficos, al punto que Gartner predice que en 2019 superarán a los profesionales en el análisis producido. Pero esta es un área donde el conocimiento del dominio y el entrenamiento estadístico son críticos; de lo contrario, es fácil producir correlaciones engañosas en una era de noticias falsas.
Finalmente, la demanda pública está cambiando el control de los datos personales del sector privado hacia el individuo. En Europa, GDPR brinda a los residentes más control sobre el uso de su información por parte de las empresas, con declaraciones explícitas que requieren la identificación de los datos almacenados por una organización, exigiendo correcciones a sus datos e incluso requiriendo que las compañías se “olviden” de ellos.
Es por eso que se ha entrado en un nuevo capítulo donde la tecnología ha alcanzado las aspiraciones originales detrás de la democratización de datos:
– No hay silos de datos. – Todos pueden convertirse en alfabetos de datos. – Todos pueden acceder a las herramientas necesarias para encontrar y trabajar con datos. – Todos están facultados para tomar decisiones basadas en datos, y la cultura más amplia (organizacional o nacional) abarca este empoderamiento. – Cada quien es responsables de los datos y las decisiones a su alrededor.
A medida que la información se vuelve verdaderamente democrática, existen preocupaciones correspondientes en torno a la gobernanza, la seguridad y la actualización de los datos.
Comments