UNIR Revista
Una compañía que conoce las etapas del ciclo de vida de los datos con los que opera puede definir de qué manera van a ser utilizados para obtener el máximo rendimiento.
En la era de la digitalización, los datos se han convertido en uno de los activos más importantes de las empresas. En base a ellos se toman decisiones de futuro, se diseñan estrategias y hojas de ruta, y resultan determinantes a la hora de marcar la diferencia con la competencia. Pero no se trata de un elemento aislado, conocer el ciclo de vida del dato permite establecer mayores garantías y más seguridad.
Entendemos por ciclo de vida de los datos el tiempo que transcurre desde la aparición del dato en la empresa hasta que este deja de tener utilidad. El Máster en Transformación digital de UNIR aborda los nuevos retos del mercado actual, desafíos que indiscutiblemente pasan por la gestión del ciclo de vida de la información.
La transformación digital se ha convertido en la mejor garantía para una organización que se plantee aumentar su competitividad. Adaptarse a los constantes cambios que la tecnología ha traído consigo implica el diseño de una estrategia en la que cobra especial relevancia la gestión de los datos.
Así, de la mano de la revolución digital aparece el big data o, lo que es lo mismo, el conjunto de datos, cada vez de mayor volumen y complejidad, que maneja a día de hoy cualquier empresa.
Los mecanismos tradicionales se han quedado obsoletos para gestionar toda esa información, ya no son suficientes, con lo que van apareciendo nuevas herramientas como las propias bases de datos para Big Data. Las fuentes de donde proceden esos datos tampoco son las convencionales ni lo es su velocidad de transformación. Así pues, para dar respuesta a las nuevas necesidades nace una nueva disciplina, el data science o ciencia de datos.
Titulaciones como el Máster en Big Data online de UNIR profundizan en esa materia, en el análisis del ciclo de vida de los datos, el cual comienza con la primera fase del big data.
Las 7 fases del ciclo de vida de los datos
Los datos evolucionan y se transforman en cada una de las etapas que componen su ciclo de vida. Si todas las fases de ese proceso en el que se generan los datos, se manejan y se almacenan —es decir, lo que conocemos como Gobierno del Dato—, en su conjunto aportan una visión genérica. Los mejores resultados se obtienen cuando se logra el máximo rendimiento en cada una de las fases, algo imprescindible a la hora de elaborar un plan de prevención y seguridad con el que proteger esos datos y minimizar riesgos.
Conocer las fases del procesamiento de datos permite una gestión más segura y eficiente. Atendiendo a diferentes criterios, el ciclo de vida del dato consta de siete fases:
- Obtención. El proceso comienza con la llegada del dato a la organización, normalmente a través de una fuente externa, pero puede ser la propia empresa o incluso sus clientes quienes generen esa información de manera consciente o no. Corresponde al ingeniero de datos establecer de dónde deben extraerse.
- Preparación. Los datos obtenidos deben ser identificados con el fin de determinar su utilidad. Así, pasan a formar parte de un registro diseñado por el data architect, el responsable de la administración y organización de los datos.
- Mantenimiento. Los datos son procesados buscando su optimización y transformando su formato para hacerlos más accesibles; pueden ser comprimidos o sometidos a un procedimiento de cifrado como medida de seguridad.
- Interpretación y uso. En una misma organización, un dato puede ser utilizado de muchas maneras, por lo que es muy importante establecer las medidas necesarias que eviten un mal uso. El chief data officer, además de determinar qué datos van a ser empleados, cómo y para qué fin, se encarga de la gestión de su acceso y protección.
- Intercambio. A partir de este momento, los usuarios autorizados pueden acceder a los datos. Del mismo modo, se regula de qué manera pueden intercambiarse o incluso ser compartidos externamente. Es labor del data owner controlar el uso que se les da a los datos y asegurar el cumplimiento de las directrices internas.
- Almacenamiento. Una vez utilizados y cumpliendo las exigencias de la normativa legal de protección de datos vigente, los datos han de ser archivados para un posible uso posterior.
- Destrucción o borrado. La eliminación de los datos es la última etapa de todo su ciclo de vida, el momento en el que se hacen desaparecer, o bien, porque ya no tienen valor para la organización, o porque se ha superado el tiempo establecido para su retención. Es tal la cantidad de información que cualquier empresa llega a acumular que se hace necesario establecer un sistema de destrucción seguro que garantice que, además de borrar el dato, se destruyen también todas las copias. Conservar todos esos datos resulta inviable, su almacenamiento supone un gasto excesivo e innecesario, y el valor de la mayoría de los datos se va reduciendo con el paso del tiempo.
La gestión del ciclo de vida de la información o data lifecycle management
La gestión del ciclo de vida del dato (DLM) comienza en el momento en el que se genera y termina con su destrucción. Esa gestión la integran todas aquellas acciones que permiten el manejo de las bases de datos de big data a partir del diseño de una estructura en la que prima la accesibilidad y la propia seguridad de los datos.
Objetivos
Los objetivos de la gestión del ciclo de vida de los datos son
- Disponibilidad. Los datos deben estar disponibles para permitir su uso siempre que sean necesarios.
- Seguridad y privacidad. Ha de elaborarse una estrategia en la que se contemplen tanto medidas de prevención como aquellas acciones a llevar a cabo en caso de que se produzca algún ataque.
- Integridad estructural. Los datos deben ser almacenados garantizando su integridad independientemente del uso que se dé de ellos.
Beneficios
En cuanto a los beneficios de implementar una política de gestión del ciclo de vida de la información:
- La optimización del espacio de almacenamiento reduce la inversión destinada a la CPU y el procesamiento de datos.
- Aumentan los índices de productividad de la empresa al recurrir a las bases de datos de Big Data.
- Permite destruir los datos almacenados una vez que han completado su ciclo de vida.
Con todo, más importante que el volumen total de datos que una compañía maneja es el uso que hace de estos y la seguridad que los rodea.