Juliana Jenny Kolb
Home > Data Science > Guia DAMA-DMBOK v2
Ciclo de Vida dos Dados
Semelhante a qualquer ativo, os dados possuem um ciclo de vida. Em seu curso, os dados podem ser extraídos, exportados, importados, migrados, validados, editados, atualizados, limpados, transformados, convertidos, integrados, segregados, agregados, referenciados, revisados, informados, analisados, resguardados, restaurados e recuperados antes de serem eventualmente eliminados.
Porém, os dados apenas possuem valor quando realmente utilizados. Todas as etapas do ciclo de vida dos dados apresentam custos e riscos associados e apenas a etapa de “utilização” gera valor ao negócio.
Quando bem geridos, o ciclo de vida dos dados inicia antes da aquisição dos mesmos, com: o planejamento da coleta dos dados, especificação dos dados, ativação da captura dos dados, entrega e controles.
A figura 1 ilustra o ciclo de vida dos dados.
Figura 1: Ciclo de Vida dos Dados
Fonte: DAMA International.
A Qualidade dos dados deve ser gerenciada ao longo do ciclo de vida dos dados: o Gerenciamento da qualidade dos dados é fundamental para o gerenciamento de dados. Dados de baixa qualidade representam custo e risco, e não valor. As organizações geralmente acham difícil gerenciar a qualidade dos dados porque os dados são criados como subprodutos ou processos operacionais e as organizações geralmente não definem padrões explícitos de qualidade.
A qualidade dos metadados deve ser gerenciada através do ciclo de vida dos dados: a qualidade dos metadados deve ser gerenciada da mesma maneira que a qualidade de outros dados.
A segurança dos dados deve ser gerenciada durante todo o ciclo de vida dos dados: o gerenciamento de dados também inclui garantir que os dados estejam seguros e que os riscos associados aos dados sejam atenuados. Os dados que requerem proteção devem ser protegidos durante todo o ciclo de vida, desde a criação até o descarte.
Os esforços de gerenciamento de dados devem se concentrar nos dados mais críticos: as organizações produzem muitos dados, grande parte dos quais nunca é realmente usada. Tentar gerenciar todos os dados não é possível. O gerenciamento do ciclo de vida requer foco nos dados mais críticos de uma organização e minimização de ROT de dados (dados redundantes, obsoletos, triviais) (Aiken, 2014).
Referência Bibliográfica
DAMA International, Guia para o corpo de conhecimento em gerenciamento de dados – DMBOK2, 2017.