DATACARE: O MELHOR SOFTWARE DE
TRATAMENTO DE DADOS DO MERCADO BRASILEIRO

DataCare

Software desenvolvido pela Assesso e aprimorado no decorrer de mais de 20 anos de utilização por grandes empresas de vários segmentos, o DataCare® oferece uma solução completa para a gestão e a qualidade de dados de qualquer natureza e nos mais variados formatos, compreendendo as tarefas de ingestão, validação, transformação, deduplicação, consolidação e preparação dos dados para consumo.

Por suas características de desempenho e facilidade de integração, o DataCare® tem sido aplicado com sucesso em projetos contendo grandes volumes de dados, multiplicidade de fontes e padrões de informação. Dentre os cases de utilização, destacam-se: MDM (Pessoas, Materiais, Produtos e Serviços), Base Única e Visão 360º de Clientes, Data Lake, Big Data, CRM Operacional e Analítico, Data Warehouse, Business Intelligence e e-Commerce. São mais de 250 projetos realizados pela Assesso utilizando o DataCare®.

Especializado nos dados presentes no mercado brasileiro, o DataCare® é um software modular que pode ser configurado tanto para necessidades mais simples de tratamento e consistência de dados cadastrais estruturados, como para projetos mais complexos que envolvam dados semiestruturados ou não estruturados, tais como os originados em redes sociais, IoT, Web Analytics e Registros de Logs.

 

O DataCare® consolida os conceitos do CDOIQ – Chief Data Officer & Information Quality do MIT (Massachussetts Institute of Technology) para a Gestão da Informação e a Qualidade de Dados.

O DataCare® permite configurar processos que tratam diretamente de dados, sem a necessidade de interação com as aplicações da empresa. Por suas características de desempenho, é essencial para projetos que envolvem grande volume de dados, nos mais diversos tipos de repositório.

O DataCare® também disponibiliza suas funções para os sistemas da empresa que necessitam validar e tratar dados no momento da sua captação, resultando em melhor qualidade da informação, seja em ambiente batch ou online, in-house ou como serviço.

O DataCare® opera sobre uma robusta plataforma, denominada DC Platform, que proporciona as seguintes funcionalidades:

  • Tratamento de dados de variados formatos, para ingestão, preparação, consolidação e publicação para consumo
    • Dados estruturados, não estruturados e semiestruturados
    • Funções especiais para dados brasileiros, como nomes, endereços, telefones e e-mails
    • Georreferenciamento
    • Identificação e consolidação de duplicidades
    • Processos batch e online
    • Biblioteca de regras de negócio e métricas de qualidade dos dados para compartilhamento e governança
    • Mais de 100 funções disponíveis em uma Caixa de Ferramentas
  • Visão 360o e MDM: indivíduos, empresas, materiais e produtos
  • Acesso a serviços externos: consulta a bureaus e outros
  • Gerenciamento de métricas e metas de qualidade dos dados
  • Metadados técnicos, de negócio e operacionais e Glossário de Termos de Negócio
  • Workflow de processos
  • Controle estatístico de qualidade do processamento, com geração de alertas e pausas
  • Multiplataforma: ambientes Windows, Linux, Unix, Hadoop, Cloud (Azure, Google, AWS)
  • Interoperabilidade: mesmo processo ou serviço pode ser executado em qualquer ambiente
  • Alta performance para serviços online e grandes volumes de dados
  • Escalabilidade: elasticidade de processamento em clusters Hadoop ou Container
  • Alta disponibilidade
  • Conectividade
    • Arquivos texto, csv, XML, Json e outros
    • Bancos de dados relacionais e gerenciados (AWS, Google, Azure)
    • Bancos NoSQL e distribuídos: Apache Kudu, Cassandra, Hbase e outros
    • Cloud: AWS S3, Azure Data Lake Store, Google Cloud Storage
    • Web Services, Rest, Streaming, conectores Oracle e SAP
    • Integração com AI e ML

 

 

Caixa de Ferramentas

 

 

DCAudit

Diagnóstico da qualidade dos dados, ou data profiling e data assessment. Os relatórios do DCAudit possibilitam identificar vícios de preenchimento, violação de regras de cadastro e negócio, palavras suspeitas e necessidade de transformação e de consolidação de dados. Os relatórios gerados proporcionam uma visão completa do nível de qualidade dos dados recebidos das diversas origens.

DCAddresser

Análise, padronização e correção de endereços, telefones e e-mails. O DataCare® efetua o tratamento de endereços com abrangência internacional. Para endereços e telefones brasileiros, possui uma base de logradouros, DDD e prefixos telefônicos aderente às regras do DNE dos Correios e da Anatel, com atualização permanente. Para e-mails, são aplicadas regras internacionais de validação de sintaxe e corrigidos os erros mais frequentes de domínio.

DCGeo

Geolocalização de endereços com abrangência mundial, cálculo de distância e distribuição balanceada de clientes e prospects por pontos de contato. Para endereços brasileiros, atribui o setor censitário do IBGE para utilização de variáveis sociodemográficas em processos analíticos ou geomarketing. O DC Geo permite a configuração de áreas de abrangência por meio de polígonos isométricos, isócronos (linha reta ou traçado de rotas) ou criados sob medida pela empresa.

DCCleaner

Ferramentas que tratam da consistência, higienização, padronização, composição e transformação de dados cadastrais e transacionais. Permite configurar as situações em que deve ser rejeitado o conteúdo de um campo, uma linha de tabela ou um registro completo de dados de uma entidade. O DC Cleaner permite criar novas informações a partir das já existentes.

DCBusiness

Consistência de dados e cálculo de novos atributos com base em regras de negócio. Permite utilizar expressões lógicas simples ou complexas para a criação de novas informações a partir de outras já existentes, tais como scores, status, consolidações, melhor data e outros. O DC Business permite ainda o acesso a serviços externos ao DataCare®, da própria empresa ou de terceiros – como por exemplo bureaus de informações de crédito – para consulta ou obtenção de dados.

DCDedup

Identificação de duplicidade cadastral de entidades, como pessoas, domicílios, materiais, produtos e outros. Oferece total flexibilidade na composição de chaves de comparação, com uma grande biblioteca de funções de aferição de similaridade, baseadas em técnicas avançadas de match coding e lógica fuzzy. É possível definir diferentes níveis de rigor na comparação, de acordo com a necessidade exigida pelo contexto. Isto possibilita apontar as duplicidades confirmadas, com grau de assertividade alto, bem como os casos suspeitos, em que a similaridade existe, mas sem o grau de certeza requerido pelo processo.

DCFusion

Consolidação dos registros duplicados e geração do Golden Record utilizando critérios de prioridade, frequência, recência e qualidade do dado. Este módulo também implementa as camadas de integração, armazenamento e consumo de dados da versão DataCare MDM. Na consolidação dos dados, é possível configurar quais atributos de cada dado devem ser guardados, como por exemplo origem, data de atualização e métrica de qualidade.

DCFixer

Suporte ao processo de tratamento manual das inconsistências e suspeitas de duplicidades apontadas pelos demais módulos, permitindo maior produtividade na recuperação e melhoria da qualidade dos dados não conformes. Permite estabelecer o workflow de tratamento, com filas organizadas por tipo de problema, categoria de cliente, região geográfica, origem do dado, equipe de trabalho ou outras informações. Fornece estatística e trilha de auditoria do tratamento das filas.

DCMetrics

Monitoração e acompanhamento da evolução de métricas de qualidade de dados, com visão geral ou segmentada por sistema de origem, região geográfica ou outras variáveis. Permite definir metas para as métricas e acompanhar sua evolução ao longo do tempo.

DCPortal

Interface de consulta e atualização de informações da base de dados consolidada. Todos os serviços de consulta, validação, padronização, deduplicação e consolidação são disponibilizados para garantir a integridade e o nível de qualidade dos dados mestres. O DC Portal é parametrizado de acordo com o modelo de dados do repositório, que é definido sob medida para cada cliente, para atender às características particulares do seu negócio.