Política de Dados
Saiba como a Adone AI coleta, processa, armazena e protege os dados utilizados nos projetos de Inteligência Artificial e Machine Learning, em conformidade com a LGPD e as melhores práticas de engenharia de dados.
1. Introdução
Esta Política de Dados descreve como a Adone AI coleta, processa, armazena e protege os dados utilizados na execução dos seus projetos de Inteligência Artificial e Machine Learning. Esta política complementa nossa Política de Privacidade e é aplicável especificamente ao uso de dados no contexto dos serviços contratados.
2. Tipos de Dados Tratados
A Adone AI trabalha com diferentes categorias de dados dependendo do projeto:
- Dados estruturados: planilhas, bancos de dados relacionais, séries temporais, dados transacionais e registros operacionais fornecidos pelo Cliente.
- Dados não estruturados: textos, documentos, imagens, áudios, vídeos e outros arquivos utilizados em projetos de NLP e Visão Computacional.
- Dados de comportamento: logs de sistemas, registros de uso, eventos de aplicações e dados de rastreamento de processos.
- Dados de treinamento: conjuntos de dados rotulados ou brutos utilizados para treinar, validar e testar modelos de Machine Learning.
- Dados de produção: entradas e saídas dos modelos em ambiente produtivo, utilizados para monitoramento e retraining.
- Metadados: informações sobre a estrutura, origem e características dos datasets (schema, tamanho, distribuição de classes, etc.).
3. Princípios do Tratamento de Dados
O tratamento de dados na Adone AI segue os princípios estabelecidos pela LGPD e pelas melhores práticas de engenharia de dados:
- Finalidade: os dados são coletados e utilizados exclusivamente para as finalidades definidas em cada projeto.
- Adequação: utilizamos apenas os dados necessários para o objetivo proposto, evitando coleta excessiva.
- Necessidade: cada dataset é avaliado para garantir que apenas os campos estritamente necessários sejam processados.
- Qualidade: adotamos processos de validação, limpeza e documentação para garantir a qualidade dos dados.
- Transparência: documentamos o fluxo completo de dados de cada projeto, desde a origem até os entregáveis.
- Segurança: aplicamos controles técnicos e administrativos para proteger os dados durante todo o ciclo de vida.
- Não discriminação: avaliamos e mitigamos vieses nos datasets para garantir que os modelos não reproduzam discriminações.
4. Ciclo de Vida dos Dados
Os dados passam pelas seguintes etapas em projetos da Adone AI:
- Ingestão: recebimento dos dados do Cliente via canais seguros (SFTP, API criptografada, storage privado na nuvem).
- Armazenamento intermediário: os dados são armazenados em ambientes isolados por projeto, com acesso restrito à equipe responsável.
- Exploração e análise: fase de EDA (Exploratory Data Analysis) para entender a estrutura, distribuição e qualidade dos dados.
- Pré-processamento: limpeza, normalização, feature engineering e transformações necessárias para o treinamento dos modelos.
- Treinamento e validação: uso dos dados para treinar, ajustar e avaliar os modelos de Machine Learning.
- Produção: monitoramento dos dados de entrada e saída do modelo em ambiente produtivo para detecção de drift e degradação.
- Descarte seguro: ao término do projeto, os dados são excluídos dos ambientes da Adone AI conforme acordado contratualmente.
5. Armazenamento e Infraestrutura
Os dados dos projetos são armazenados em infraestrutura de nuvem de alta segurança:
- Ambientes de nuvem certificados (ISO 27001, SOC 2) com criptografia em repouso (AES-256) e em trânsito (TLS 1.3).
- Buckets e bancos de dados isolados por cliente e por projeto, sem compartilhamento de infraestrutura entre clientes.
- Controle de acesso baseado em função (RBAC): apenas membros da equipe do projeto têm acesso aos dados.
- Logs de auditoria de todos os acessos aos dados, com retenção de 1 ano para fins de rastreabilidade.
- Backups automáticos com frequência configurável e testados regularmente para garantir a recuperação.
- Opção de processamento de dados sensíveis em ambiente on-premise do Cliente, quando necessário para conformidade.
6. Qualidade e Governança de Dados
A Adone AI adota práticas robustas de governança para garantir a confiabilidade dos dados utilizados nos modelos:
- Data profiling: análise estatística automatizada dos datasets para identificar inconsistências, valores ausentes e outliers.
- Versionamento de dados: controle de versão de datasets e features para reprodutibilidade dos experimentos.
- Data lineage: rastreabilidade completa da origem e transformações aplicadas aos dados em cada etapa.
- Monitoramento de drift: detecção de mudanças na distribuição dos dados em produção para manter a precisão dos modelos.
- Documentação de schema: registro formal da estrutura, tipos e restrições de cada dataset.
- Validação contínua: pipelines automáticos de validação de qualidade executados a cada atualização de dados.
7. Anonimização e Pseudonimização
Quando os datasets contêm dados pessoais, aplicamos técnicas para reduzir o risco de identificação dos titulares:
- Anonimização: remoção ou transformação irreversível de identificadores diretos (nome, CPF, e-mail, telefone) quando não são necessários ao modelo.
- Pseudonimização: substituição de identificadores por tokens ou hashes reversíveis, quando a rastreabilidade interna é necessária.
- Generalização: substituição de valores precisos por faixas ou categorias (ex.: idade exata → faixa etária).
- Supressão: remoção de registros ou campos que não contribuem para o objetivo do modelo e representam risco desnecessário.
- Síntese de dados: geração de dados sintéticos estatisticamente equivalentes para fases de desenvolvimento e testes.
- k-anonimato e técnicas avançadas: aplicados em projetos que exigem alto nível de privacidade, como saúde e finanças.
8. Compartilhamento e Transferência de Dados
Os dados dos Clientes não são compartilhados com terceiros, exceto nas seguintes situações:
- Provedores de infraestrutura de nuvem (subprocessadores): AWS, Google Cloud ou Azure, conforme acordado com o Cliente, todos com cláusulas contratuais de proteção de dados.
- Ferramentas de MLOps e experimentos (ex.: MLflow, Weights & Biases): em ambientes isolados, com dados pseudonimizados quando possível.
- Equipes internas da Adone AI: acesso restrito por projeto, com segregação de funções.
- Determinação legal ou judicial: quando exigido por autoridade competente, com comunicação ao Cliente sempre que legalmente possível.
Dados de Clientes nunca são utilizados para treinar modelos de outros projetos ou produtos da Adone AI sem autorização expressa.
9. Retenção e Descarte
O período de retenção dos dados é definido contratualmente com cada Cliente. Por padrão:
- Dados de projetos encerrados: excluídos em até 30 dias após a entrega final, salvo acordo contratual diferente.
- Modelos treinados: retidos pelo prazo acordado contratualmente para suporte e manutenção.
- Logs técnicos e de auditoria: retidos por 12 meses para fins de segurança e rastreabilidade.
- Dados de produção monitorados: retidos pelo período necessário para retraining e melhoria contínua do modelo.
- Backups: excluídos em até 60 dias após o descarte dos dados originais.
O descarte é realizado de forma segura, com sobrescrita de dados em disco ou destruição certificada, conforme a sensibilidade dos dados.
10. Segurança Técnica
A Adone AI implementa múltiplas camadas de segurança para proteger os dados dos projetos:
- Criptografia end-to-end: todos os dados em trânsito utilizam TLS 1.3; dados em repouso são criptografados com AES-256.
- Autenticação multifator (MFA): obrigatória para todos os membros da equipe que acessam ambientes com dados de clientes.
- Segmentação de rede: ambientes de dados isolados por VPC (Virtual Private Cloud) com regras de firewall restritivas.
- Escaneamento de vulnerabilidades: análises automatizadas periódicas dos sistemas e dependências utilizadas.
- Pen testing: testes de penetração anuais realizados por empresa especializada terceirizada.
- Resposta a incidentes: plano formalizado de resposta a incidentes de segurança, com notificação em até 72h conforme LGPD.
11. Dados em Modelos de IA
O uso de dados no contexto de Machine Learning requer atenção especial a aspectos que vão além do tratamento convencional:
- Memorização de dados de treinamento: adotamos técnicas de regularização e avaliação para reduzir o risco de modelos memorizarem dados individuais.
- Inversão de modelo: avaliamos vulnerabilidades de inversão antes da entrega de modelos que podem ser acessados externamente.
- Inferência de associação: testamos os modelos contra ataques de inferência de associação em projetos com dados sensíveis.
- Fairness e viés: avaliamos métricas de equidade do modelo por grupos demográficos relevantes, mitigando vieses identificados.
- Explicabilidade: documentamos e disponibilizamos técnicas de interpretabilidade (SHAP, LIME) para modelos em produção crítica.
- Privacy by Design: a proteção de dados é incorporada desde o início do ciclo de desenvolvimento de cada modelo.
12. Responsabilidades do Cliente
O Cliente é responsável por:
- Garantir que possui autorização legal para fornecer os dados à Adone AI para as finalidades do projeto.
- Obter o consentimento necessário dos titulares de dados pessoais presentes nos datasets, quando aplicável.
- Informar a Adone AI sobre eventuais restrições legais, regulatórias ou setoriais aplicáveis aos dados.
- Notificar a Adone AI imediatamente em caso de identificação de dados sensíveis não declarados previamente.
- Manter a segurança dos canais de transferência de dados de sua responsabilidade.
- Garantir a precisão e completude dos dados fornecidos para treinamento dos modelos.
13. Gestão de Incidentes
Em caso de incidente de segurança envolvendo dados de projetos, a Adone AI adota o seguinte protocolo:
- Contenção imediata: isolamento dos sistemas afetados nas primeiras horas após a detecção.
- Avaliação de impacto: identificação dos dados afetados, extensão do incidente e titulares potencialmente impactados.
- Notificação ao Cliente: comunicação em até 24 horas após a confirmação do incidente, com detalhes disponíveis.
- Notificação à ANPD: realizada em até 72 horas quando o incidente envolver dados pessoais e representar risco aos titulares.
- Remediação: correção das vulnerabilidades exploradas e reforço dos controles de segurança.
- Relatório pós-incidente: documento detalhado com causa raiz, impacto, ações tomadas e melhorias implementadas.
14. Atualizações desta Política
Esta Política de Dados é revisada periodicamente para refletir mudanças técnicas, regulatórias ou nas nossas práticas de tratamento de dados. Alterações significativas serão comunicadas aos Clientes ativos com antecedência mínima de 15 dias. A versão vigente estará sempre disponível nesta página.
15. Contato
Para dúvidas ou solicitações relacionadas ao tratamento de dados em projetos:
- E-mail do DPO: privacidade@adoneintelligence.com.br
- E-mail técnico: dados@adoneintelligence.com.br
- E-mail geral: contato@adoneintelligence.com.br
Para exercer seus direitos como titular de dados pessoais, consulte nossa Política de Privacidade.
Dúvidas sobre o tratamento de dados nos projetos? Fale com nossa equipe em dados@adoneintelligence.com.br