Fornecer dados para a IA de forma confiável e segura é essencial nos fluxos de hoje. Embora muitas empresas estejam focadas na qualidade dos dados e nas questões de soberania, há pouca discussão sobre a infraestrutura e a gestão necessárias — o “como” — para entregar esses dados de qualidade aos modelos de IA em escala.
É aí que empresas como a Axway entram.
Usar a analogia da água para explicar dados ajuda a ilustrar a situação de forma simples, então vamos mergulhar no chamado “inteligência líquida”.
Assim como a água nos dá vida, os dados dão vida à IA
A água, assim como os dados, está em toda parte. Ela flui de um lugar para outro. É medida, monitorada e tratada para melhorar sua qualidade.
Não faz muito tempo, os sistemas possuíam arquiteturas de dados bem estruturadas. Se você precisava ativar um aplicativo web, bastava acionar um LAMP. Hoje, os dados vêm de muito mais fontes, sendo retransmitidos, armazenados em cache, enriquecidos e filtrados ao longo do caminho.
De dispositivos IoT aos smartphones, os dados que precisamos analisar não se concentram mais em um único servidor, mas se espalham em inúmeras poças, reservatórios, lagos e oceanos que compõem os ambientes corporativos de dados.
Aos 20 anos, um ser humano já ouviu cerca de 150 milhões de palavras. O Chat GPT-4, por outro lado, “nasceu” tendo processado 5 trilhões de palavras.
A IA precisa de dados para sobreviver — e não apenas “bebe”, ela “engole” grandes volumes. O detalhe é que a IA generativa não espera os dados serem organizados em um único repositório bem delimitado. É preciso entender como levar os dados de onde estão para onde precisam estar, de forma segura, escalável e eficiente.
Assim como no abastecimento de água de uma cidade, proteger a integridade e a segurança dos dados não é apenas sobre onde eles ficam armazenados — é sobre como eles circulam. Um dos desafios atuais é gerenciar esse fluxo: consolidar certos dados, dividir ou rotear outros para múltiplos “pools” de dados, muitas vezes federados.
Para fazer isso com eficácia, é necessário saber exatamente onde seus dados estão, para onde precisam ir e como movê-los com segurança e governança adequadas.
Sem dados confiáveis e bem governados em movimento, sua IA não funciona.
De lagos centralizados à piscinas federadas
No passado, as organizações buscavam reunir todos os dados em um único repositório massivo — o famoso data lake. O tamanho e o valor desse repositório criavam um “campo gravitacional” que atraía aplicações, serviços e ferramentas de análise, como lojas e restaurantes que se instalam em torno de um parque temático. Esse fenômeno é conhecido como gravidade dos dados — quanto mais dados em um lugar, mais elementos se aproximam dele.
Hoje, esse modelo centralizado está se desfazendo. Leis de governança, regras de privacidade e preocupações com soberania de dados muitas vezes impedem que eles sejam transferidos ou agrupados em um mesmo local. Em vez de um único lago, agora gerenciamos diversas “piscinas” distribuídas, cada uma com suas próprias regras. O objetivo não é mais mover tudo para um só lugar, mas criar sistemas que permitam à inteligência fluir entre eles, mantendo os dados onde eles precisam — ou são obrigados — a permanecer.
Questões energéticas
Assim como a água não circula pelas tubulações de uma cidade apenas pela gravidade, os dados também precisam de energia para se mover.
Há preocupações legítimas sobre o custo ambiental do treinamento de IA e de seu uso crescente. Mas é importante observar que os custos de inferência — ou seja, a execução de respostas de IA — caíram 99,7% nos últimos dois anos, impulsionados por modelos otimizados e hardware mais eficiente.
A energia continuará sendo uma preocupação, mas uma que pode se tornar cada vez mais administrável.
Soberania de dados: está com o traje de banho certo?
Assim como diferentes países têm regras diferentes para suas piscinas públicas, os dados também estão sujeitos a legislações específicas. Soberania de dados é o conceito de que eles são regidos pelas leis do local onde estão armazenados.
Seguindo a metáfora da piscina: um dado “vestindo” um traje francês (seguindo as regras da França) pode ser barrado ao tentar entrar em uma “piscina” brasileira, sendo obrigado a “trocar de roupa” para se adequar às normas locais.
Privacidade e segurança nacional deixaram de ser preocupações abstratas — elas definem onde e como os dados podem ser armazenados, processados e usados. A soberania de dados faz parte de um conceito maior, que inclui soberania de serviços e soberania de IA.
A Europa, por exemplo, está investindo €200 bilhões em IA, incluindo €20 bilhões destinados a “gigafábricas” de IA e hubs de infraestrutura de alta capacidade.
Soberania de IA significa controlar todo o pipeline: possuir os dados, decidir como os modelos são treinados e executar o processamento em ambientes governados. Não é só compliance — é autonomia e vantagem estratégica.
Caso real: governança segura de dados para IA
Um grande banco multinacional utilizava Axway MFT para processar trilhões de dólares em transações, distribuídas em milhões de arquivos agregados por dia. Era necessário enviar dados recebidos de fontes externas para um centro de processamento e, depois, para diferentes regiões, cada uma com seus próprios sistemas de IA.
Nem sempre é possível mover os dados; às vezes, só é permitido com restrições. Quando não se pode centralizar os dados por questões de soberania, segurança ou compliance, é preciso repensar a arquitetura.
Em alguns casos, é viável reunir temporariamente os dados; em outros, distribuí-los geograficamente. A complexidade aumenta — e aí entram as abordagens federadas, como o federated learning (treinamento local com compartilhamento de conhecimento) e estratégias de armazenamento distribuído que respeitam as regras locais.
Com tecnologias como o MCP (Model Context Protocol), agentes de IA podem acessar dados e APIs sem que os dados precisem ser movidos. No caso do banco, a estratégia escolhida foi replicar os dados de uma única piscina para diferentes data lakes, roteando cada informação para o destino correto.
Cinco regras para preparar uma infraestrutura de IA soberana
- Localize – saiba onde os dados estão.
- Mapeie – entenda as regras aplicáveis a cada conjunto de dados.
- Defina – crie fluxos híbridos que movam ou isolem dados conforme necessário.
- Federe – quando não puder mover, treine localmente ou exponha via MCP.
- Observe – tenha visibilidade e controle de onde os dados estão e quem tem acesso.
Inovar sem perder o controle
Foi pensando nesse ecossistema que a Axway criou o Amplify AI Gateway, projetado para oferecer integração de IA segura, em conformidade e flexível.
Combinando soluções como Amplify Fusion e Axway MFT, é possível ampliar a conectividade para transferência de arquivos, adicionando integração no-code entre dados, aplicações, eventos e APIs.
Ao tratar os dados como um recurso essencial — bem coletado, seguro e governado — podemos liberar todo o potencial da IA enquanto atendemos às mais exigentes demandas de soberania, privacidade e eficiência energética.
Autor
Ingo Muschenetz
VP do Centro de Excelência em Nuvem e de IA da Axway