Empresas em que campanhas de marketing se ajustam sozinhas a cada cliente, ataques digitais são investigados por software antes que um analista perceba, e perguntas de negócio são respondidas em segundos a partir dos dados reais da companhia. Foi essa a visão de uma empresa movida por agentes de IA que a Databricks colocou no centro do primeiro keynote do Data + AI Summit 2026, em São Francisco.
Em vez de um único produto, a companhia anunciou um pacote de lançamentos que tenta reescrever, camada por camada, a forma como as organizações guardam, consultam e agem sobre seus dados. Há uma nova arquitetura de base, um mecanismo de consultas em tempo real, um assistente para áreas de negócio, a entrada da empresa no mercado de marketing e a compra de uma plataforma de segurança. Todos os anúncios partem da mesma aposta, repetida pelo cofundador e CEO Ali Ghodsi: a separação histórica entre sistemas operacionais, analíticos e de tempo real virou um gargalo agora que agentes de IA, e não só pessoas, executam tarefas em escala.
O que é a Databricks e por que o Data + AI Summit importa
Fundada em 2013 e com sede em São Francisco, a Databricks se define como uma "empresa de dados e IA" e construiu seu nome ao redor do conceito de Lakehouse. A ideia é unir, em uma só plataforma, dois mundos que antes viviam separados: o data warehouse, repositório organizado de dados já tratados e ótimo para relatórios, mas rígido e caro, e o data lake, que armazena qualquer tipo de dado bruto a baixo custo, porém é difícil de consultar. O Lakehouse promete a organização e o desempenho de um com a flexibilidade e o custo do outro.
Hoje afirma atender mais de 20 mil organizações, incluindo 70% das empresas da Fortune 500, com clientes como adidas, AT&T, Mastercard e Rivian. Seu portfólio reúne produtos como Lakebase, Genie, Agent Bricks, Lakeflow, Lakehouse e o Unity Catalog, a camada de governança que aparece em praticamente todos os anúncios desta edição.
O Data + AI Summit é o principal evento da empresa e, segundo a própria organização, a maior conferência de dados, analytics e IA do mundo. A edição de 2026 acontece de 15 a 18 de junho no Moscone Center, reúne mais de 30 mil participantes presenciais de mais de 150 países e distribui o conteúdo em mais de 800 sessões. É no keynote de abertura que a Databricks costuma concentrar seus lançamentos mais estratégicos, e foi o que aconteceu aqui.
A tese: agentes mudaram a conta da infraestrutura de dados
O argumento central é que, por quatro décadas, bancos transacionais atenderam aplicações enquanto sistemas analíticos respondiam perguntas, e que conectar os dois exigia pipelines de CDC (Change Data Capture) frágeis. Para a empresa, esse arranjo já era caro quando o software era escrito em ritmo humano e teria se tornado inviável com a chegada dos agentes, que operam de forma contínua e precisam ler, raciocinar e agir quase em tempo real.
"Durante décadas, a infraestrutura complexa de dados foi um custo inevitável para as equipes. Então chegaram os agentes. Em questão de meses, as organizações praticamente dobraram sua força de trabalho, mas não com pessoas. A infraestrutura que sustentou a última era da computação agora se tornou um gargalo que ninguém pode se dar ao luxo de manter." Ali Ghodsi, cofundador e CEO da Databricks
A partir daí, os anúncios se dividem em duas frentes: reconstruir a base técnica da plataforma e expandir a empresa para mercados onde ela ainda não atuava.
LTAP quer unificar transações e análises em uma única cópia
O anúncio mais estrutural foi o LTAP (Lake Transactional/Analytical Processing), apresentado pela Databricks como a primeira arquitetura do tipo no mundo. Na prática, a proposta é guardar dados operacionais e analíticos em uma só cópia no lake, deixando tudo imediatamente consultável sem réplicas. Para uma empresa, a promessa é menos infraestrutura paralela para manter e dados que estão sempre atualizados, sem a defasagem que copiam informação de um sistema para outro.
A companhia afirma que ele já atende milhares de clientes, entre eles Block, Ensemble, Superhuman e Zillow, e processa 12 milhões de inicializações de bancos de dados por dia. Com o LTAP, o Lakebase passa a gravar dados diretamente no Unity Catalog, usando os mesmos formatos abertos do Lakehouse, Delta e Iceberg, padrões que organizam dados brutos para que funcionem como tabelas confiáveis e possam ser lidos por diferentes ferramentas, sem ficar presos a um único fornecedor. Assim, em vez de manter uma cópia separada dos dados, tudo passa a viver em um só lugar.
O lançamento vem acompanhado de recursos voltados a uso intenso de IA: recuperação de desastres entre nuvens e regiões, ramificação e snapshots inspirados no Git para experimentar com dados de produção, e operações autônomas em que agentes monitoram a saúde do banco, detectam lentidão e propõem índices.
"O Lakebase e o LTAP expandem essa base ao unificar cargas operacionais e analíticas em uma única camada, oferecendo à nossa IA nativa o acesso em tempo real necessário para operar em ambientes de produção." Grant Veazey, CTO da Ensemble
A Databricks afirma que o LTAP estará disponível em breve, como parte do Lakebase, ou seja, ainda não é geral.
Lakehouse//RT promete consultas em milissegundos
O segundo anúncio técnico foi o Lakehouse//RT, descrito como a evolução em tempo real do Lakehouse e movido por um novo mecanismo de computação chamado Reyden. A ideia é entregar consultas em milissegundos para dezenas de milhares de usuários e agentes ao mesmo tempo, lendo diretamente tabelas Delta e Iceberg governadas, sem precisar montar um sistema separado de tempo real ao lado do lakehouse. Para o usuário final, isso significaria dashboards e respostas que carregam quase instantaneamente, mesmo sob alto volume.
Os números divulgados são chamativos: latência de até 10 milissegundos em conjuntos menores, abaixo de 100 milissegundos em volumes maiores, 12 mil consultas por segundo em benchmarks padrão e desempenho até 16 vezes superior ao de arquiteturas especializadas de tempo real.
"O Lakehouse//RT completa esse espectro de mecanismos, oferecendo a camada de velocidade em milissegundos que as pessoas desejam e os agentes exigem." Ali Ghodsi, cofundador e CEO da Databricks
Dois clientes serviram de referência. Chris Kopek, Head of Data Platforms da Cisco, citou uma melhoria de cinco vezes no tempo de resposta para busca de ameaças. Kayvon Raphael, Senior Director of Engineering da Magnite, relatou desempenho abaixo de 200 milissegundos nas principais consultas de dashboards. O Lakehouse//RT já está disponível em beta.
Genie One é apresentado como um colega de trabalho agêntico
Saindo da infraestrutura, o Genie One mira as áreas de negócio. É posicionado como um colega de trabalho agêntico para marketing, finanças, vendas e outras equipes, capaz de automatizar tarefas usando dados estruturados ou não, dentro ou fora da Databricks, e de produzir documentos, relatórios e gráficos. A diferença para a primeira geração do Genie, que só fazia análises conversacionais sobre dados na plataforma, é a conexão com mais de 50 aplicativos externos, com integrações que incluem Google Drive, Jira, Slack, Confluence e SharePoint.
No centro está o Genie Ontology, descrito como uma camada de contexto que aprende continuamente sobre o negócio. A aposta da empresa é que o maior limite da IA corporativa não é o modelo, e sim a falta de contexto, já que boa parte do conhecimento de uma companhia vive espalhada em sistemas ou só na cabeça das pessoas. Com contexto governado, a promessa é responder com dados reais em vez de "chutar".
"Se você é um CFO e a IA não consegue explicar por que as margens mudaram, ou um líder de vendas e ela não consegue identificar sua próxima oportunidade de upsell, isso não é um problema de IA, é um problema de contexto." Ali Ghodsi, cofundador e CEO da Databricks
A família ganhou ainda o Genie Agents, que transforma qualquer conversa em um agente reutilizável, e o Genie App Builder, ambiente de vibe coding para criar aplicações conectadas aos dados de governança. A empresa também citou o Genie Code, para fluxos de engenharia de dados, e o Genie ZeroOps, agente de segundo plano que monitora e propõe correções para pipelines, jobs e modelos. Albertsons, Uplight e Foot Locker apareceram como casos de uso.
Sobre preço, a Databricks afirma que o Genie não cobra por usuário: cada organização recebe até US$10 gratuitos por usuário ao mês e paga apenas pela IA efetivamente usada, um modelo de consumo que pode tornar os custos menos previsíveis em uso intenso. Genie One, Genie Agents e Genie Code já estão disponíveis, inclusive em apps para iOS e Android, enquanto Genie App Builder e Genie ZeroOps entram em preview privado pouco depois do evento.
Com o CustomerLake, a Databricks entra no mercado de marketing
O anúncio que mais amplia a fronteira da empresa é o CustomerLake, descrito como um CDP (plataforma de dados do cliente) agêntico, construído nativamente sobre a Databricks e governado pelo Unity Catalog. Ele reúne em um só lugar dados de clientes, resolução de identidade, construção de audiências, automação de campanhas e ativação. A promessa para os times de marketing é trocar campanhas pontuais por aquilo que a empresa chama de "infinity campaigns", ciclos contínuos em que agentes analisam o comportamento do cliente, decidem e agem em tempo real, segundo a Databricks até "um bilhão de vezes por dia".
A justificativa é que o marketing vive duas mudanças ao mesmo tempo: as marcas passam a falar também com agentes que os próprios consumidores usam para pesquisar e comprar, e as equipes passam a operar suas ferramentas por meio de agentes. O CustomerLake traz integrações e reverse ETL para conectar a plataforma a parceiros como Adobe, Meta, LiveRamp e The Trade Desk.
"O marketing deixa de ser uma série de campanhas e se torna um ciclo contínuo, com agentes que analisam, decidem e agem sobre cada cliente em tempo real." Ali Ghodsi, cofundador e CEO da Databricks
O CustomerLake está em preview privado, com clientes como HP, Circle K, AB InBev e Getnet by Santander. A empresa diz que o preço seguirá um modelo de consumo alinhado a valor, e não uma licença tradicional de software.
A compra da Panther reforça a aposta em segurança
Por fim, a Databricks anunciou a intenção de adquirir a Panther, plataforma de SOC (centro de operações de segurança) baseada em IA. O objetivo é avançar no conceito de "security lakehouse", a categoria que a empresa vem tentando criar para concorrer com os SIEMs (sigla em inglês para gestão de informações e eventos de segurança) tradicionais, ferramentas de monitoramento de segurança consideradas caras e dependentes de trabalho manual. A ideia é usar agentes para investigar todos os alertas e responder a ataques na velocidade da IA, integrando-se ao Lakewatch, o produto de segurança lançado pela empresa no início do ano.
A Panther é descrita como a terceira aquisição de segurança da Databricks, depois de Antimatter e SiftD.ai, e tem entre seus clientes a Anthropic, criadora do modelo de IA Claude, cujo Head of Defense, Tim Nguyen, foi citado no anúncio. A plataforma traz mais de 100 integrações prontas e uma abordagem de "detection-as-code".
Não foram divulgados os valores do negócio, que ainda depende de aprovações regulatórias e das condições habituais de fechamento.
A ambição é grande, agora falta ver tudo funcionando
O que a Databricks colocou no palco é menos um produto e mais a planta de uma empresa inteira operada por agentes. A visão é coerente e ambiciosa, e justamente por isso a parte mais interessante vem depois do keynote: ver esse conjunto rodando junto, em produção e em escala.
Há motivos para acompanhar de perto. A Databricks chama o LTAP de a primeira arquitetura do tipo no mundo, mas é a própria empresa quem criou o nome, então o título de "pioneira" precisa ser visto com calma. A promessa central é juntar duas coisas que sempre viveram separadas: o banco que registra as operações do dia a dia (uma compra, um cadastro) e o sistema que analisa esses dados para gerar relatórios. Fazer os dois no mesmo lugar, sem que um deixe o outro lento, é exatamente onde tentativas parecidas do setor já tropeçaram. Por isso, o teste de verdade será ver a tecnologia funcionando assim em produção.
Os números também deixam a expectativa alta. O ganho de até 16 vezes do Lakehouse//RT e o "um bilhão de vezes por dia" do CustomerLake são métricas da empresa ou de clientes, e vale lembrar que a formulação "até" costuma descrever o melhor cenário. São marcas que dá vontade de ver confirmadas no uso do dia a dia, fora do ambiente controlado de um benchmark.
E há o cronograma. Boa parte do que foi anunciado ainda não chegou às mãos do público: o Lakehouse//RT está em beta, o LTAP foi descrito como algo que chega em breve, CustomerLake e dois produtos do Genie estão em preview privado, e a compra da Panther depende de aval regulatório. É um roteiro ambicioso, mas em construção, e o que vai dizer se a aposta se sustenta é o quanto dele estiver de pé, e funcionando, nos próximos meses.
Ver 0 Comentários