Deduplicação: fazendo as pessoas contarem em um mundo cross-media

As pessoas transitam constantemente entre plataformas e telas – assistindo, trocando de canal e navegando ao longo do dia. No entanto, como podemos medir quantas realmente estão por trás de todas essas diferentes telas?

Quando falamos de medição cross-media, há um conceito que está no centro desse desafio: a deduplicação de audiências. 

Em termos simples, deduplicação significa identificar quantas pessoas únicas foram alcançadas, em vez de simplesmente contar impressões em diferentes plataformas. É como contar convidados em uma festa: se alguns passam por vários ambientes, o importante não é saber quantas vezes alguém apareceu em cada sala, mas quantas pessoas diferentes estiveram realmente lá. 

Normalmente, a deduplicação é considerada no nível de plataforma: como calcular a sobreposição entre YouTube e TV linear, ou entre Netflix e Prime Video, ou entre Disney+ e TV linear? 

Entretanto, para capturar de fato a complexidade do ecossistema de mídia atual, a deduplicação precisa acontecer em múltiplos níveis: 

  • Entre plataformas 
    Este é o nível mais discutido: medir a sobreposição de audiências entre plataformas como TV linear, YouTube, Meta, Prime Video, Disney+ ou TikTok. Entender essa sobreposição ajuda anunciantes a alocar melhor seus investimentos e gerenciar a frequência entre plataformas. 
  • Dentro das plataformas 
    Muitas plataformas globais incluem diferentes ambientes ou sub-marcas voltadas ao usuário. Por exemplo, a Amazon inclui Prime Video e Twitch, enquanto a Meta engloba Facebook, Instagram e WhatsApp. 

    Uma mesma pessoa pode usar vários desses ambientes – ou apenas um. Por conta de restrições de privacidade, as plataformas nem sempre conseguem identificar que se trata do mesmo indivíduo em todos esses pontos de contato, a menos que o usuário tenha dado consentimento explícito. 

    Como resultado, deduplicar audiências dentro de uma mesma plataforma não é simples, mas pode impactar significativamente as estimativas de alcance. 
  • Entre dispositivos, contas e pessoas 
    Também é importante considerar dispositivos e contas compartilhados. Algumas plataformas têm uma relação direta de um para um entre pessoa e conta – como é comum nas redes sociais. Outras, como os serviços de streaming, operam em um ambiente de um para muitos, no qual várias pessoas compartilham a mesma conta ou dispositivo. 

    Isso é frequentemente chamado de co-viewing, mas é essencialmente outra forma de deduplicação: entender quem realmente viu um conteúdo ou anúncio por trás de uma única conta ou dispositivo. 

Juntas, essas três camadas criam um problema de medição complexo. Ainda assim, muitas soluções cross-media focam principalmente no primeiro nível – a deduplicação entre plataformas –, deixando lacunas importantes na compreensão do alcance real das audiências. 

Por que isso é um desafio 

  • Se vejo o mesmo conteúdo ou anúncio no Facebook, no YouTube e na TV linear, como o anunciante pode ter certeza de que não estou sendo contado três vezes
  • Se sou uma plataforma de streaming, como posso entender quantas pessoas estão realmente assistindo – além do titular da conta? 
  • Se sou uma emissora com múltiplos canais lineares e digitais, como posso entender minha audiência real em vez de simplesmente somar o alcance de cada canal? 

Muitas vezes, essas relações não podem ser medidas diretamente. Por isso, as plataformas recorrem a modelos estatísticos – mas que possuem seus limites. 

Como calcular a deduplicação 

De forma geral, existem duas abordagens principais: 

Medição determinística: envolve medir por observação direta, normalmente por meio de painéis. Como os mesmos indivíduos são observados em diferentes plataformas e dispositivos, é possível calcular diretamente o número de pessoas únicas. 

Os participantes do painel são medidos continuamente, o que permite acompanhar seus dispositivos, exposições e comportamento de consumo ao longo do tempo dentro de uma estrutura única e consistente. 

Modelagem probabilística: aqui, a duplicação é estimada por meio de modelos estatísticos. Um dos mais utilizados se baseia na independência condicional, conhecido como modelo de Sainsbury. Existem duas variações: modelos naïve, que utilizam suposições para estimar probabilidades de sobreposição, e modelos treinados, nos quais dados reais alimentam esses modelos para maior precisão. 

A maioria das soluções cross-media depende fortemente da modelagem probabilística, especialmente para deduplicação entre plataformas. Mas modelar sem uma base sólida de dados reais tem limitações. Por isso, os painéis continuam sendo essenciais – fornecendo uma base confiável baseada no comportamento real das pessoas. 

O papel dos painéis na deduplicação 

Os painéis desempenham um papel fundamental na deduplicação. Eles capturam o consumo real de mídia nos níveis individual, domiciliar e de dispositivo – medindo o que pessoas reais assistem no dia a dia – de maneira segura e respeitando a privacidade. 

Isso permite: 

  • Medir diretamente a sobreposição entre plataformas  
  • Entender as relações entre pessoas, dispositivos, contas e domicílios
  • Atribuir o consumo de mídia a indivíduos dentro do domicílio  
  • Validar a atribuição demográfica  

No entanto, o grande desafio continua sendo a complexidade e a fragmentação do ecossistema de mídia atual. Todos reconhecemos isso no nosso próprio comportamento: navegamos, assistimos e consumimos conteúdo de forma contínua, entre múltiplas telas e plataformas. 

Nenhum painel, sozinho, consegue capturar o quadro completo. Os painéis oferecem a base centrada nas pessoas, enquanto os dados digitais – diretamente das plataformas – trazem a escala necessária para refletir como o consumo realmente acontece. 

Esses conjuntos de dados podem ser combinados de forma segura por meio de tecnologias que preservam a privacidade (PETs), aumentando a precisão da deduplicação de alcance e frequência. 

Unir essas duas fontes é essencial para obter uma visão completa das audiências. Avanços em data science e inteligência artificial estão tornando isso cada vez mais possível, ajudando a capturar melhor o comportamento real de consumo em escala e a alcançar uma deduplicação mais precisa entre plataformas, dispositivos e ambientes. 

Por que a deduplicação é importante 

Para anunciantes, veículos e plataformas, o impacto é claro: mais clareza. 

Sem a combinação entre painéis, dados digitais e tecnologias que preservem a privacidade, a maioria das soluções depende excessivamente de modelagem para a deduplicação. Isso não reflete o comportamento real e pode superestimar o alcance ou distorcer a frequência. 

Ao considerar a duplicação entre e dentro das plataformas, assim como em dispositivos compartilhados, torna-se possível obter uma visão muito mais completa de quem foi realmente alcançado. 

Em um ecossistema de mídia complexo, entender audiências não é apenas contar impressões – é entender pessoas. E é aí que começa a clareza.