• 2024-07-01

Definição e Exemplo de Suavização de Dados

Notificação de aviso de uso de dados no celular? APRENDA DESATIVAR DE VEZ!

Notificação de aviso de uso de dados no celular? APRENDA DESATIVAR DE VEZ!

Índice:

Anonim

O que é:

A suavização de dados é uma técnica estatística que envolve remover outliers de um conjunto de dados para tornar um padrão mais visível

Como funciona (Exemplo):

Por exemplo, digamos que uma universidade está analisando seus dados criminais nos últimos 10 anos. O número de crimes violentos é mais ou menos assim:

Como você pode ver, na maioria das vezes a universidade sofre menos de 15 crimes por ano. No entanto, em 2006 e 2007, experimentou 44 devido a uma exigência de relatório experimental pela equipe de segurança pública da universidade. O experimento de reportagem mudou a definição de crime violento para incluir roubos de qualquer tipo durante esses anos, o que criou um grande salto no número de crimes "violentos" no campus. Se incluirmos esses anos na média - isto é, se fizermos alguma suavização de dados - a universidade experimentou uma média de cerca de 19 crimes violentos por ano. Mas se deixarmos esses anos para fora, podemos ver que uma média mais realista é de 13 crimes violentos por ano - uma diferença de 32%.

Por que é importante:

Há muitas maneiras de suavizar dados, incluindo o movimento médias e algoritmos. A ideia é que a suavização de dados torne os padrões mais visíveis e, assim, auxilie na previsão de alterações nos preços das ações, nas tendências dos clientes ou em qualquer outra informação comercial. No entanto, a suavização de dados pode ignorar informações importantes ou tornar fatos importantes menos visíveis; em outras palavras, "arredondar as bordas" dos dados pode enfatizar demais certos dados e ignorar outros dados.