sábado, 25 de junho de 2016

ESTATÍSTICA: DE GÊNIO E LOUCO TODOS NÓS TEMOS UM POUCO.

Olá pessoal, desculpem-me pela ausência!!!!! Estou com pouco tempo livre ultimamente, mas não deixarei de passar aqui no blog para trazer conteúdos para vocês!!!

UAU! Estou com bastante dúvidas estatísticas para responder, algumas fáceis, outras desesperadas, outras que também não faço ideia de onde começar (risos).... mas que bom que elas existem! 
E vamos lá né.... se eu consigo entender, você também consegue.... não desista!!!!!!

Bom eu recebi uma pergunta semana passada e confesso que precisei pensar para responder! Li bastante antes de fazer esse post e foi um dos mais difíceis pra mim por ser algo que eu não uso dessa forma no meu dia a dia.
A pergunta foi simples: qual valor é considerado alto ou baixo?

Mas como sempre digo aqui, em cursos, em treinamentos..... a estatística só tem sentido se você entender O QUE está avaliando e PARA QUE está avaliando. Então responder apenas use o menor valor se torna incoerente diante de todo um contexto estatístico.

Bom, vamos lá...

Primeiramente, obrigada pela pergunta, espero conseguir te ajudar! Ela utiliza o RUN CHART e TREND ANALYSIS em suas avaliações estatísticas e pergunta quais os valores considerados altos ou baixos em um Desvio Padrão ou Desvio Absoluto Médio e também no Erro Percentual Absoluto Médio.

Para responder essa pergunta, vou voltar primeiro na teoria, certo? Se você não faz ideia do que estamos falando, vem comigo que vou te explicar:

1) Você sabe o que é um RUN CHART? Ele é usado para procurar evidências de variação de causa especial em seu processo. Em outras palavras, usado para identificar tendências ou outliers.

A carinha dele é mais ou menos essa aqui (feito no Minitab):


Os pontos variam em torno da média de forma aleatória, com exceção de um ponto que está meio perdido lá em cima.... 
Note que ele apresenta 4 valores de p, que se referem a agrupamentos, misturas, tendências e oscilação. Em todos eles, o p-value foi maior que 0,05. Portanto, pode-se dizer com segurança que não existem indícios de variação de causas especiais ou não-aleatoriedade para esses dados.
Depois disso, o ideal é fazer uma carta de controle para verificar a estabilidade de seu processo, ok!?

Bom....seguimos.... depois que ela verificou que o processo está livre de causas especiais, ela segue para a análise de tendência e o gráfico traz 3 medidas de acurácia (exatidão) que são informações para ajustes de dados.

2) o que é MAPE, MAD e MSD? (esses valores estão indicados no gráfico de tendências do Minitab - Trend Analysis)


 MAPE - MÉDIA PERCENTUAL ABSOLUTA DO ERRO: 
Essa medida nos diz quanto, em média, estamos errando, sem compensar erros negativos com positivos (mede o erro em porcentagem).

Pense no seguinte... uma empresa vende 1000 unidades de um produto além do planejado em SP e 1000 unidades abaixo do planejado no RJ. Pense que esse erro não será compensado...porque uma falta de produto no centro de distribuição de SP não será compensada por um excesso de produto no RJ, concorda? Então no caso....erramos 2 vezes...o excesso de estoque no RJ e a falta dele em SP.. os dois erros serão compensado em um calculo no MAPE.

Então vamos supor que no nosso exemplo, o MAPE tenha sido 30% - significa que, em média, o ajuste da empresa foi errado em 30% dos dados.

Vale lembrar que, quanto menor o MAPE, melhor é o processo.... então um MAPE de 5% é muito melhor que um MAPE de 30%, certo?

- MAD - DESVIO ABSOLUTO MÉDIO: 
Representa o desvio padrão do ajuste em relação à média, ou seja, serve para representar o quanto os números de um conjunto de dados desviam de um padrão.

Vamos supor que eu tenho uma loja e tenho 4 vendedores que trabalham na loja
vendedor 1: vendeu 4 passagens para a lua
vendedor 2: vendeu 5
vendedor 3: vendeu 6
vendedor 4: vendeu 1

Portanto a média de vendas foi 4. 
o Desvio médio do vendedor 1 foi 0, pois ele vendeu 4 passagens e a média foi 4.
o DM do vendedor 2 foi 1, pois ele vendeu 5 passagens e a média era 4...... e assim por diante.

O desvio médio absoluto (que o Minitab calcula pra vc) é aproximadamente 1,5. 
Esse número é a média de todos os desvios que aconteceram na venda de passagem para a Lua.

Quanto menor o MAD, melhor é o ajuste dos dados.


- MSD - DESVIO PADRÃO QUADRÁTICO DA MÉDIA: 
Muito comum em ajustes de série temporais e é muito sensível a outliers. Então se temos um MAD (desvio absoluto médio) mais baixo e um MSD (desvio quadrático médio) muito mais alto, possivelmente tem ação de outliers em seu conjunto de dados.

Quanto menor o MSD, melhor é o ajuste dos dados.

A pergunta que encerra a dúvida da leitora do blog é: O que eu considero alto e o que eu considero baixo?
Quando você vai fazer a análise de tendência no Minitab, você notou que existem 4 tipos de modelos para usar? Tendência linear, Tendência Quadrático, Tendência de crescimento exponencial e tendência de curva em S.


A pergunta que eu faço a você agora e que vai responder a sua pergunta é:
Qual modelo de tendência devo usar?

Você tem 2 caminhos:

  • Faça um gráfico de série temporal (times series) e observe. Se parecer linear, use o modelo de tendência linear; Se verificar alguma curvatura, tente o modelo quadrático ou exponencial e se houver uma curva em S, use o modelo de tendência em S.
  • Se não quer confiar na sua visão e quer algo mais concreto, compare os 4 modelos através das medidas de precisão (MAPE, MAD e MSD) e....bingo! Aqui está sua resposta. Não é o valor mais perto de zero e sim o gráfico que tenha as menores medidas de acurácia que você precisa usar para ter uma análise de tendência eficaz.

Espero ter ajudado e espero que suas análises fiquem ainda melhores depois desse post.

Tem alguma dúvida, crítica ou sugestão? Me escreva também!