domingo, 1 de novembro de 2015

Usando a "roupa" certa para dados não normais

Olá pessoal, tudo bem? Antes de começar o assunto de hoje, gostaria de agradecer as visitas e as participações. 
Hoje tenho um grupo de seguidores bem heterogênio. São estudantes que querem fazer farmácia, estudantes de farmácia que querem seguir a carreira industrial, estagiários da indústria farmacêutica, analistas, supervisores, coordenadores, gerentes, consultores, professores (que aliás agradeço imensamente pelos compartilhamentos com seus alunos).
Sei que a minha responsabilidade sobre cada post aumenta ainda mais. Mas esse foi o objetivo de criar esse blog.... conseguir trazer todo mundo para mais perto!!!!! 
Aos estudantes, sei que as vezes os posts são específicos dessa área de atuação, mas além dos posts motivacionais, vou preparar um conteúdo mais voltado para vocês em breve. Continuem aí!!!!

Bom, voltando ao assunto de hoje.... Eu recebi essa dúvida a um tempo atrás e prometi ao Rafael que iria falar mais sobre isso....então aqui estou eu cumprindo minha promessa rs...

Falamos bastante nos posts anteriores sobre não normalidade dos dados, sobre transformação estatística para chegar próximo da normalidade mas e quando meus dados realmente forem "não normais"???? Jogo os dados fora???? O lote não está bom??

NÃÃÃOOO.... lembre-se que estamos falando em perfil estatístico e não perfil de qualidade. Seu processo pode até estar não normal, fora de controle estatístico e ainda assim o produto ter qualidade....Ou ainda seu processo pode ser consistentemente ruim! A estatística está aqui para melhorar e otimizar o processo visando minimizar problemas futuros, blz??

Bom, agora sim.... o que fazer então se com dados não normais eu não posso usar a curva de distribuição normal para encontrar o Cp e Cpk e determinar a capacidade do processo?

Enquanto a Análise de Capacidade Normal estima o PPM fora de especificação esperado usando o modelo de probabilidade normal, dependendo de um processo estável e normal, a Análise de Capacidade não normal usa uma distribuição não normal para calcular as PPM fora de especificação.

Pense assim: Você quer ir à praia mas ganhou um pouquinho de peso nesse bendito inverno e aquele seu biquini maravilhoso não serve mais... o que você faz? (Dieta é uma boa (risos) mas dieta é a longo prazo e a galera ta indo pra praia esse fds)...

A não ser que queira ficar deprê em casa, com certeza vai até o shopping mais próximo comprar um outro biquini que você se sinta mais confortável e vai curtir o seu fds perfeitamente, acertei? (no caso dos meninos que visitam o blog, eu sei que vocês irão com o short ou sunga que tiver ai mesmo e boa, mas entre comigo aqui na história blz?!?! rs)

Com a não normalidade é exatamente a mesma coisa.... Se não tenho resultados para usar a curva de distribuição normal, então vou usar uma outra "roupinha" sobre meus dados, ou seja, vou usar uma outra curva que melhor se adapte aos meus resultados e melhor descreva a aleatoriedade desses dados. Isso vai permitir com que você avalie a performance do seu processo (a variação a longo prazo) e verifique se existem ações que possam ser tomadas para melhorar seu processo.

Existem mais 13 distribuições que podem ser usadas em dados não normais: Lognormal; Lognormal para 3 parâmetros; Exponencial; Exponencial para 2 parâmetros; Gama; Gama para 3 parâmetros; Weibull; Weibull para 3 parâmetros; Logística; Loglogística, Loglogística para 3 parâmetros; Menor valor extremo e Maior valor extremo.


SORTE A NOSSA QUE TEMOS PESSOAS DO BEM QUE INVENTARAM SOFTWARES PARA CALCULAR ISSO TUDO!!!!!! (risos)

Bom, primeiramente, você precisa definir qual é a distribuição mais apropriada para seus dados. Para isso vamos usar uma análise chamada "Análise de distribuição individual".
(Aproveito aqui para dizer que eu não sei fazer essa análise toda usando apenas excel! E eu nem sei se é possível. Embora eu goste muito de aprender a trabalhar com o excel, não vamos inventar a roda de novo. Hoje existem softwares estatísticos desenvolvidos para facilitar nossas vidas. Eu trabalho com o Minitab, mas pra quem não tem licença, use o Action. Ele é completo, confiável e gratuito e faz tudo isso aqui que eu explico no Minitab com a mesma facilidade e resultado).

Então vamos para o Minitab: Você fez seu teste de normalidade, seu p-value foi menor que 0,05 e você optou por uma transformação estatística e mesmo assim seu p-value permaneceu menor que 0,05?? Então agora vamos optar por trabalhar com a não normalidade dos seus dados, escolhendo a melhor distribuição que se adapta aos seus resultados.

- Selecione Stat (Estat) - Quality tools(Ferramentas da Qualidade) - Individual Distribution Identification (Identificação de distribuição individual)



- Escolha o seu parâmetro e determine se você deseja selecionar 4 distribuições ou avaliar todas as possíveis.


- Se você optar por avaliar todas, aparecerão 13 gráficos na sua tela, como abaixo e você pode ajeitá-los conforme achar melhor para avaliar todos:




Uauuu que louco!!!!! Mas como vou decidir qual deles é o melhor pros meus dados???

A regra é simples: avalie o p-value (ou valor de p). O gráfico que tiver o melhor p-value é a curva que melhor se adapta aos seus dados. Os pontos estarão mais próximos à reta.
Escolhido sua melhor distribuição, basta fazer sua avaliação de capacidade do processo agora.
Vamos supor que a minha melhor distribuição foi a Weibull.

Dessa forma:

- Clicar em Stat - Quality Tools - Capability Analysis - Nonnormal

- Selecionar o seu parâmetro e a curva de distribuição escolhida

- Adicionar os limites de especificação para seu teste

- Prontinho, sua curva de distribuição para dados não normais está pronta, com o melhor modelo escolhido para seus dados.


Galera é isso! Rafael, espero que eu tenha conseguido falar um pouquinho mais sobre não normalidade dos dados e ter te ajudado!

E você, gostou? Tem alguma dúvida, crítica ou sugestão? Me escreva também!



Software: Minitab (trial)