Até que enfim voltamos pessoal!!! Demorou, mas aqui está mais um pequeno artigo falando de testes rápidos desenvolvidos por John Tukey, aquele cara que criou nada mais nada menos que o Box Plot, essa ferramenta com uma aplicabilidade enorme (veja um artigo no nosso blog sobre o Box Plot). Essa pessoa pensava muito diferente, muito “fora da curva”! Graças a pessoas como o John Tukey que a nossa saga com a Estatística fica mais tranquila.
Aproveitem e principalmente usem no seu dia a dia!
PS: Você pode conferir o artigo aqui pelo blog ou se preferir fazer o download do artigo.
Testes de hipótese rápidos de Tukey
Autores: Edson R. Montoro e Flavio A. Montoro
Os testes de hipótese são a maneira cientificamente válida de se efetuar uma comparação entre médias e entre desvios padrão. Com um pouco de prática se consegue entender a mecânica dos cálculos e executar um teste de hipótese de maneira correta. Hoje com os pacotes estatísticos fica ainda mais fácil.
Porém essa facilidade gera uma preocupação com o pensamento estatístico [1], com o pensar estatisticamente. Quem já participou dos nossos treinamentos sabe que falamos bastante do pensamento estatístico e da sua importância.
A mecânica dos cálculos de um teste de hipótese não é complicada, e quando a pessoa aprende essa mecânica, faz os cálculos corretamente, pois o pensamento matemático é muito forte na nossa formação. O pensamento estatístico é uma filosofia de aprendizado e ação que nos permite executar um teste de hipótese, não pensando em números matemáticos, mas sim sabendo que os valores envolvidos nos cálculos são resultados de medições. Sabemos que medir é um processo, e todo processo tem variabilidade, conforme diz o segundo princípio do pensamento estatístico. Não podemos fazer comparações matemáticas do tipo 5 é maior que 2. Na Estatística pode não haver diferença significativa entre 5 e 2, pois a cada resultado está associado uma incerteza, e no final das contas essas variabilidades que devem definir essa comparação.
Dito isso, para facilitar os testes de hipótese, John Tukey criou alguns testes rápidos, com menos matemática envolvida e podendo assim ser feito de maneira muito rápida, além de contribuir para o desenvolvimento do pensamento estatístico.
Apresentaremos dois testes simples, rápidos e muito práticos, o primeiro para comparar as médias de dois grupos de dados e o segundo para comparar os desvios padrão de dois grupos de resultados, sendo que este último exige um pouco mais de cuidados, pois existe uma “zona cinzenta” que exige um pouco mais de cálculos e ainda possui algumas restrições, mas apesar disso ainda é muito prático.
Nestes testes não importa qual o modelo de distribuição de probabilidade das variáveis em questão, o que remete à categoria de testes não paramétricos; mas diria que não existe essa preocupação de classificar estes tipos de testes, eles simplesmente têm uma abordagem bastante prática, como é o estilo já conhecido do autor, John Tukey.
1. Testes rápido de Tukey para detectar uma mudança significativa na média
Para determinar se há uma diferença significativa na média, John Tukey em 1959 desenvolveu um teste bastante simplificado [2] e Dorian Shainin o popularizou [3]. Este teste é chamado de Teste Rápido de Tukey ou Técnica de Contagem Final (End Count Test) que consiste em contar os valores de cada um dos grupos para definir se há ou não diferença significativa entre as médias.
Para realizar este teste é necessário executar os seguintes passos:
a) Organizar os dois grupos de dados em uma escala de modo que cada um dos grupos seja representado por um símbolo diferente, letras por exemplo.
b) Começando da esquerda, contar o número de símbolos semelhantes até encontrar um símbolo oposto (valor referente ao outro grupo).
c) Da mesma forma, começando pela direita, contar o número de símbolos semelhantes até encontrar um símbolo oposto.
d) A soma das duas contagens resulta na contagem final.
Nota: Se a quantidade de símbolos mais à esquerda e mais à direita forem iguais, a contagem final será zero.
A partir dessa contagem, com o apoio de uma tabela (Tabela 1), é possível definir com um nível de significância se há diferença significativa entre as médias ou não, além de verificar o intervalo de confiança para a diferença.
Caso o valor da contagem final seja superior a 6, significa que há diferença entre as médias, caso contrário (contagem final inferior a 6), significa que não há diferença significativa entre as médias.
Tabela 1 - Contagem Final, o nível de significância e o intervalo de confiança
Exemplo:
Um engenheiro de desenvolvimento testou 11 amostras de um material através de um experimento, medindo a resistência do material quando submetido a duas temperaturas diferentes (V1=50ºC e V2=150ºC). Na Tabela 2 pode-se verificar os resultados experimentais da variável resposta, além das respectivas médias, desvios padrão e variâncias.
Tabela 2 - Resultados experimentais do exemplo.
A interpretação gráfica das hipóteses é apresentada na Figura 1.
Figura 1 - Interpretação gráfica do teste de Contagem Final.
Na Figura 1 é apresentado uma contagem final (end count) de 7, sendo 4 V1 à esquerda e 3 V2 à direita, e conforme a Tabela 1 temos aproximadamente 95% de confiança para a conclusão de H1: µ50 ≠ µ150, isto é, os dois grupos (50ºC e 150ºC) possuem médias significativamente diferentes com um nível de significância de 5%.
2. Teste rápido de Tukey para detectar uma mudança significativa no desvio padrão
Para aplicar este teste de comparação entre os desvios padrão de dois grupos de resultados não emparelhados de uma variável é necessário seguir as seguintes regras:
Regra 1:
Se
então existe uma mudança significativa nos desvios padrão.
Regra 2:
Uma “zona cinzenta” ocorre quando
Se isso ocorrer utilizar a Regra 3.
Regra 3:
Se
então existe uma diferença significativa entre os desvios padrão.
Nota: Na fórmula da Regra 2 percebam que o valor 2,72 corresponde aproximadamente a constante de Euler (e = 2,71828)
Esta última regra (Regra 3) é um pouco mais exigente que a Regra 1, pois envolve os tamanhos de amostra, n1 e n2. No entanto, nem n1 nem n2 devem ser maiores que 60, e o menor n não deve ser menor que 70% do maior n.
Utilizando os mesmos dados do exemplo anterior, temos que a relação entre Smax e Smin é igual a:
e ainda é menor que 1,5, ou seja, fora da “zona cinzenta”, concluindo então que não existe diferença significativa entre os dois desvios padrão.
Bibliografia
[1] Hoerl R. W., Snee R. D., Statistical Thinking: Improving Business Performance, second edition, John Wiley and Sons, 2012.
[2] Tukey, J. W. (1959) "A Quick, Compact, Two-Sample Test to Duckworth’s Specifications" Technometrics, Vol. 1, No. 1, Feb., p 31-48.
[3] Bhote K.R., Bhote A.K., World class quality – Using design of experiments to make it happen, Amacom, (2000) New York.
Sobre os autores
Edson R. Montoro é Diretor Técnico da ERMontoro Consultoria e Treinamento Ltda, empresa focada no desenvolvimento de pessoas e consultoria nas áreas de melhoria de processo usando Estatística Aplicada e Lean Manufacturing.
O autor é Químico pela UNESP (Universidade Estadual Paulista “Júlio de Mesquita Filho”) – Araraquara, MBA em Gestão Empresarial pela FGV (Fundação Getúlio Vargas), Master Black Belt pela Air Academy Associates, Engenheiro de qualidade pela ASQ (America Society for Quality) e Pós-graduação em Gerência de Produção pela UFSC (Universidade Federal de Santa Catarina).
Flavio A. Montoro é Sócio Fundador / Consultor da ERMontoro Consultoria e Treinamento Ltda, empresa focada no desenvolvimento de pessoas e consultoria nas áreas de melhoria de processo usando Estatística Aplicada e Lean Manufacturing.
O autor é Cientista da computação pela Faculdades COC – Ribeirão preto – SP, Mestre e Doutor na área de Inteligência Artificial pela UFSCar (Universidade Federal de São Carlos).