Quando utilizar o teste de comparação multiplica

Os testes de comparações múltiplas podem ser considerados como aqueles que são idealizados e organizados antes da ocorrência do experimento, podendo, dessa maneira, atuar como uma complementação do teste F para a variância.

O objetivo dos testes de comparações múltiplas possui como principal intuito encontrar diferenças existentes entre duas ou até mais médias de tratamento. Tais distinções podem ou não ser ortogonais.

Nesse contexto, vale lembrar que os testes de comparações múltiplas de médias distintas e do tipo não ortogonais devem ser realizados na ocasião em que o teste “F” denotar distinção entre as médias de tratamento.

Os motivos que levam a utilizar a realização de um teste estatístico que aponte uma distinção entre os tratamentos antes de realizar um teste de significância da diferença entre os dois tratamentos são:

– Por causa da elevada quantidade de tratamentos, a probabilidade de encontrar contrastes também sofre um aumento.

– Devido a uma elevada quantidade de tratamentos, a distinção que existe entre duas médias extremas que fazem parte das amostras da mesma população não fica sendo mais considerada apenas casual. Sendo assim, a distribuição de probabilidades que o contraste tem por base não é mais considerado válido.

Diante de tais motivos, os resultados significativos nos testes de comparações múltiplas comparações se tornam mais corretos e seguros a partir do momento em que são efetuados depois da obtenção de significância na análise de variância. Dessa maneira pode ser considerado que o nível de confiabilidade do teste está assegurado pela significância da ANAVA.

Além disso, ao efetuar um comparativo onde o resultado favorável poderia apresentar um equilíbrio entre os tratamentos, como, por exemplo, um produto de fabricação nacional e outro produto importado, seria inapropriado efetuar o uso de um teste que trouxesse benefícios para acontecer o erro tipo II, ou seja, o teste a ser usado deve apresentar um menor rigor.

Por outro lado, diante de uma comparação em que o resultado favorável poderia ser uma melhor eficiência de determinados tratamentos, seria um erro fazer uso de um teste que permitisse ocorrer o erro tipo I, sendo assim necessário optar por um teste que apresente um rigor bem maior.

Vale, nesse caso, destacar que:

– O erro tipo I é aquele que confere diferenças nítidas no momento em que elas não existem.

– O erro tipo II é aquele que confere uma igualdade quando, na verdade, é possível detectar uma diferença.

Além disso, é importante também observar que quando um tipo de erro é reduzido, a probabilidade de um outro tipo de erro sofre um aumento.

Os testes de comparações múltiplas e suas características

Quando o assunto é testes de comparação, é preciso levar em consideração também a existência de alguns testes, tais como:

– O Teste de Tukey – O Teste de Scheffé – O Teste de Bonferroni – O Teste de Dunnet

– O Teste de Duncan

O Teste de Tukey, por exemplo, conta com algumas características bem definidas. Entre elas é possível citar:

– Ele não possibilita a comparação de grupo de tratamentos entre si.

– É um teste usado para analisar qualquer distinção existente entre duas médias de tratamento.

– É um teste usado a partir do momento em que o teste “F” para tratamentos da análise de variância for considerado significativo.

– É um dos testes de comparação mais usados justamente por apresentar um elevado rigor de avaliação e, também, por denotar fácil aplicação.

Já o Teste de Duncan é considerado um teste de caráter menos rigoroso, por exemplo, que o Teste de Tukey.

Os testes de comparações múltiplas e a ANOVA

Os testes de comparações múltiplas levam bastante em consideração à ANOVA – a chamada Análise de Variância. Essa análise consiste em um método muito usado no cenário acadêmico. De uma maneira geral, este método avisa se há a existência de um tratamento que destoe em comparação com os demais tratamentos.

No entanto, ele requer que algumas premissas sejam devidamente obedecidas, especialmente a distribuição normal dos resíduos e também a homogeneidade de variância.

Para a realização de uma ANOVA é preciso que exista uma variável de resposta contínua e, além disso, deve haver também um fator categórico que apresentam mais de um nível. As análises ANOVA necessitam também de dados de populações que, de uma maneira geral, sejam devidamente distribuídas com variâncias equilibradas entre os fatores.

No entanto, os procedimentos ANOVA possuem êxito ainda que a pressuposição de normalidade seja violada. A exceção disso acontece a partir do instante em que uma ou até mais distribuições denotem uma elevada assimetria ou quando as variâncias denotem uma acentuada diferença. Entretanto, as transformações do conjunto de dados original possuem condições de efetuar a correção de tais violações.

O nome “Análise de Variância” é baseado na abordagem em que o procedimento faz uso de variâncias com o objetivo de estipular se as médias denotam diferenças

Quando é feita a análise de variância de um experimento com apenas dois tratamentos, podemos visualizar apenas pela média qual o melhor tratamento. Porém, quando há mais de dois tratamentos, fazendo apenas o teste de “f” (teste que mostra se existe diferença entre as médias dos tratamentos) não podemos indicar qual o melhor tratamento. Neste caso, é necessário aplicar um teste de comparação de médias dos tratamentos, daí podendo concluir qual o melhor tratamento.

Então os testes de comparação de média servem como um complemento para o estudo da análise de variância. Há vários testes de comparação de médias, entre os quais podemos citar: teste de Tukey, teste de Duncan, teste de Scheffé, teste de Dunnet e teste de Bonferroni.

Teste de Tukey
-É um dos testes de comparação de média mais utilizados, por ser bastante rigoroso e fácil aplicação;

-Não permite comparar grupos de tratamentos entre si;

-É utilizado para testar toda e qualquer diferença entre duas médias de tratamento;

-É aplicado quando o teste “F” para tratamentos da ANAVA (análise de variância) for significativo.

* O teste de Tukey tem como base a DMS (diferença mínima significativa), representada no geral por ∆ e calculada da seguinte forma:

Onde:
q∆ = é o valor da amplitude estudentizada, cujo o valor é encontrado em tabelas, em função do número de tratamentos e do número de grau de liberdade do resíduo, ao nível α de probabilidade (em geral 5%);

s = é a estimativa do desvio padrão residual (erro experimental);

r = número de repetições.

Os testes de comparações múltiplas “a posteriori” são aqueles não planejados antes da realização do experimento, servindo de complemento do teste F da análise de variância, e tem como objetivo detectar diferenças (ortogonais ou não) entre duas médias (ou grupos delas) de tratamentos.

Os testes de comparações de médias em contrastes não ortogonais ou feitos “a posteriori” só devem ser utilizados quando o teste “F” for significativo (indicar diferença entre as médias dos tratamentos).

As justificativas de se recomendar a aplicação de um teste estatístico que indique uma diferença entre os tratamentos antes de aplicar um teste de significância da diferença entre dois tratamentos quaisquer são:

- Com o aumento do número de tratamentos a probabilidade de se detectar entre todos os possíveis contrastes, também aumenta;

- Com um grande número de tratamentos a diferença entre duas médias extremas pertencentes a amostras da mesma população não é mais apenas casual, de modo que a distribuição de probabilidades na qual se baseia o contraste não é mais válida;

- Portanto os resultados significativos nos testes de comparações múltiplas “a posteriori”, tornam-se mais confiáveis seguros e, em realidade válida, quando realizados após a obtenção de significância na análise de variância. Diz-se então que a confiabilidade do teste está protegida pela significância da ANAVA.

Em uma comparação onde o resultado favorável seria uma equivalência entre os tratamentos (um produto nacional e outro importado mais caro), seria inadequado a utilização de um teste que beneficiasse a ocorrência do erro tipo II, isto é, o teste a ser aplicado deve ser menos rigoroso.

Em uma comparação onde o resultado favorável seria uma melhor eficiência de alguns tratamentos, seria inadequada a utilização de um teste que beneficiasse a ocorrência do erro tipo I, devendo-se optar por um teste mais rigoroso.

*Obs. - Erro tipo I: atribuir diferenças significativas quando elas realmente não existem;

- Erro tipo II: atribuir uma igualdade quando realmente existe uma diferença.

Inevitavelmente, ao diminuirmos um tipo de erro, aumentamos a probabilidade do outro tipo de erro.

Testes que pode ser aplicados “a posteriori”: t de Student, SNK (Student, Newman, Keuls), Duncan, Tukey...