Resumo. O problema de interpretação das hipóteses testadas nos modelos com dois fatores cruzados e dados desbalanceados foi amplamente discutido com base no procedimento GLM do SAS (Iemma [1] e Mondardo [2]). Neste contexto, este trabalho teve como objetivo comparar os resultados de outros softwares estatísticos com aqueles fornecidos pelo procedimento GLM do SAS.
IntroduçãoDevido a capacidade dos computadores de hoje, sua grande rapidez na realização de cálculos aritméticos e facilidade de acesso, os softwares estatísticos tornaram-se uma ferramenta indispensável na análise estatística de dados. A utilização muitas vezes inadequada desses softwares acabou gerando um dos problemas mais comuns em estatística, queé a interpretação das hipóteses testadas na análise de variância de dados desbalanceados.Segundo Iemma [1],é importante chamar a atenção para as "interpretações das verdadeiras hipóteses" testadas através das somas de quadrados obtidas pelos diversos métodos disponíveis na literatura. Por exemplo, o procedimento GLM (General Linear Models) do SAS (Statistical Analysis System) fornece quatro tipos de somas de quadrados (I, II, III e IV) que, dependendo do nível de desbalanceamento e da posição das caselas vazias, testam quatro tipos diferentes de hipóteses.Visando exemplificar numericamente os conceitos sobre dados desbalanceados e caselas vazias, apresenta-se aqui, parte dos dados provenientes do peso de bezerros da raça Canchim e reproduzidos em Oikawa [3]. Os dados apresentados seguem a estrutura de um modelo com dois fatores, onde as fontes de variações (fatores) são dadas pelo sexo do bezerro (efeito de linhas) e pela origem do bezerro (efeito de colunas). O Quadro I apresenta os dados desbalanceados com todas caselas ocupadas, ou seja, o número de repetições nãoé o mesmo em cada casela, no entanto todas caselas apresentam pelo menos uma observação. No Quadro II os dados estão desbalanceados e existe a ocorrência de uma casela vazia.