1. EducationMathStatisticsCriar um intervalo de confiança para a diferença de dois meios com desvios padrão conhecidos
Statistics For Dummies, 2ª Edição

Por Deborah J. Rumsey

Se você souber os desvios padrão para duas amostras populacionais, poderá encontrar um intervalo de confiança (IC) para a diferença entre suas médias ou médias. O objetivo de muitas pesquisas e estudos estatísticos é comparar duas populações, como homens versus mulheres, famílias de baixa e alta renda e republicanos versus democratas. Quando a característica que está sendo comparada é numérica (por exemplo, altura, peso ou renda), o objeto de interesse é a quantidade de diferença nas médias (médias) para as duas populações.

Por exemplo, você pode comparar a diferença na idade média dos republicanos versus democratas, ou a diferença na renda média de homens e mulheres. Você estima a diferença entre duas médias populacionais,

image0.png

colhendo uma amostra de cada população (por exemplo, amostra 1 e amostra 2) e usando a diferença dos dois meios amostrais

image1.png

mais ou menos uma margem de erro. O resultado é um intervalo de confiança para a diferença de duas médias populacionais,

image2.png

Se ambos os desvios padrão populacionais forem conhecidos, a fórmula para um IC para a diferença entre duas médias populacionais (médias) será

image3.png

são a média e o tamanho da primeira amostra e o desvio padrão da primeira população,

image4.png

é dado (conhecido);

image5.png

e n2 são a média e o tamanho da segunda amostra e o desvio padrão da segunda população,

image6.png

é dado (conhecido). Aqui z * é o valor apropriado da distribuição normal padrão para o seu nível de confiança desejado. (Consulte a tabela a seguir para obter os valores de z * para determinados níveis de confiança.)

Para calcular um IC para a diferença entre duas médias populacionais com desvios padrão conhecidos, faça o seguinte:

image7.png

Suponha que você queira estimar com 95% de confiança a diferença entre o comprimento médio (médio) das espigas de duas variedades de milho doce (permitindo que elas cresçam o mesmo número de dias nas mesmas condições). Ligue para as duas variedades Corn-e-stats e Stats-o-sweet. Suponhamos, por pesquisas anteriores, que os desvios padrão da população para estatísticas de milho e estatísticas e estatísticas de doce são 0,35 polegadas e 0,45 polegadas, respectivamente.

image15.png

A tentação é dizer: “Bem, eu sabia que o milho Corn-e-stats era mais longo porque a média da amostra era 8,5 polegadas e o Stat-o-sweet era apenas 7,5 polegadas em média. Por que eu preciso de um intervalo de confiança? ”Todos esses dois números dizem algo sobre as 210 espigas de milho amostradas. Você também precisa levar em consideração a variação usando a margem de erro para poder dizer algo sobre toda a população de milho.

Observe que você pode obter um valor negativo para

image19.png

Por exemplo, se você tivesse trocado as duas variedades de milho, obteria -1 para essa diferença. Você diria que o Stats-o-sweet teve em média uma polegada a menos do que as estatísticas do milho e na amostra (a mesma conclusão foi declarada de maneira diferente).

Se você deseja evitar valores negativos para a diferença na média da amostra, sempre faça com que o grupo com a amostra maior signifique o seu primeiro grupo - todas as suas diferenças serão positivas.

No entanto, mesmo que o grupo com maior média amostral sirva como primeiro grupo, algumas vezes você ainda obterá valores negativos no intervalo de confiança. Suponha no exemplo acima que a média da amostra de milho-e-stats fosse 7,6 polegadas. Portanto, a diferença na média da amostra é 0,1 e o limite superior do intervalo de confiança é 0,1 + 0,1085 = 0,2085, enquanto o limite inferior é 0,1 - 0,1085 = –0,0085. Isso significa que a verdadeira diferença está razoavelmente em qualquer lugar, desde o Corn-e-stats com até 0,2085 polegadas a mais até o Stat-o-sweet com 0,0085 polegadas a mais. É muito perto para ter certeza de qual variedade é mais longa, em média.