Testes de hipóteses - o teste-z
É comum na atividade científica nos depararmos com questionamentos que envolvem a comparação de um resultado obtido através de um experimento (ou de um trabalho teórico), sujeito a incertezas e flutuações, com uma expectativa qualquer, ou com outros resultados de um outro trabalho. Por exemplo: os resultados do LHC suportam a existência do bóson de Higgs? O valor da aceleração que eu obtive é compatível com a aceleração da gravidade em São Paulo, medida pelo IAG? Estas duas molas são iguais, ou seja, têm constantes elásticas e comprimentos compatíveis uma com a outra?
Para isso, existe um tópico de estatística chamado inferência, no qual um dos problemas que é abordado neste tópico é o teste de hipótese. Há vários testes diferentes que dependem do tipo de amostra a ser comparada, suas propriedades e características. Neste texto vamos discutir um pouco o teste-z. Este tem uma aplicação bastante limitada, pois depende de condições que nem sempre (ou raramente) são obtidas em uma amostra. Contudo, por ser um teste bastante simples, sendo fácil compreender os fundamentos que estão por trás dele, é bastante utilizado em disciplinas básicas de laboratório e estatística. Antes disso vamos rever alguns conceitos de probabilidade e densidades de probabilidade.
Probabilidade e densidade de probabilidade
Pode-se definir a probabilidade [1,2] de se obter um determinado resultado como sendo a relação entre o número de vezes que este resultado é obtido em uma amostra e o tamanho desta amostra, quando esta é suficientemente grande, ou seja:

onde




É obvio que, quanto mais amplo o intervalo, maior a probabilidade de encontrar um resultado neste intervalo. Para eliminar essa dependência, define-se a função densidade de probabilidade (F.D.P.) de tal forma que a probabilidade de encontrar um resultado em um intervalo entre



Sendo



Por ter um significado de densidade, a função densidade de probabilidade é sempre positiva. Ademais, podemos escrever que, como a probabilidade de ocorrer qualquer evento é 1, a relação:

Deve ser sempre satisfeita. Em estatística encontramos diversas funções de densidade de probabilidade, tais como a binomial, poison, gaussiana, etc. [1,2], sendo esta última bastante comum, principalmente em experimentos didáticos.
Conhecendo-se a função densidade de probabilidade de uma determinada grandeza é fácil calcular probabilidades de determinado evento ocorrer. Por exemplo, podemos pensar em responder qual é a probabilidade de se obter, em uma medida, um valor inferior à


Ou, por exemplo, qual é a probabilidade de um determinado valor ser superior à


Da mesma forma, podemos nos perguntar qual é a probabilidade de encontrar


Vamos tomar como exemplo uma função densidade de probabilidade gaussiana de média zero e desvio padrão 1. Nas figuras 1 a 3 são mostrados alguns exemplos da relação entre a integral da F.D.P. e a probabilidade de obter um evento em determinada região.

Figura 1 - A área pintada corresponde à probabilidade de se obter um evento com


Figura 2 - A área pintada corresponde à probabilidade de se obter um evento com


Figura 3 - A área pintada corresponde à probabilidade de se obter um evento com

Teste de hipótese e o teste-z
Fazer um teste de hipótese [3-5] corresponde, em linhas gerais, à calcular a probabilidade de a sua amostra satisfazer uma determinada hipótese e, com base nesta probabilidade determinar a validade da hipótese efetuada. Um importante conceito envolvido em testes de hipótese é o nível de significância do seu resultado.Nível de significância
O nível de significância [4] (
Um cuidado importante: em muitas áreas da ciência, incluindo a física, é comum mostrar os níveis de significância em valores de



Em física, em particular em física nuclear e de partículas, é comum apresentar valores de significância em número de sigmas (










Figura 4 - Níveis de significância em uma gaussiana.









Figura 5 - Probabilidade acumulada para uma função gaussiana.
Na tabela 1 mostramos alguns valores de probabilidade acumulada para referência, por serem, em geral, os mais utilizados.
![]() |
![]() |



No dia a dia é comum utilizar


A escolha do nível de significância é importante porque estabelece o nível de rigor no teste de hipótese. Mais importante ainda é sempre relatar qual foi o nível de significância obtido na sua análise.
Mais a frente mostraremos alguns exemplos de como utilizar esta função na prática.
Teste de uma cauda ou duas caudas
Em um teste de hipótese estabelece-se um nível de significância

No teste de uma cauda, o nível de significância é referente à probabilidade de o resultado ser maior (ou menor) que um determinado valor. Em um teste de uma cauda,

Em um teste de duas caudas, o nível de significância é referente à probabilidade de o resultado estar distante do valor verdadeiro nas duas direções, simetricamente, como mostra a figura 3. Por exemplo, um teste de duas caudas com significância de 0.05 indica que há uma probabilidade de 0.025 de o seu resultado estar distante da média em uma direção e 0.025 dele estar distante da média na outra direção.
A escolha se o teste a ser feito é de uma cauda ou duas depende da hipótese a ser testada.
A escolha da hipótese
Antes de se fazer um teste de significância, deve-se estabelecer as hipóteses que serão testadas. Em geral escolhe-se duas hipóteses, a principal (ou hipótese nula, no jargão,


A aceleração obtida é compatível com a da gravidade medida pelo IAG? Neste caso a hipótese principal é


O valor obtido pelo meu grupo (1) é o mesmo que o obtido pelo outro grupo (2)? Neste caso, a hipótese principal é


Uma vez escolhida a hipótese a ser testada, devemos escolher o teste de hipótese que será realizado. Há vários testes disponíveis e a escolha de qual teste é o mais adequado depende do tipo de amostra que temos e do nosso conhecimento da F.D.P. desta amostra.
O teste-z
O teste-z é um teste de hipótese para um valor médio de uma amostra de tamanho


Então, à rigor, o teste-z nunca pode ser utilizado. Neste caso, deve-se utilizar o teste-t de Student [7], que veremos em momento oportuno. Contudo, na medida em que número de dados da amostra aumenta, o teste-t converge para o teste-z. Tipicamente uma amostra com tamanho maior que


O teste-z consiste em calcular uma variável



A importância de se conhecer o desvio padrão verdadeiro da amostra surge quando se calcula o valor




A melhor forma de explicar o teste-z é através de exemplos. Vamos fazer alguns, passo a passo.
Exemplo 1 - Comparando um resultado a uma expectativa
Foi realizado um experimento onde mediu-se a aceleração de um corpo em queda livre. Foram realizadas 30 medidas de aceleração e a análise estatística mostrou que o valor médio dessa amostra é 9.746 m/s2 com desvio padrão de 0.12 m/s2. A incerteza do valor médio, por conta disso é
O primeiro passo é identificar a hipótese nula



O segundo passo é definir o nível de significância para rejeitar esta hipótese. Isso depende de quão rigoroso você quer ser na rejeição da sua hipótese. Vamos adotar

A F.D.P. do valor médio da aceleração medida é assumida como sendo uma gaussiana de média




De acordo com o nível de significância de




Exemplo 2 - Comparando dois resultados experimentais
Neste exemplo vamos fazer a comparação entre dois resultados experimentais. Note que o teste-z só é válido se conhecermos o desvio padrão das F.D.P. de ambas medidas, caso contrário devemos utilizar o teste-t. A menos que os desvios padrão sejam estimados de amostras muito grandes de dados.No nosso exemplo, um grupo mediu a aceleração de queda de um número razoavelmente grande de dados e obteve



Neste caso, a hipótese nula é








Referências
- Tratamento estatístico de dados em física experimental, O. Helene, V. Vanin, Ed. Edgard Blucher ltda.
- Fundamentos da Teoria de erros, J. H. Vuolo, Ed. Edgard Blucher ltda.
- http://en.wikipedia.org/wiki/Statistical_hypothesis_testing
- http://en.wikipedia.org/wiki/Statistical_significance
- http://www.stat.yale.edu/Courses/1997-98/101/sigtest.htm
- http://en.wikipedia.org/wiki/One-_and_two-tailed_tests
- http://en.wikipedia.org/wiki/Student%27s_t-test
- Fundamentos da Teoria de erros, J. H. Vuolo, Ed. Edgard Blucher ltda.
No comments