O método dos mínimos quadrados e ajustes de funções lineares
Fazer gráficos de um observável em função de outro é bastante comum no dia a dia da pesquisa com o objetivo de se extrair alguma informação deste conjunto de dados. Por exemplo, de um gráfico de velocidade em função do tempo para a queda de um objeto pode-se extrair a aceleração do objeto. Do gráfico da massa em função do volume pode-se extrair a densidade do material. Os exemplos são muitos. Uma vez que os dados estão graficados, a extração das informações relevantes é feita através do ajuste de uma expressão matemática, ou função, a estes dados onde os parâmetros desta função correspondem à grandezas de interessa, tais como a aceleração, densidade, etc. Isso pode ser feito visualmente, com uma régua e intuição, mas atualmente é muito mais simples utilizar programas de análise gráfica. Há muitos disponíveis por ai. Como isso é feito? Qual o procedimento matemático que é utilizado para se determinar qual é o melhor conjunto de parâmetros que, em uma função matemática qualquer, descreve o comportamento dos dados da melhor forma possível? Há vários métodos estatísticos disponíveis. Vamos abordar o método dos mínimos quadrados. Fazer gráficos de um observável em função de outro é bastante comum no dia a dia da pesquisa com o objetivo de se extrair alguma informação deste conjunto de dados. Por exemplo, de um gráfico de velocidade em função do tempo para a queda de um objeto pode-se extrair a aceleração do objeto. Do gráfico da massa em função do volume pode-se extrair a densidade do material. Os exemplos são muitos. Uma vez que os dados estão graficados, a extração das informações relevantes é feita através do ajuste de uma expressão matemática, ou função, a estes dados onde os parâmetros desta função correspondem à grandezas de interessa, tais como a aceleração, densidade, etc. Isso pode ser feito visualmente, com uma régua e intuição, mas atualmente é muito mais simples utilizar programas de análise gráfica. Há muitos disponíveis por ai. Como isso é feito? Qual o procedimento matemático que é utilizado para se determinar qual é o melhor conjunto de parâmetros que, em uma função matemática qualquer, descreve o comportamento dos dados da melhor forma possível? Há vários métodos estatísticos disponíveis. Vamos abordar o método dos mínimos quadrados.
O método dos mínimos quadrados
Considere um conjunto de dados onde são incertezas na variável (mais a frente vamos ver como tratar casos onde há incertezas também em ). Podemos fazer um gráfico de em função de , obtendo algo similar à figura 1.Figura 1 - Gráfico de em função de .
Figura 2 - Ajuste de uma reta.
Figura 3 - Reta com valores de e que não descrevem os dados.
Vamos olhar então o nosso conjunto de dados , que consiste em pontos , independentes um do outro. Além disso, os valores de possuem funções densidade de probabilidade gaussianas em relação ao seu valor verdadeiro com desvio padrão . Os valores verdadeiros dependem do valor de . Neste caso, a probabilidade de se fazer uma medida é proporcional à esta função densidade de probabilidade, ou seja:
Queremos estimar, da melhor forma possível, os valores verdadeiros de tal forma que a probabilidade seja máxima. Vamos tentar descrever os valores verdadeiros por uma função , que depende de , com parâmetros , a serem determinados, ou seja:
A probabilidade total de encontrarmos o conjunto de dados medido consiste no produto da probabilidade de medir cada ponto , ou seja:
Concluimos que a expressão para a probabilidade total é:
Ajustar uma função a um conjunto de dados consiste, então, em determinar os valores dos parâmetros , conhecendo-se a fórmula para de modo a minimizar o valor para . Esté é o chamado método dos mínimos quadrados. Note que fizemos duas suposições importantes: a primeira é que os pontos são independentes um dos outros de modo que podemos calcular a probabilidade total como o produto das probabilidades individuais e elas são calculadas independentemente uma das outras. A segunda, mais importante, é que as funções densidade de probabilidade de cada ponto são gaussianas. Sem esta condição, nem sempre é possível maximizar a probabilidade minimizando o .
O método dos mínimos quadrados (MMQ) aplicado a alguns casos
Vamos então aplicar o método dos mínimos quadrados em alguns casos simples:- , ou seja, uma função constante;
- , ou seja, uma reta passando na origem;
- , ou seja, uma reta qualquer.
O MMQ para uma constante
Imagine um gráfico como o da figura 4. Aparentemente é uma constante, independentemente dos valores de . Neste caso, pode ser uma boa expressão para descrever os dados acima.Figura 4 - Alguns dados a serem ajustados.
Na figura 5 mostramos a função ajustada aos dados da figura 4. Note como os dados ficam distribuídos em torno da constante ajustada.
Figura 5 - Constante ajustada aos dados.
O MMQ para uma reta passando na origem
Imagine agora a situação na qual a função que queremos ajustar aos dados seja uma reta que passa na origem, . Devemos então achar a constante , que é o coeficiente angular da reta, utilizando o MMQ. Neste caso, o pode ser escrito como:O MMQ para uma reta qualquer
No caso de uma reta genérica, , devemos encontrar os valores de e que minimizam, simultaneamente, o dos dados obtidos em relação a esta função. Seguindo os exemplos anteriores, a expressão para o pode ser escrita como:Vou deixar como exercício a resolução das duas derivadas acima e também a resolução do sistema de equações que surge. É muito interessante que isso seja feito com calma e atenção. O MMQ é uma importante ferramenta de análise de dados e vai estar presente no dia a dia nosso. Resolvendo o sistema de equações encontra-se que:
Figura 6 - Ajuste de uma reta a pontos experimentais.
Incerteza dos parâmetros ajustados
Note que, como os parâmetros das funções são extraídos de um conjunto de dados, é natural pensar que flutuações estatísticas neste conjunto de dados afetem os valores dos parâmetros ajustados. Se repetirmos o mesmo experimento, com o mesmo procedimento, várias vezes, é natural imaginar que, a cada vez, um conjunto de parâmetros diferente será extraído. Ou seja, os parâmetros extraídos também estão sujeitos a flutuações e, consequentemente, possuem incertezas. Como obter as incertezas dos parâmetros ajustados?A incerteza dos parâmetros ajustados pode ser obtida através de propagação de incertezas. Sendo uma função onde cada medida possui uma incerteza , a incerteza de pode ser calculada através de:
Incerteza no ajuste de uma constante
Como vimos acima, se fizermos um ajuste de uma constante, ou seja, , aos dados, o MMQ resulta em:Incerteza no ajuste de uma reta passando pela origem
No caso de um ajuste de uma reta passando na orígem, , a constante , conforme deduzimos, vale:Incerteza no ajuste de uma reta qualquer
No caso de uma reta qualquer, , os parâmetros ajustados são dados por:Ajustes com incertezas na variável x
O MMQ que desenvolvemos até aqui supôs que ou seja, não há incertezas nas variáveis . Mas em muitas situações práticas, tanto as variáveis quanto possuem incertezas. O método formal para isso é chamado de método dos mínimos quadrados totais (ver esse link). Vamos aqui tentar simplificar um pouco e tentar compreender a ideia por trás de uma minimização onde consideramos incertezas em e .No MMQ somente com incertezas em nós calculamos os resíduos entre os pontos experimentais e a função ajustada, dados por:
O que estamos fazendo, quando obtemos os resíduos desta forma, é calcular a "distância" entre os pontos experimentais e a função ajustada em unidades de incerteza. Quando só há incerteza em , a incerteza da diferença entre e é dada pela própria incerteza em ou seja, .
Quando há incerteza em , a o valor da função em está sujeita a uma incerteza. Sabendo que a diferença entre o ponto experimental e a função ajustada pode ser escrita como:
- Faça o ajuste da função considerando apenas as incertezas em , ou seja, assuma que .
- De posse dos parâmetros ajustados, calcule incertezas "efetivas" para dadas por:
- Faça novamente o ajuste da função considerando agora que as incertezas em são as efetivas, calculadas no passo (2).
- De posse dos novos parâmetros ajustados, repita os passos (2) e (3) até que a diferença entre uma repetição e a anterior para os valores dos parâmetros ajustados seja pequeno, se comparada à incerteza desses parâmetros.
É um método trabalhoso mas com uma ou duas interações, em geral, a resposta converge e o resultado é bastante satisfatório do ponto de vista prático.
Parabéns pelo ótimo artigo. Ele deixou o assunto bem mais claro e simples para mim.