Undergraduate Thesis

Métodos de Monte-Carlo

 

Neste capitulo abordaremos as diversas características fundamentais dos chamados Métodos de Monte-Carlo (MC). Este tipo de métodos é usualmente utilizado por investigadores em diversas áreas, mas sempre com o objectivo de tentar chegar a resultados que de outra forma seriam impossíveis, ou pelo menos extremamente difíceis de obter. A abordagem que iremos seguir focar-se-á principalmente na utilização desta metodologia para a realização de simulações computacionais de sistemas físicos, que actualmente não têm solução analítica conhecida, nomeadamente sistemas com uma evolução estocástica.

Os métodos MC têm inerentes à sua própria natureza uma convergência bastante lenta, da ordem de $ 1/\sqrt{n}$, pelo que ao utilizá-los temos que tomar isso em consideração e tomar precauções para tornar a convergência o mais rápida possível e evitar que o nosso algoritmo se torne lento demais para as nossa necessidades. Esta difícil convergência, impõem também que só se recorra a este tipo de métodos quando não é de todo possível obter os mesmos resultados por outra forma3.1.


A equação mestra

Modelos estocásticos em que as transições de uma dada configuração $ s$ para outra configuração $ s'$ ocorrem espontaneamente a uma taxa 3.2 $ w_{s\to s'}\ge 0$, têm uma distribuição de probabilidade $ P_{t}(s)$ que evolui deterministicamente no tempo de acordo com uma equação mestra ( Sec. 3.1). A eq. mestra é uma equação de derivadas parciais que descreve o fluxo de probabilidade para originar e para destruir uma determinada configuração $ s$ do sistema.

$\displaystyle \frac{\partial}{\partial t}P_{t}(s)=\underbrace{\sum_{s'}w_{s'\to...
...}_{\hbox{criação}}-\underbrace{\sum_{s}w_{s\to s'}P_{t}(s)}_{\hbox{destruição}}$ (3.1)

Os termos de criação e destruição inter-relacionam-se, por forma a que a condição de normalização $ \sum_{s}P_{t}(s)=1$ seja sempre verificada. Uma vez que a variação temporal de $ P_{t}(s)$ esta completamente determinada pela distribuição actual de probabilidades num dado instante t, a equação mestra descreve um processo de Markov, o que significa que o processo em si não tem memória intrínseca. É também importante notar que os coeficientes $ w_{s\to s'}$ são taxas e não probabilidades, pelo que podem tomar valores superiores a 1 e podem ser reescalonados alterando a escala de tempo.

No equilíbrio, $ \frac{\partial}{\partial t}P_{t}(s)=0$ e o sistema obedece à chamada condição de balanço detalhado3.3:

$\displaystyle \sum_{s'}w_{s'\to s}P_{t}(s')=\sum_{s}w_{s\to s'}P_{t}(s)$ (3.2)


Tipos de amostragem

Nesta secção tentaremos ilustrar as diferenças e diferentes aplicações das chamadas amostragens simples e de importância 3.4 .


Amostragem simples

As técnicas de Monte-Carlo usam-se (como já foi referido) para efectuar simulações de sistemas macroscópicos com um numero muito grande 3.5 de graus de liberdade, com o objectivo de obter valores para determinadas grandezas macroscópicas, valores esses que são geralmente valores médios, para todas as configurações acessíveis para uma dada energia. Em Física Estatística define-se a média de um observável como sendo:

$\displaystyle \langle A(x)\rangle=\frac{1}{Z}\int_S\mathrm{d}xA(x)e^{-\beta H(x)}$ (3.3)

em que:

$\displaystyle Z=\int_S e^{-\beta H(x)}\mathrm{d}{\bf r}$ (3.4)

é a chamada função de partição do sistema, $ H(x)$ representa o Hamiltoniano e S denota a integração sobre todo o espaço de fase. No entanto, na prática, nunca é possível calcular exactamente o integral da Eq. 3.3, pelo que somos obrigados a usar apenas um numero finito de pontos do espaço de fase $ \{x_1,x_2,\ldots,x_n\}$.

Se escolhermos os pontos utilizados segundo uma rede regular, obtemos uma distribuição irregular no espaço de fase. Se no entanto, escolhermos os nossos pontos aleatoriamente segundo uma distribuição uniforme, obtemos a chamada amostragem simples, segundo a qual Eq. 3.3 se passa a escrever, no limite $ M\to\infty$ como:

$\displaystyle \langle A(x)\rangle =\frac{\sum_{i=1}^{M}A(x_i)e^{-\beta H(x_i)}}{\sum_{i=1}^{M}e^{-\beta H(x_i)}}$ (3.5)

Esta forma de escolher os pontos do espaço de fase, também melhora os resultados obtidos, mas á custa de uma grande tempo de convergência. Em principio, se em vez dos pontos estarem uniformemente distribuídos nos espaço de fase, eles obedecem a uma determinada distribuição $ P(x)$, por forma a privilegiar determinados pontos, os resultados convergiriam mais rapidamente. Neste caso, a nossa aproximação Eq. 3.5 tomaria a forma:

$\displaystyle \langle A(x)\rangle =\frac{\sum_{i=1}^{M}A(x_i)e^{-\beta H(x_i)}/P(x)}{\sum_{i=1}^{M}e^{-\beta H(x_i)}/P(x)}$ (3.6)


Amostragem de importância

A escolha mais obvia para $ P(x)$ na Eq. 3.6  é $ P(x)=e^{-\beta H(x)}$, por forma simplificar a expressão ao máximo, obtendo-se neste caso, uma média aritmética usual:

$\displaystyle \langle A(x)\rangle =\frac{1}{M}\sum_{i=1}^{M}A(x_i)$ (3.7)

Esta forma de amostragem do espaço de fase, é conhecida por amostragem de importância, uma vez que atribui um determinado grau de importância a cada estado possível do sistema, por forma a que os estados mais prováveis contem mais vezes e os menos prováveis contem menos. O problema agora é construir um processo para implementar a amostragem de importância. Metropolis et al.[25] sugeriu o uso de uma cadeia de Markov3.6, com probabilidade de transição $ W_{s\to s'}$, o que no limite $ M\to\infty$ implica que $ P(x)$ converja para:

$\displaystyle P_{eq}(x_l)=\frac{e^{-\beta H(x_l)}}{Z}$

Para tal é suficiente, embora em geral não seja necessário, impor a condição de balanço detalhado 3.7 .

$\displaystyle w_{s'\to s}P_{t}(s')=w_{s\to s'}P_{t}(s)$ (3.8)

Daqui é trivial mostrar que:

$\displaystyle \frac{w_(s\to s')}{w_(s'\to s)}=e^{-\beta\delta H}$ (3.9)

onde $ \delta h$ representa a variação de energia entre os dois estados considerados. É obvio que a Eq. 3.9 não define unicamente $ W_{s\to s'}$ e como tal existem várias propostas para esta taxa de transição, sendo as mais conhecidas:

$\displaystyle W_{s\to s'}=\left\{
 \begin{array}{ll}
 \frac{1}{\tau_s}e^{-\beta...
...i)>0\\ 
 &\\ 
 \frac{1}{\tau_s} & \hbox{se}~\delta H(x_i)<0
 \end{array}\right.$ (3.10)

$\displaystyle W_{s\to s'}=\frac{1}{2\tau_s}[1-\tanh(\beta\delta H)]$ (3.11)

Condições Fronteira

Em todas as simulações realizadas, pretendeu-se simular um sistema em condições o mais realistas possíveis, por forma a permitir que os resultados obtidos possam ser comparados com os obtidos experimentalmente. Como é sabido, as amostras materiais utilizadas na realização de experiências, por muito pequenas que seja, contêm sempre um numero de partículas $ \sim 10^{23}$.
Figure 3.1: Realização das condições fronteira periódicas num sistema a 1D. a) Sistema de tamanho $ L$ sem condições fronteira periódicas. b) O mesmo sistema com condições fronteira periódicas, da forma como é ``visto'' por uma partícula que nele se encontre.
\resizebox{10cm}{!}{
\includegraphics{figs/boundary-1d}}
Figure 3.2: Realização das condições fronteira periódicas num sistema a 2D. a) Sistema de $ L \times L$ da forma como é visto por uma partícula na ausência de periodicidade. b) O sistema, visto na mesma perspectiva, quando é introduzida a periodicidade.
\resizebox{10cm}{!}{
\includegraphics{figs/boundary-2d}}
Este facto levanta um sério problema na realização de simulações, pois estamos limitados pela memória disponível numa maquina, e pela velocidade da mesma. Apesar de o tamanho da memória poder ser considerado praticamente ilimitado para todos os efeitos práticos, o mesmo já não pode ser dito acerca da velocidade, e trabalhar com muitas partículas, implica gastar muito tempo numa única simulação. O que tende a limitar o numero de repetições que é possível realizar em tempo útil, e portanto, a precisão dos resultados obtidos. Pretende-se portanto, simular um sistema de tamanho finito, da forma mais eficiente e realista possível. A forma mais utilizada de tentar atingir este fim, é recorrendo a condições fronteira periódicas. Este método consiste em ``unir'' os extremos opostos do sistema, por forma a que durante a simulação se minimize o efeito do tamanho finito do sistema. Esta periodicidade do sistema resolve também um outro problema que ocorre no caso de se considerar difusão, que é o facto de sem ela, o sistema apresentar um inicio e um fim, o que tende a limitar o movimento das partículas e a perturbar a sua disposição espacial dentro do próprio sistema3.8. Estas condições têm que ser impostas, não só quando se considera qualquer forma de difusão das partículas, mas também quando se introduz o efeito de um potencial sobre o sistema3.9, caso contrário, o potencial efectivo sentido pelas partículas teria um ``cut-off'' a meio do sistema, o que levaria a uma irregularidade da função de correlação para distâncias de $ L/2$.


 

© Copyright 2004 Bruno Goncalves - All rights reserved

Valid XhtmlValid CSS