Diretorio de trabalho: ~/Test/test/
# Script de preparação da proteína com solvente qualquer
# antechamber: script para calcular as cargas atômicas e os parâmetros de uma estrutura não reconhecida pelo AMBER (neste caso um alcano - hexano)
antechamber -i hexane.pdb -fi pdb -o hexane.mol2 -fo mol2 -c bcc -s 2
parmchk -i hexane.mol2 -f mol2 -o hexane.frcmod
# Conferir as cargas (a soma neste caso tem que ser zero)
cat hexane.mol2 | awk '{ sum+=$9} END {print sum}'
# Iniciar o script leap
tleap -f leaprc.ff99SB
source leaprc.gaff
# Carregar o arquivo com a molécula e chamar de LIG
LIG = loadmol2 hexane.mol2
#loadamberparams hexane.frcmod
saveoff LIG hexane.lib
check LIG
# Carregar a proteína e chamar de LIP
LIP = loadpdb LipC12.pdb
check LIP
# Adicionar os contra íons
addions LIP Na+ 0
saveoff LIP prot_CI.lib
saveamberparm LIP prot_CI.top prot_CI.inpcrd
# Solvatar a proteína (LIP) com hexanos (LIG)
solvatebox LIP LIG 14
saveoff LIP prot_solv.lib
check LIP
saveamberparm LIP prot_solv.top prot_solv.inpcrd
# Observe que a caixa está pequena mas para teste vamos deixar assim mesmo.....
# Adicionar o numero de resíduos em constraint da proteína nos arquivos min1.in e md1.in (290 resíduos)
# Aumentar o tempo de minimização do solvente.
# Verificar a densidade do hexano a temperatura ambiente
Pesquisar este blog
sexta-feira, 27 de maio de 2016
sábado, 14 de maio de 2016
Estudo novas Análises: RMSF - Raio de giro - Matriz de covariância
Root Mean Square Fluctuation (RMSF)
Calcula a flutuação dos resíduos o qual pode ser comparado com o B-factor da proteína cristalizada.
Compara as distâncias por resíduo (-res) durante uma trajetória.
RMSF é diferente do RMSD porque o RMSD mostra a variação global ao longo do tempo.
# Calcular o B-factor (selecionar beta no VMD)
g_rmsf -f 2.trr -s prot.pdb -o rmsf.xvg -od rmsdev.xvg -oq -ox xaver.pdb -res
g_rmsf -f 2.trr -s prot.pdb -o -od -oq -ox -res
-f trajetória
-s frame de referência ou topologia
-o output em xmgrace
-od output do desvio
-oq insere o b-factor no frame inicial se este tiver um nome (-oq aaa.pdb)
-ox grava a estrutura média e insere o b-factor se o -oq estiver habilitado
-[no]res no Calculate averages for each residue
-[no]aniso no Compute anisotropic termperature factors
-[no]fit (default) Do a least squares superposition before computing
RMSF. Without this you must make sure that the
reference structure and the trajectory match.
Não entendi a função do -aniso mas acredito que seja um método mais refinado para a comparação com o raio-x. Veja por ex. o paper
"What can we Learn from Anisotropic Temperature Factors"
http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.112.4437&rep=rep1&type=pdf
"X-ray refinement significantly underestimates the level of microscopic heterogeneity in biomolecular crystals" doi:10.1038/ncomms4220
#) FLUTUAÇÃO POR RESÍDUO
A) Em Toda a trajetória
b) Projetada por autovetor (modos normais de vibração)
Calcula a flutuação dos resíduos o qual pode ser comparado com o B-factor da proteína cristalizada.
Compara as distâncias por resíduo (-res) durante uma trajetória.
RMSF é diferente do RMSD porque o RMSD mostra a variação global ao longo do tempo.
# Calcular o B-factor (selecionar beta no VMD)
g_rmsf -f 2.trr -s prot.pdb -o rmsf.xvg -od rmsdev.xvg -oq -ox xaver.pdb -res
g_rmsf -f 2.trr -s prot.pdb -o -od -oq -ox -res
-f trajetória
-s frame de referência ou topologia
-o output em xmgrace
-od output do desvio
-oq insere o b-factor no frame inicial se este tiver um nome (-oq aaa.pdb)
-ox grava a estrutura média e insere o b-factor se o -oq estiver habilitado
-[no]res no Calculate averages for each residue
-[no]aniso no Compute anisotropic termperature factors
-[no]fit (default) Do a least squares superposition before computing
RMSF. Without this you must make sure that the
reference structure and the trajectory match.
"What can we Learn from Anisotropic Temperature Factors"
http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.112.4437&rep=rep1&type=pdf
"X-ray refinement significantly underestimates the level of microscopic heterogeneity in biomolecular crystals" doi:10.1038/ncomms4220
gnuplot
set multiplot layout 2,1
p "rmsf.xvg" u 1:2 w l
p "rmsdev.xvg" u 1:2 w l
gnuplot
set multiplot layout 2,2
set yrange [0:0.6]
#set yrange [0:0.24]
p "grupo_2/rmsf.xvg" u 1:2 w l
#set yrange [0:0.6]
p "grupo_2/rmsdev.xvg" u 1:2 w l
#set yrange [0:0.24]
p "grupo_3/rmsf.xvg" u 1:2 w l
#set yrange [0:0.6]
p "grupo_3/rmsdev.xvg" u 1:2 w l
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
Raio de giro
g_gyrate -f 2.trr -s prot.pdb -o gyrate_3.xvg
A análise de covariância é também chamada de análise de componentes principais (principal component analysis - PCA) ou essential dynamics.
Uma boa descrição deste tópico pode ser encontrada no manual do Gromacs página 211 (8.10 Covariance analysis). Também o paper "Essential Dynamics of Proteins" Amandei et al.
g_covar -f 2.trr -s prot.pdb -xpm -xpma
Do resultado do output este utilizou como referência a minha estrutura inicial (como pedir para utilizar a estrutura média por default?). Selecionado o grupo dos Calfa que tem 321 espécies. Como é construída uma matriz 3Nx3N a matriz criada apresentou 963 linhas/colunas. No arquivo eigenvec.trr constam todas as estruturas obtidas (autovetores - 963 estruturas) mas apenas 2 são compreensíveis.
O arquivo dos autovalores (eigenval.xvg) em função do índice apresenta os dois mais significativos autovalores (em nm²):
1 0.45924
2 0.249308
A análise dos autovetores é realizada através do programa g_anaeig
Com os autovetores obtidos através do comando g_covar, utiliza-se o eingenvector.trr, agora faz-se a projeção da trajetória nos modos normais de vibração.
1) Projetar a trajetória em determinado autovetor:
Neste exemplo vamos projetar a trajetória do tutorial (http://www3.mpibpc.mpg.de/groups/de_groot/compbio1/p4/index.html) aos autovetores 1,2,3,4,5,6,7,8 e 53 com o comando g_anaeig separadamente. Serão utilizados 100 frames para representar tais autovetores.
g_anaeig -s ref.pdb -f md1_backbone.xtc -extr 1.pdb -first 1 -last 1 -nframes 100
g_anaeig -s ref.pdb -f md1_backbone.xtc -extr 2.pdb -first 2 -last 2 -nframes 100
set multiplot layout 2,1
p "rmsf.xvg" u 1:2 w l
p "rmsdev.xvg" u 1:2 w l
gnuplot
set multiplot layout 2,2
set yrange [0:0.6]
#set yrange [0:0.24]
p "grupo_2/rmsf.xvg" u 1:2 w l
#set yrange [0:0.6]
p "grupo_2/rmsdev.xvg" u 1:2 w l
#set yrange [0:0.24]
p "grupo_3/rmsf.xvg" u 1:2 w l
#set yrange [0:0.6]
p "grupo_3/rmsdev.xvg" u 1:2 w l
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
Raio de giro
g_gyrate -f 2.trr -s prot.pdb -o gyrate_3.xvg
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
Análise de covariâncias
Uma boa descrição deste tópico pode ser encontrada no manual do Gromacs página 211 (8.10 Covariance analysis). Também o paper "Essential Dynamics of Proteins" Amandei et al.
g_covar -f 2.trr -s prot.pdb -xpm -xpma
Do resultado do output este utilizou como referência a minha estrutura inicial (como pedir para utilizar a estrutura média por default?). Selecionado o grupo dos Calfa que tem 321 espécies. Como é construída uma matriz 3Nx3N a matriz criada apresentou 963 linhas/colunas. No arquivo eigenvec.trr constam todas as estruturas obtidas (autovetores - 963 estruturas) mas apenas 2 são compreensíveis.
O arquivo dos autovalores (eigenval.xvg) em função do índice apresenta os dois mais significativos autovalores (em nm²):
1 0.45924
2 0.249308
Do paper "Essential Dynamics of Proteins" Amandei et al.:
Dos autovetores obtidos menos de 1% apresentam movimentos significativos para os movimentos globais da proteína.
A análise dos autovetores é realizada através do programa g_anaeig
1) Projetar a trajetória em determinado autovetor:
Neste exemplo vamos projetar a trajetória do tutorial (http://www3.mpibpc.mpg.de/groups/de_groot/compbio1/p4/index.html) aos autovetores 1,2,3,4,5,6,7,8 e 53 com o comando g_anaeig separadamente. Serão utilizados 100 frames para representar tais autovetores.
g_anaeig -s ref.pdb -f md1_backbone.xtc -extr 1.pdb -first 1 -last 1 -nframes 100
g_anaeig -s ref.pdb -f md1_backbone.xtc -extr 2.pdb -first 2 -last 2 -nframes 100
g_anaeig -s ref.pdb -f md1_backbone.xtc -extr 3.pdb -first 3 -last 3 -nframes 100
(...)
g_anaeig -s ref.pdb -f md1_backbone.xtc -extr 53.pdb -first 53 -last 53 -nframes 100
2) Para uma análise mais quantitativa, será projetada a trajetória por autovetor em função do tempo. Neste gráfico visualizamos a flutuação da direção do autovetor ao longo do tempo:
g_anaeig -s ref.pdb -f md1_backbone.xtc -proj 1.xvg -first 1 -last 1
g_anaeig -s ref.pdb -f md1_backbone.xtc -proj 2.xvg -first 2 -last 2
g_anaeig -s ref.pdb -f md1_backbone.xtc -proj 3.xvg -first 3 -last 3
g_anaeig -s ref.pdb -f md1_backbone.xtc -proj 53.xvg -first 53 -last 53
![]() |
Projeção dos autovetores 1,2,3 e 53 ao longo do tempo. Observe que o autovetor 53 apresenta flutuação local ao longo da trajetória enquanto os demais (1,2 e 3) tem maior distribuição de 4 a -3 nm. |
Estes resultados podem ser comparados com o paper "Essential Dynamics of Proteins" - Protein 17: 412 (1993).
2) Análise da correlação entre os autovetores em 2D
g_anaeig -s ref.pdb -f md1_backbone.xtc -2d 1_2.xvg -first 1 -last 2
g_anaeig -s ref.pdb -f md1_backbone.xtc -2d 1_10.xvg -first 1 -last 10
g_anaeig -s ref.pdb -f md1_backbone.xtc -2d 1_50.xvg -first 1 -last 50
g_anaeig -s ref.pdb -f md1_backbone.xtc -2d 1_100.xvg -first 1 -last 100
#) FLUTUAÇÃO POR RESÍDUO
A) Em Toda a trajetória
b) Projetada por autovetor (modos normais de vibração)
Assinar:
Postagens (Atom)