Pesquisar este blog

sábado, 3 de novembro de 2018

Vina RMSD

rmsd/lb (RMSD lower bound) better for symmetric ligand


rmsd/ub  (RMSD upper bound) very flexible, asymmetric molecules



So, for example, a highly symmetrical rigid ligand could be rotated relative to a reference
conformation such that the new conformation is exactly equivalent to the reference
conformation (think of a benzene ring flipped 180 degrees).

However, the internal numbering of atoms doesn't change during the docking run, so the rmsd/ub algorithm,
which matches identically labeled atoms (rather than similar or equivalent atoms) would
yield a significant rmsd, whereas the rmsd/lb algorithm would yield a more realistic rmsd of zero in this case.

quinta-feira, 12 de outubro de 2017

Compostos do Paulo Daqbi

# antechamber: script para calcular as cargas atômicas e os parâmetros de uma estrutura não reconhecida pelo AMBER (neste caso o tolueno (solvente) e o 3amino (soluto))
# Ao gravar os arquivos do suluto e do solvente no pdb verifique se ha um nome (residue name) no arquivo para ser identificado posteriormente pelo programa tleap
## Preparar o frcmod do solvente (tolueno)
antechamber -i tolueno.pdb -fi pdb -o tolueno.mol2 -fo mol2 -c bcc -s 2
parmchk -i tolueno.mol2 -f mol2 -o tolueno.frcmod

# Conferir as cargas (a soma neste caso tem que ser zero)
cat  tolueno.mol2 | awk '{ sum+=$9} END {print sum}'



## Preparar o frcmod do soluto (3amino)
antechamber -i 3amino.pdb -fi pdb -o 3amino.mol2 -fo mol2 -c bcc -s 2
parmchk -i 3amino.mol2 -f mol2 -o 3amino.frcmod

# Conferir as cargas (a soma neste caso tem que ser zero)
cat  3amino.mol2 | awk '{ sum+=$9} END {print sum}'


## copiar os arquivos mol2 e frcmod do solvente e do soluto para outro diretorio

# Iniciar o script leap
tleap -f leaprc.ff99SB
source leaprc.gaff



# Carregar o arquivo com a molécula do solvente (UNK)
UNK = loadmol2 tolueno.mol2
#loadamberparams tolueno.frcmod
saveoff UNK tolueno.lib
check UNK



# Carregar o arquivo com a molécula do soluto (AMI)
AMI = loadmol2 3amino.mol2
#loadamberparams 3amino.frcmod
saveoff AMI 3amino.lib
check AMI




# Solvatar o sistema
#solvatebox AMI TIP3PBOX 20
solvatebox AMI UNK 20
saveoff AMI prot_solv.lib
check AMI
saveamberparm AMI prot_solv.top prot_solv.inpcrd
savepdb AMI prot.pdb


mpirun -np 8 sander.MPI -O -i min1.in -o min1.out -c prot_solv.inpcrd -p prot_solv.top -r 1.rst -ref prot_solv.inpcrd -inf 1.info &
mpirun -np 8 sander.MPI -O -i min2.in -o min2.out -c 1.rst -p prot_solv.top -r 2.rst -inf 2.info &
mpirun -np 8 sander.MPI -O -i md1.in -p prot_solv.top -c 2.rst -ref 2.rst -o md1.out -r 3.rst -x 3.crd -e 3.en -inf 3.info &
mpirun -np 8 sander.MPI -O -i md2.in -p prot_solv.top -c 3.rst -o md2.out -r 4.rst -x 4.crd -e 4.en -inf 4.info &



terça-feira, 27 de dezembro de 2016

Molécula sintética com o maior momento de dipolo elétrico já medido

This hexasubstituted benzene has a dipole moment of 14.1 debye, which is comparable with ionic species such as potassium bromide at 10.5 debye.

The team hopes that their compound’s record-breaking dipole moment might help to make solar cell semiconductors more efficient. Compounds with large dipoles also have potential applications in optoelectronics as they interact with and can alter the light’s electric field.

From: https://www.chemistryworld.com/news/a-small-molecules-big-moment/9432.article

Water: 1.85 D
HF: 1.82 D
HCl: 1.08 D
HBr: 0.82
HI: 0.44

From: http://chem.libretexts.org/Core/Physical_and_Theoretical_Chemistry/Physical_Properties_of_Matter/Atomic_and_Molecular_Properties/Dipole_Moments

Preparation of an ion with the highest calculated proton affinity: ortho-diethynylbenzene dianion



sexta-feira, 27 de maio de 2016

Preparação do solvente - hexano

Diretorio de trabalho: ~/Test/test/

# Script de preparação da proteína com solvente qualquer

# antechamber: script para calcular as cargas atômicas e os parâmetros de uma estrutura não reconhecida pelo AMBER (neste caso um alcano - hexano)
antechamber -i hexane.pdb -fi pdb -o hexane.mol2 -fo mol2 -c bcc -s 2 
parmchk -i hexane.mol2 -f mol2 -o hexane.frcmod

# Conferir as cargas (a soma neste caso tem que ser zero)
cat  hexane.mol2 | awk '{ sum+=$9} END {print sum}'

# Iniciar o script leap
tleap -f leaprc.ff99SB
source leaprc.gaff

# Carregar o arquivo com a molécula e chamar de LIG
LIG = loadmol2 hexane.mol2
#loadamberparams hexane.frcmod
saveoff LIG hexane.lib
check LIG

# Carregar a proteína e chamar de LIP
LIP = loadpdb LipC12.pdb
check LIP

# Adicionar os contra íons
addions LIP Na+ 0
saveoff LIP prot_CI.lib
saveamberparm LIP prot_CI.top prot_CI.inpcrd

# Solvatar a proteína (LIP) com hexanos (LIG)
solvatebox LIP LIG 14
saveoff LIP prot_solv.lib
check LIP
saveamberparm LIP prot_solv.top prot_solv.inpcrd


# Observe que a caixa está pequena mas para teste vamos deixar assim mesmo.....

# Adicionar o numero de resíduos em constraint da proteína nos arquivos min1.in e md1.in (290 resíduos)
# Aumentar o tempo de minimização do solvente.

# Verificar a densidade do hexano a temperatura ambiente

sábado, 14 de maio de 2016

Estudo novas Análises: RMSF - Raio de giro - Matriz de covariância

Root Mean Square Fluctuation (RMSF)

Calcula a flutuação dos resíduos o qual pode ser comparado com o B-factor da proteína cristalizada.
Compara as distâncias por resíduo (-res) durante uma trajetória.


RMSF é diferente do RMSD porque o RMSD mostra a variação global ao longo do tempo.

# Calcular o B-factor (selecionar beta no VMD)
g_rmsf -f 2.trr -s prot.pdb -o rmsf.xvg -od rmsdev.xvg -oq -ox xaver.pdb -res
g_rmsf -f 2.trr -s prot.pdb -o -od -oq -ox -res

-f trajetória
-s frame de referência ou topologia
-o output em xmgrace
-od output do desvio
-oq insere o b-factor no frame inicial se este tiver um nome (-oq aaa.pdb)
-ox grava a estrutura média e insere o b-factor se o -oq estiver habilitado
-[no]res       no      Calculate averages for each residue
-[no]aniso   no      Compute anisotropic termperature factors
-[no]fit     (default)     Do a least squares superposition before computing
                            RMSF. Without this you must make sure that the
                            reference structure and the trajectory match.



Não entendi a função do -aniso mas acredito que seja um método mais refinado para a comparação com o raio-x. Veja por ex. o paper

"What can we Learn from Anisotropic Temperature Factors"
http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.112.4437&rep=rep1&type=pdf

"X-ray refinement significantly underestimates the level of microscopic heterogeneity in biomolecular crystals" doi:10.1038/ncomms4220


gnuplot
set multiplot layout 2,1
p "rmsf.xvg" u 1:2 w l
p "rmsdev.xvg" u 1:2 w l



gnuplot
set multiplot layout 2,2
set yrange [0:0.6]
#set yrange [0:0.24]
p "grupo_2/rmsf.xvg" u 1:2 w l
#set yrange [0:0.6]
p "grupo_2/rmsdev.xvg" u 1:2 w l
#set yrange [0:0.24]
p "grupo_3/rmsf.xvg" u 1:2 w l
#set yrange [0:0.6]
p "grupo_3/rmsdev.xvg" u 1:2 w l



XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

Raio de giro
g_gyrate -f 2.trr -s prot.pdb -o gyrate_3.xvg

XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

Análise de covariâncias

A análise de covariância é também chamada de análise de componentes principais (principal component analysis - PCA) ou essential dynamics.


Uma boa descrição deste tópico pode ser encontrada no manual do Gromacs página 211 (8.10 Covariance analysis). Também o paper "Essential Dynamics of Proteins" Amandei et al.

g_covar -f 2.trr -s prot.pdb -xpm -xpma

Do resultado do output este utilizou como referência a minha estrutura inicial (como pedir para utilizar a estrutura média por default?).  Selecionado o grupo dos Calfa que tem 321 espécies. Como é construída uma matriz 3Nx3N a matriz criada apresentou 963 linhas/colunas. No arquivo eigenvec.trr constam todas as estruturas obtidas (autovetores -  963 estruturas) mas apenas 2 são compreensíveis.

O arquivo dos autovalores (eigenval.xvg) em função do índice apresenta os dois mais significativos autovalores (em nm²):
         1 0.45924
         2 0.249308

Do paper "Essential Dynamics of Proteins" Amandei et al.:
Dos autovetores obtidos menos de 1% apresentam movimentos significativos para os movimentos globais da proteína.

A análise dos autovetores é realizada através do programa g_anaeig
Com os autovetores obtidos através do comando g_covar, utiliza-se o eingenvector.trr, agora faz-se a projeção da trajetória nos modos normais de vibração.

1) Projetar a trajetória em determinado autovetor:
Neste exemplo vamos projetar a trajetória do tutorial (http://www3.mpibpc.mpg.de/groups/de_groot/compbio1/p4/index.html)  aos autovetores 1,2,3,4,5,6,7,8 e 53 com o comando g_anaeig separadamente. Serão utilizados 100 frames para representar tais autovetores.

g_anaeig -s ref.pdb -f md1_backbone.xtc -extr 1.pdb -first 1 -last 1 -nframes 100
g_anaeig -s ref.pdb -f md1_backbone.xtc -extr 2.pdb -first 2 -last 2 -nframes 100
g_anaeig -s ref.pdb -f md1_backbone.xtc -extr 3.pdb -first 3 -last 3 -nframes 100
(...)
g_anaeig -s ref.pdb -f md1_backbone.xtc -extr 53.pdb -first 53 -last 53 -nframes 100

2) Para uma análise mais quantitativa, será projetada a trajetória por autovetor em função do tempo. Neste gráfico visualizamos a flutuação da direção do autovetor ao longo do tempo:

g_anaeig -s ref.pdb -f md1_backbone.xtc -proj 1.xvg -first 1 -last 1
g_anaeig -s ref.pdb -f md1_backbone.xtc -proj 2.xvg -first 2 -last 2
g_anaeig -s ref.pdb -f md1_backbone.xtc -proj 3.xvg -first 3 -last 3
g_anaeig -s ref.pdb -f md1_backbone.xtc -proj 53.xvg -first 53 -last 53

Projeção dos autovetores 1,2,3 e 53 ao longo do tempo. Observe que o autovetor 53 apresenta flutuação local ao longo da trajetória enquanto os demais (1,2 e 3) tem maior distribuição de 4 a -3 nm.

Estes resultados podem ser comparados com o paper "Essential Dynamics of Proteins" - Protein 17: 412 (1993).

2) Análise da correlação entre os autovetores em 2D

g_anaeig -s ref.pdb -f md1_backbone.xtc -2d 1_2.xvg -first 1 -last 2
g_anaeig -s ref.pdb -f md1_backbone.xtc -2d 1_10.xvg -first 1 -last 10
g_anaeig -s ref.pdb -f md1_backbone.xtc -2d 1_50.xvg -first 1 -last 50
g_anaeig -s ref.pdb -f md1_backbone.xtc -2d 1_100.xvg -first 1 -last 100


Os gráficos acima representam o autovetor 1 com 2 e 1 com 10. Observe que há correlação nos movimentos especialmente entre os autovetores 1 e 2. Nas figuras da parte de baixo, os gráficos representam os autovetores 1 com 50 e 1 com 100. Observe que a correlação entre os movimentos de 1 e 100 são quase zero, mostrando que s movimentos estão bastante desacoplados.


#) FLUTUAÇÃO POR RESÍDUO
A) Em Toda a trajetória
b) Projetada por autovetor (modos normais de vibração)

quarta-feira, 23 de setembro de 2015

Partial Charges - Docking

Adição de cargas via 

Open BABEL
Não é possível incluir carga nem multiplicidade. Há "atom types" pré definidos para o gasteiger e grupos químicos como O- e metais não estão incluídos. Há outros métodos para atribuir carga que não são adequados para o Autodock.

Antechamber
É possível incluir carga e multiplicidade mas há os mesmos problemas dos "atom types". Há outras opções de cargas que não reconhecem o metal.

MOPAC (Coulson charges)
É possível incluir carga e multiplicidade. Apresenta valores pra energia de ligação (complexo+proteína) na ordem de -6.6 kcal/mol

ESP e RESP
Método mais adequado para o cálculo das cargas parciais mas com resultados incompatíveis para ligantes com metal. Apresenta valores pra energia de ligação (complexo+proteína) na ordem de -5.0 kcal/mol

Autodock (gasteiger)
Não reconhece o metal nem a carga do ligante

________________________________________________

OPEN BABEL:

obabel -L charges

gasteiger    Assign Gasteiger-Marsili sigma partial charges
mmff94       Assign MMFF94 partial charges
qeq    Assign QEq (charge equilibration) partial charges (Rappe and Goddard, 1991)
qtpie    Assign QTPIE (charge transfer, polarization and equilibration) partial charges (Chen and Martinez, 2007)



babel a.pdb a.mol2 --partialcharge mmff94

mmff94: inseriu a carga total do ligante
gasteiger: não acertou a carga


babel Cu.pdb Cu.mol2 --partialcharge qeq

Inseriu carga para o cobre mas inverteu os valores

babel Cu.pdb Cu.mol2 --partialcharge qtpie

Inseriu a carga 1.6 para o cobre mas não forneceu bons resultados de energia do docking

from: 


________________________________________________

MOPAC

Converter mol2 em formato mopac

babel -imol2 isapnsal.mol2 -omop isa.mop

more Cuisapn+.mop
uhf PM6 doublet charge=1
Cuisapn+  

C   7.76180 1 -1.30940 1 -0.24770 1
C   6.37720 1 -1.13140 1 -0.23890 1
C   5.81970 1  0.14170 1  0.16170 1
C   6.64670 1  1.19420 1  0.56350 1
(...)


_______________________________________________
ANTECHAMBER

antechamber -i Cuisapn+.pdb -fi pdb -o Cuisapn+.mol2 -fo mol2 -c bcc -m 2 -nc 1 -s 2 


antechamber -i isapn.pdb -fi pdb -o isapn.mol2 -fo mol2 -c bcc -m 1 -nc -1 -s 2 


ANTECHAMBER - APENAS O LIGANTE

#Apenas cria um arquivo mol2
antechamber -i isapn.pdb -fi pdb -o isapn.mol2 -fo mol2

# Gera um arquivo mol2 com as cargas AM1-BCC
antechamber -i isapn.pdb -fi pdb -o isapn.mol2 -fo mol2 -c bcc -nc -1


# Gera um arquivo mol2 com as cargas GASTEIGER
antechamber -i isapn.pdb -fi pdb -o isapn.mol2 -fo mol2 -c gas -nc -1

(ERRO PORQUE O MÉTODO NÃO UTILIZA O NUMERO DE ELÉTRONS MAS SIM OS "Atom Types"; Assim este método calcula o ligante com carga total zero que eh errado!!)

# Gera um arquivo mol2 com as cargas de MULLIKEN
antechamber -i isapn.pdb -fi pdb -o isapn.mol2 -fo mol2 -c mul -nc -1

# ERRO CARGAS CM1 ou CM2
antechamber -i isapn.pdb -fi pdb -o isapn.mol2 -fo mol2 -c cm1 -nc -1
antechamber -i isapn.pdb -fi pdb -o isapn.mol2 -fo mol2 -c cm2 -nc -1



ANTECHAMBER - TODO O COMPLEXO DE COBRE


antechamber -i Cuisapn.pdb -fi pdb -o Cuisapn.mol2 -fo mol2

# Não reconhece as ligações do cobre com os ligantes. Pode-se inserir a flag -j

# Gera um arquivo mol 2
antechamber -i Cuisapn.pdb -fi pdb -o Cuisapn.mol2 -fo mol2 -j 5


# Gera um arquivo mol2 com as cargas AM1-BCC
antechamber -i Cuisapn.pdb -fi pdb -o Cuisapn.mol2 -fo mol2 -c bcc -nc 1 -m 2 -j 5


# Gera um arquivo mol2 com as cargas de MULLIKEN
antechamber -i Cuisapn.pdb -fi pdb -o Cuisapn.mol2 -fo mol2 -c mul -nc 1 -m 2 -j 5





_________________________________________
cat a.mol2 | awk '{ sum+=$9} END {print sum}'

http://www2.chemie.uni-erlangen.de/software/petra/ (research group of Prof. Dr. J.Gasteiger)

quarta-feira, 28 de janeiro de 2015

Gaussian input file

# Rodar geometria do checkpoint
$ more zn.com
%chk=znisapn_b3.chk
%NProc=2
%mem=8GB
# bp86/TZVP pop=(ReadRadii,MK) Geom=AllCheckpoint

Cu 1.8

$

quarta-feira, 7 de janeiro de 2015

Why classify proteins?

Proteins can be classified into groups according to sequence or structural similarity.

Thus, when a novel protein is identified, its functional properties can be proposed based on the group to which it is predicted to belong. 


We will explain how families, domains and sequence features can be defined and used for protein classification.


Lets see how  proteins can be classified into different groups based on:
  • the FAMILIES to which they belong
  • the DOMAINS they contain
  • the SEQUENCE FEATURES they possess



What are protein families?


A protein family is a group of proteins that share a common evolutionary origin, reflected by their related functions and similarities in sequence or structure.



Protein domain

Domains are distinct functional and/or structural units in a protein.
protein domain is a conserved part of a given protein sequence and (tertiary) structure that can evolve, function, and exist independently of the rest of the protein chain.

Each domain forms a compact three-dimensional structure and often can be independently stable and folded

 Molecular evolution uses domains as building blocks and these may be recombined in different arrangements to create proteins with different functions




Family- and domain-based protein classification


http://www.ebi.ac.uk/training/online/course/introduction-protein-classification-ebi/protein-classification/family-and-domain-based-protei


What are sequence features?


Sequences features are groups of amino acids that confer certain characteristics upon a protein, and may be important for its overall function. Such features include:


  • active sites, which contain amino acids involved in catalytic activity. For example, the enzyme lipase, which catalyses the formation and hydrolysis of fats, has two amino acid residues (a histidine followed by a glycine) that are essential for its catalytic activity.
  • binding sites, containing amino acids that are directly involved in binding molecules or ions, like the iron-binding site of haemoglobin.
  • post-translational modification (PTM) sites, which contain residues known to be chemically modified (phosphorylated, palmitoylated, acetylated, etc) after the process of protein translation.
  • repeats, which are typically short amino acid sequences that are repeated within a protein, and may confer binding or structural properties upon it.
From: http://www.ebi.ac.uk/training/online/course/introduction-protein-classification-ebi/protein-classification/why-classify-proteins

terça-feira, 6 de maio de 2014

enim EPR

Documents/iff105/Cuenim/1stRound/QMMMM/Cluster/frame

1) Substitui os nomes dos átomos com números para os nomes canônicos

sed "s/C3/C /g" cuenim.xyz | sed "s/C5/C /g" | sed "s/H2/H /g" | sed "s/N2/N /g" | sed "s/H6/H /g" | sed "s/H7/H /g" | sed "s/C1/C /g" | sed "s/H8/H /g" | sed "s/H9/H /g" | sed "s/N3/N /g" | sed "s/H3/H /g" | sed "s/H11/H /g" | sed "s/CU/Cu /g" | sed "s/H4/H /g" | sed "s/H5/H /g" | sed "s/N1/N /g" | sed "s/H10/H /g" | sed "s/C4/C /g" | sed "s/H1/H /g" | sed "s/C5/C /g" | sed "s/C5/C /g" | sed "s/C5/C /g" | sed "s/C5/C /g" | sed "s/C5/C /g" | sed "s/C2/C /g"> aaaa.xyz

2) Roda o script master para obter dois arquivos: "cauda" e "cabeça"

3) Roda o arquivo job.sh (favor alterar as variáveis!!) para separar a trajetória em n arquivos xyz
cria um dir chamado frame para colocar os arquivos

4) Roda este script pra criar o input pro ORCA
#!/bin/bash

for ((  i = 1 ;  i <= 329;  i=i+1  )); do cat cabeca frame_$i.xyz cauda >> $i.inp;
 done

cria um dir inp para colocar os arquivos de input


5) Roda o script do orca
#!/bin/bash

for ((  i = 1 ;  i <= 200;  i=i+1  )); do 
/home/marcos/Programs/orca_2_9_1_linux_x86-64/orca $i.inp > $i.out 
 done


Distâncias Cu_O para os 120 primeiros frames da dinâmica QM/MM

#Análise dos resultados:


# Obtém os dados de 'A' e organiza nos arquivos Axx, Ayy e Azz

for (( i = 1 ; i <= 121; i=i+1))
do

Axx=`sed -n '/ Ax       Ay       Az/{N;N;N;p;}'  $i.out | sed '4!d' | awk {'print $5,$6,$7'} | sed ':a;$!N;s/ /\n/;ta;' | sort -n | sed '3!d'`; echo $i ${Axx} >> Axx
Ayy=`sed -n '/ Ax       Ay       Az/{N;N;N;p;}'  $i.out | sed '4!d' | awk {'print $5,$6,$7'} | sed ':a;$!N;s/ /\n/;ta;' | sort -n | sed '2!d'`; echo ${Ayy} >> Ayy
Azz=`sed -n '/ Ax       Ay       Az/{N;N;N;p;}'  $i.out | sed '4!d' | awk {'print $5,$6,$7'} | sed ':a;$!N;s/ /\n/;ta;' | sort -n | sed '1!d'`; echo ${Azz} >> Azz

done

#explica
#sed -n '/ Ax       Ay       Az/{N;N;N;p;}'  $i.out
# pega 3 linhas abaixo depois de encontrar o padrao "Ax       Ay       Az" no arquivo $i.out. O nro de linha abaixo esta relacionado com a repeticao N; . Por se N;N; quer dizer que pegara tb 2 linhas abaixo do padrao.
#sed ':a;$!N;s/ /\n/;ta;' >> substitui espaço em branco por um enter;


*************************************

#!/bin/bash

for (( i = 1 ; i <= 121; i=i+1))
do
grep -3 "Ax       Ay       Az" $i.out | grep 13Cu >> INFO/A_hiperfino.dat
grep "g(tot)" $i.out >> INFO/g_tot.dat
done

awk {'print $5,$6,$7'} INFO/A_hiperfino.dat >> INFO/hyperfine.dat
awk {'print $2,$3,$4,$6'} INFO/g_tot.dat >> g-tensor.dat

for (( i = 1 ; i <= 121; i=i+1))
do

done

sábado, 1 de março de 2014

Passo a passo IC – BLG

Download de programas e estruturas
1) Baixar DS (discovery Studio), VMD ou pymol
Discovery Studio Visualizer

VMD

2) Baixar todas as estruturas cristalográficas da BLG

Abrir a estrutura da BLG no editor de texto e investigar os principais campos


Estudo sobre proteínas
0) Estudar os tipos de aminoácidos em especial suas características elétricas, aromáticas e estéricas:
restype non-polar residues (white), basic residues (blue), acidic residues (red) and polar residues (green).
1) Anotar os aminoácidos contidos nas estruturas e suas diferenças/mutações
2) investigar as formas de ligação ligação de H, hidrofóbica, van der Waals
3) anotar as estruturas secundárias mais recorrentes
4) Verificar a relação entre as características de cristalização e a forma (dimérica, monomérica etc) da proteína
5) Investigar os ligantes na cavidade e as ligações mais próximas (close contacts)
(all and same residue as within 3 of resname XXX)

Estudo dos papers referentes as estruturas
1) Baixar os artigos e ler (na diagonal) qual contém informações sobre a estrutura
2) Procurar trabalhos de simulação computacional da BLG

Visualizar com o VMD (por ex) o número e o caráter das ligações de H do backbone e dos resíduos.
Observar ao longo da trajetória este comportamento. Observar o caráter das HB na alfa hélice e nas beta folhas

Momentos de dipolo da beta folha e alfa helice
Ligação dissulfidica

Estrutura primária: cadeia polipeptídica
Estrutura secundária: alfa-hélices, Beta-folhas
Estrutura terciária: estrutura 3D da proteína monomérica
Estrutura quaternária: estrutura entre várias cadeias plipeptídicas








Breve tutorial sobre o DS

Apresentação media

Apresentação do DS da Acccelys



beta-lactoglobulina

3NPO Bovine beta lactoglobulin unliganded form

http://www.rcsb.org/pdb/explore/explore.do?structureId=3NPO


Alguns resultados preliminares da BLG com o aumento da temperatura de 300 para 400 K.

Ligações de hidrogênio no backbone.

RMSD da proteína.

NSTEP =  2476000   TIME(PS) =   50872.000  TEMP(K) =   400.70 

Dinâmica Molecular

https://www.youtube.com/watch?v=2q8GiAEP8Go&list=PLIRzR2JaWHDYWSsbH07aBIdAaOIla-npA


Ver

Molecular dynamics simulation of the effect of heat on the conformation of bovine β-lactoglobulin A: A comparison of conventional and accelerated methods

sexta-feira, 1 de novembro de 2013

shell script

sed -n '/ 1 /p' FM_REF_FORCES > 1.dat


Get the lines starting with "i" and put in "i.dat" files

for ((  i = 1 ;  i <= 24;  i++  ))
do
echo "$i"
sed -n "/ $i /p" FM_REF_FORCES > $i.dat
done


SED

o Sed é orientado a linha, de cima para baixo, da esquerda para a direita.

A sintaxe genérica de um comando Sed é:

sed [opções] regras [arquivo]

Sendo que regras tem a forma genérica de:

[endereço1 [, endereço2]] comando [argumento]


Como dica geral SEMPRE coloque os comandos do Sed entre aspas simples

$ more exemplo
Folha de Sao Paulo
O estado de Sao Paulo
Noticias Populares
Gazeta do Povo
O Globo

$sed -n 'p' exemplo 
Folha de Sao Paulo
O estado de Sao Paulo
Noticias Populares
Gazeta do Povo

O Globo

$ sed -n '1p' exemplo 
Folha de Sao Paulo

$ sed -n '2p' exemplo 
O estado de Sao Paulo

$ sed -n '3p' exemplo 
Noticias Populares



ENDEREÇO

Deleta a 2° linha ou a linha que contenha a palavra estado

$ sed '2d' exemplo 
Folha de Sao Paulo
Noticias Populares
Gazeta do Povo
O Globo

sed '/estado/d' exemplo 
Folha de Sao Paulo
Noticias Populares
Gazeta do Povo
O Globo


Imprimi a 2° linha ou a que contenha a palavra estado

$ sed -n '2p' exemplo 
O estado de Sao Paulo

$ sed -n '/estado/p' exemplo 
O estado de Sao Paulo



Deleta e imprimi linhas dentro do range 2 a 4

$ sed '2,4d' exemplo
Folha de Sao Paulo
O Globo

$ sed -n '2,4p' exemplo
O estado de Sao Paulo
Noticias Populares
Gazeta do Povo

Deleta e imprimi entre a linha 2 e a palavra gazeta:

$sed '2,/Gazeta/d' exemplo
Folha de Sao Paulo
O Globo

$ sed -n '2,/Gazeta/p' exemplo
O estado de Sao Paulo
Noticias Populares
Gazeta do Povo



Deleta e imprimi entre duas palavras:

$ sed '/estado/,/Gazeta/d' exemplo
Folha de Sao Paulo
O Globo

$ sed -n '/estado/,/Gazeta/p' exemplo
O estado de Sao Paulo
Noticias Populares
Gazeta do Povo


No endereço, temos um caractere especial, o $ que referencia à última linha do texto. Assim sendo, para apagar da linha 2 até o final do texto:

$ sed '2,$d' exemplo
Folha de Sao Paulo

Imprimir a linha, a linha mais 1 linha, e mais 2 linhas.....

$ sed -n '/estado/p' exemplo
O estado de Sao Paulo

$ sed -n '/estado/,+p' exemplo
O estado de Sao Paulo

$ sed -n '/estado/,+1p' exemplo
O estado de Sao Paulo
Noticias Populares

$ sed -n '/estado/,+2p' exemplo
O estado de Sao Paulo
Noticias Populares
Gazeta do Povo

$ sed -n '/estado/,+3p' exemplo
O estado de Sao Paulo
Noticias Populares
Gazeta do Povo
O Globo


Interrompa o sed até a primeira linha em branco

$ sed '/^$/q' exemplo


Colocando na frente do d ou p o simbolo !, invertemos a lógica do comando

$ sed -n '/estado/p' exemplo
O estado de Sao Paulo

$ sed -n '/estado/!p' exemplo
Folha de Sao Paulo
Noticias Populares
Gazeta do Povo
O Globo



Este comando apaga as linhas 5, 10 e as que têm estorvo do arquivotexto.txt.
$ sed '1d;3d;/estado/d' exemplo

Substitui a 1° ocorrencia (por linha) da palavra Gazeta por bobao no arquivo exemplo
sed -e 's/Gazeta/bobao/' exemplo



sed -e 's/Gazeta/bobao/g' exemplo

substitui no arquivo todo!

___________________________________________
Programa para obter os resultados do 3DNA

#Para executar o programa digite: 
#sed -n -f programa.sed 3dna_output.out > opening.dat


# Obter o conteúdo entre a TAG < > </ >
//{:a;/<\/opening>/!{N;ba;};p;}


# Para obter o conteúdo entre a TAG < > </ > retirando a TAG:
#//{/{<\/opening>}/tc;:a;/<\/opening>/!{N;ba;};:c;s/.*//;s/<\/opening>.*$//;p;}



ou ....



#!/bin/sh
sed -n '//{:a;/<\/alpha1>/!{N;ba;};p;}' ensemble_example.out > alpha1.dat


#inserir uma linha em rbanco no inicio do arquivo
 sed '1i\ ' arq > arq2




Texto editado de: http://aurelio.net/sed/sed-HOWTO/

VMD label under construction....

proc label_atoms { top all } {
  set sel [atomselect top all]
  set atomlist [$sel list]
  foreach {atom} $atomlist {
    set atomlabel [format "%d/%d" top $atom]
    label add Atoms $atomlabel
  }
}


set sel1 [atomselect top all]
set atomlist [$sel1 list]
foreach {atom} $atomlist {
    set atomlabel [format 0/2 top $atom]
    label add Atoms $atomlabel
        show type
  }




set sel [atomselect top all]
set a [$sel get type]

ptraj

# ptraj example

trajin eq_density.rst                       coordinates file to read
trajout reimaged.rst restart          output file in the same format as the input
center :1                                                    center the box to the geometric center of residue 1
image center                                                    force all the molecules into the primary unit cell

#Run ptraj according this syntax:
ptraj dna_solv.top < test.ptraj



trajin md2.mdcrd 1 19000 5 [start stop offset]
strip :WAT,Na+                      #take care with blank spaces
center :1-20 mass origin 
image origin center familiar 
trajout output.pdb pdb append 

If you use cpptraj you can omit the 'append' keyword from the
'trajout' command since MODEL/ENDMDL keywords are added automatically
for multiple frame PDB output files.




trajin eq_density.rst
trajout reimaged.rst restart
center :1-12
image center

trajin cie_solv_md3.mdcrd
trajin cie_solv_md4.mdcrd
center :1-25 mass origin 
image origin center familiar 
trajout output.cdf netcdf


9.1 ptraj coordinate input/output commands

trajin filename [ start stop offset] [remdtraj remdtrajtemp reptemp] 

reference filename

trajout filename [ format ] [ nobox ] [ nowrap ] [ append ] [ remdtraj ] [ lessplitjaverage ] [ little j big ] \
[ dumpqj parse ] [ title title ] [ application application ] [ program program ]

filename [ format ]: Specify the name of a file for output coordinates (filename) written
in a specific format (format). Currently supported formats are:


trajectory – Amber ascii trajectory, the default

restart – Amber restart

binpos – Scripps binary format

pdb – PDB, the traditional format (not the newer CIF files); if molecule information is present, TER cards will be written between molecules.

cdf | netcdf – Amber NetCDF binary trajectory

charmm – CHARMM DCD binary trajectory


Note that the allowable formats include both trajectory files (i.e., a series of frames) and
files that traditionally include only a single coordinate set. In this latter case, the filename
will be appended with .N where N is the frame number (unless the optional keyword
append is specified).

media e desvio

awk '{ total += $2; count++ } END { print total/count }' test_opening.dat





#!/usr/bin/awk -f
#
#     Programa para calcular media e desvio padrao em awk
#----------------------------------------------------------

{
   soma+=$1
   somaquad+=$1*$1
}

END {
       media=soma/NR
       desvpad=sqrt((somaquad - NR*media**2)/(NR - 1))
       printf    "Media (Desvio): %.2f  %.2f\n" , media, desvpad
    }




From:
http://blog.eldermarco.com/2011/06/media-e-desvio-padrao-em-awk/

VMD scripts


# mostrar o complexo (resid 1) e as aguas a 3 angstrons do cobre (index 3)
(water or resid 1) and same residue as (within 3 of index 3)
(water or nucleic) and within 3.5 of name Cu
water and same residue as (within 2.5 of resid 1)
water within 2.5 of resid 1
resid 2 3 and within 20 of index 13
name OW and (within 2 of backbone)
resname CIE DA DT DC DG and (within 4 of resname CIE)
resname 'Na+'
all and not resname "Cl-"

# coloque 'update selection' na guia trajectory
nucleic and (within 7 of resname CIE)
# neste caso vai selecionar so os átomos do nucleic que estao perto do serial 4
nucleic and (within 3 of resname CIE and serial 4)

#Selecionar apenas o restante das moleculas sem incluir o CIE
not resname CIE and within 5 of resname CIE

index 10 11 12
index 10 to 12

resname QUA pro
residue cys ala
resid 1 2 3

type H HO
element H C N O (?)

protein not hydrogen

vmd –parm7 acetone_solv.top –rst7 acetone_solv.rst
vmd –parm7 acetone_solv.top –crdbox “outputfile”.crd
mol addfile equil-press/equil-$i.crd type crdbox waitfor all



# diferença entre resid e residue

residue 0 to 342 # mostra os resíduos de um único domínio
resid 1 to 343 # mostra os resíduos dos vários domínios enumerdos de 1 até n. Normalmente as moléculas de água e os aminoácidos iniciam por 1, desta forma quando o selecionamos os dois aparecem na tela.


#Habilitar o log para verificar a ação equivalente da linha de comando
# no terminal digite:
log nome.log

log off

#Load script files
vmd -e load.tcl
vmd -e vmd.vmd

cat load.tcl
#LOAD FILES
set mol [mol new cie_solv.top type parm7 waitfor all]
for {set i 3} {$i <= 7} {incr i} {
    mol addfile cie_solv_md$i.mdcrd type netcdf waitfor all
}

#gravar arquivo pqr
vmd -dispdev text
set mol [mol new prot_solv.top type parm7 waitfor all]
mol addfile reimaged14.rst.1 type rst7
animate write pqr test.pqr
#animate write pqr {/home/marcos/Desktop/rst/aaaaaaa.pqr} beg 0 end 0 skip 1 0

#gravar trajetória e pdb de frames e seleção específica (não funciona porque as H2O se afastam)
vmd -dispdev text
set mol [mol new cie_solv.top type parm7 waitfor all]
mol addfile output.cdf type netcdf first 0 last 2000 step 1 waitfor all
set sel [atomselect top "all and same residue as (within 5 of resname CIE)"]
animate write dcd com_traj.dcd beg 1 end 2000 sel $sel
animate write pdb com_traj.pdb beg 1 end 1 sel $sel


# adicionar label pela linha de comando
label add Atoms 0/6323
label addspring 0 4296 4299 1


vmd > label
label add [Atoms|Bonds|Angles|Dihedrals] {atoms as /}
label addspring
label list              -- return label categories
label list   -- return id's of labels in given category
label [show|hide|delete] [index] -- 
Control specific label or all labels in category
label graph -- Return a list of values for the given label
for all animation frames
label textsize []
label textthickness []

# convenções no VMD
resid no VMD pode ser mais de um tipo de residuo, por ex:
resid 1 quer dizer os residuos CIE 1 e também a primeira molécula de água: SOLV 1
Assim pra salvar mais de um composto pode ser interessante utilizar: "resname CIE or resid 234 765", assim salvará apenas 3 resíduos


From:
http://www.ks.uiuc.edu/Research/vmd/vmd-1.7/ug/node192.html

VMD Command-Line Options

When started, the following command-line options may be given to VMD. Note that if a command-line option does not start with a dash (-), and is not part of another option, it is assumed to be a PDB filename. Thus, the Unix command
        vmd molecule.pdb
will start VMD and load a molecule from the file molecule.pdb. On the Windows platform, one must preface the VMD invocation with the Windows start command
        start vmd molecule.pdb
  • -m : Load all subsequent files into separate molecules. The -f and -m options may be specified multiple times on the command line in order to load multiple molecule containing one or more files.
  • -h | -? : Print a summary a command-line options to the console.
  • -e filename : After initialization, execute the text commands in filename, and then resume normal operation.
  • -psf filename : Load the specified molecule (in PSF format) at startup. The PSF file only contains the molecular structure; a PDB or DCD file must also be specified when this option is used.
  • -pdb filename : Load the specified molecule (in PDB format) at startup.
  • -dcd filename : Load the specified trajectory file (in binary DCD format) at startup. The DCD file only contains atomic coordinates; a PDB or PSF file must also be specified when this option is used.
  • - filename : Load the specified file using the given filetype.
  • -f : Load all subsequent files into the same molecule. This is the default. A new molecule is created for each invocation of -f; thus, vmd -f 1.pdb 2.pdb -f 3.pdbloads 1.pdb and 2.pdb into the same molecule and 3.pdb into a different molecule.

  • -dispdev < win | text | cave | caveforms | none > : Specify the type of graphical display to use. The possible display devices include:
    • win: a standard graphics display window.
    • text: do not provide any graphics display window.
    • cave: use the CAVE virtual environment for display, forms are disabled.
    • caveforms: use the CAVE virtual environment for display and with forms enabled. This is useful with -display machine:0 for remote display of the forms when the CAVE uses the local screen.
    • none: same as text.
    It is possible to use VMD as a filter to convert coordinate files into rendered images, by using the -dispdev text and -e options.
  • -dist z : Specify the distance to the VMD image plane.
  • -height y : Specify the height of the VMD image plane.
  • -pos x y : Specify the position for the graphics display window. The position (x,y) is the number of pixels from the lower-left corner of the display to the lower-left corner of the graphics window.
  • -size x y : Specify the size for the graphics display window, in pixels.
  • -nt : Do not display the VMD title at startup.
  • -startup filename : Use filename as the VMD startup command script, instead of the default .vmdrc or vmd.rc file.
  • -debug [level : Turn on output of debugging messages, and optionally set the current debug level (1=few messages ... 5=many verbose messages). Note this is only useful if VMD has been compiled with debugging option included.