Analýza strukturních dat

 

Karel Huml

Ústav makromolekulární chemie AV ČR, Heyrovského nám.2, 162 06 Praha 6

e-mail :  huml@imc.cas.cz

 

 

Úvod

V současné době je předmětem studia molekulových struktur nejen stanovení prostorové stavby jednotlivých molekul, ale i jejich dynamické chování v průběhu konformačních přeměn, včetně chemických reakcí. K tomuto účelu slouží především velké množství experimentálních dat shromažďovaných v datových bankách. Druhý přístup je teoretický, umožněný moderními výpočetními metodami. Konečně třetí přístup spočívá ve spojení předcházejících dvou metod. V této práci si krátce všimneme uvedených tří postupů včetně několika typických příkladů.

 

Experimentální metody

Do této skupiny patří především zpracování dat získaných rtg strukturní analýzou, případně difrakcí neutronů, elektronů, optickými metodami a skenovací transmisní elektronovou kryomikroskopií (Ottensmeyer et al, 2000). Většina dat je přístupná prostřednictvím Cambridge Structural Databank, CSD(Allen, 2002), Protein Data Bank, PDB (Berman et al, 2002) a dalších. Molekula, či její fragment, která se vyskytuje v různých krystalových strukturách, vykazuje různé konformace neboť podléhá silám odlišného okolí. Shluková analýza, včetně grafického znázornění souboru takto získaných konformací téže molekuly, nám dává informaci o možných proměnách tvaru studované molekuly v průběhu jejích pohybů podél reakční cesty. Zároveň nám umožňuje stanovit parametry s největší variabilitou, které jsou vhodné pro konstrukci reakční koordináty daného procesu.

 

Teoretický přístup

Výpočetní metody dovolují rekonstrukci nadplochy potenciální energie příslušné dané struktuře. Stanovení stacionárních bodů a jejich spojnic na této nadploše umožňuje předpovědět možné dráhy konformačních změn. V případě malých molekul se uplatňují metody kvantové mechaniky. U velkých molekul pak metody molekulární mechaniky, jako je například deterministická metoda molekulární dynamiky (Alder, Wainwright, 1957) nebo Metropolisova stochastická metoda Monte Carlo (Metropolis et al, 1953). Z dalších postupů vhodných pro získání množiny molekulárních konformací lze jmenovat například metodu binárního genetického algoritmu (Payne, Glen, 1993) nebo metodu distanční geometrie (Havel et al,1983).

 

Princip strukturních korelací

Uvedený princip dovoluje spojit obě předcházející metody. Bürgi a Dunitz (1983) jej formulovali v následujícím znění : „Jestliže existuje korelace mezi dvěma nebo více nezávislými parametry popisujícími strukturu daného strukturního fragmentu v různých prostředích potom korelační funkce zobrazuje cestu minimální (potenciální) energie v odpovídajícím parametrickém prostoru“. Platnost tohoto principu je podmíněna existencí pouze malých intra- a intermolekulárních interakcí ve srovnání s celkovou potenciální energií molekuly. Potom lze očekávat větší koncentraci representačních bodů v projekci minim potenciální energie do prostoru molekulárních parametrů (Mezey, 1987).

 

Ve všech třech diskutovaných případech musí předcházet přípravná fáze, která do značné míry ovlivňuje úspěšnost následující analýzy. Všiměme si dvou nejdůležitějších kroků, které musíme nejprve učinit.

 

Stanovení strukturních deskriptorů

Konformační změny lze obvykle demonstrovat v omezeném prostoru vhodně zvolených molekulárních parametrů (deskriptorů). Především jsou to chemické (tzv. primární) souřadnice : valenční délky, valenční a torzní úhly. Jejich výhodou je názornost, nevýhodou různý charakter (délkové a úhlové jednotky, periodické a aperiodické veličiny), což může činit potíže při zavádění metriky v dalším zpracování, například shlukovou analýzou. Na druhé straně kartézské souřadnice (tzv. sekundární) jsou stejného typu (měření v délkových jednotkách), ale vyžadují práci v 3N-dimensionálním prostoru (N je počet atomů studovaného systému) a v některých případech se obtížněji zavádějí prvky molekulární symetrie. Mezi dalšími systémy užívaných souřadnic je nutné jmenovat tzv. hlavní komponenty, které jsou lineárními kombinacemi parametrů s největší variabilitou. Tato representace dovoluje významně snížit dimensi problému s minimální ztrátou informace o konfiguraci representačních bodů, ale interpretace (reifikace) hlavních komponent je často méně názorná.

 

Určení symetrie

Molekuly často vykazují bodovou symetrii, případně periodicitu možných konformací, například vzhledem k otáčení jejich částí kolem jednoduchých vazeb. Tyto vlastnosti je nutné respektovat, jestliže chceme zmapovat větší část konformačního prostoru dané molekuly.To znamená, že každému řešení musí předcházet stanovení grupy symetrie množiny všech jejích konformací. Většina matematických programů konformační analýzy neobsahuje příkazy pro volbu prvků symetrie. Proto se uvedená potíž obchází tím, že se vstupní nezávislá strukturní data rozmnoží aplikací příslušných matic symetire (Huml, Soldán, Zimmermann,1993). Dostáváme tak daleko hustší síť bodů v konfiguračním prostoru a tím i zprostředkovaně názornější obraz nadplochy potenciální energie.

 

Dále si ukážeme několik příkladů všech tří zmíněných postupů analýzy strukturních dat.

 

Analýza experimentálních dat

Jako ukázku si uvedeme  konformační analýzu experimentálních dat protizánětlivého léčiva benzylphenyletheru  (PhCH2Ph) (Schneider, Hašek, Huml, 1988; Schneider, Huml, Rejholec, 1991). Z CSD bylo získáno 49 struktur obsahujících uvedenou molekulu. Využitím prvků symetrie bylo získáno pro další analýzu celkem 98 representačních bodů. Za studované proměnné byly zvoleny tři úhly (τ1,τ2,τ3) definující torze kolem jednoduchých vazeb spojujících Ph kruhy. Ukázalo se, že representační body tvoří dva shluky, které na sebe navazují. Metodou hlavních komponent byla nalezena cesta deformačních změn v 3-dim prostoru úhlů (τ1,τ2,τ3). Výsledky byly konfrontovány s teoretickými výpočty metodou molekulární mechaniky (Dunitz, 1979).

 

 

Matematická rekonstrukce nadplochy potenciální energie

Do této skupiny patří například teoretické studium vasopresinu a jeho nonapeptidových analogů za účelem objasnění vztahů mezi jejich strukturou a biologickými vlastnostmi. Uvedené látky působí jako transduktory ovlivňující procesy jako jsou vasokonstrikce

nebo antidiuretické funkce. Hagler se svými spolupracovníky (1985) prokázali metodami molekulární mechaniky, že dynamická struktura těchto sloučenin je bohatá na konformační přeměny, které se významně liší od klasických výpočtů konformací jednotlivých statických struktur ve vybraných rovnovážných stavech s minimální potenciální energií. Grafické znázornění získaných výsledků vhodně ilustruje existenci přechodových stavů mezi těmito rovnovážnými stavy (Huml, Barth, 1999).

 

 

Aplikace korelačního strukturního principu

Za příklad užití strukturního korelačního principu, ve spojitosti s teoeretickou rekonstrukcí nadplochy potenciální energie, lze uvést studium konformačních změn katecholu [dihydrobenzen, Ph(OH) 2], diskutované v práci Huml, Soldán, Zimmerman (1993). Celkem 101 vstupních struktur bylo rozmnoženo příslušnými operacemi symetrie na 404 isometrických struktur charakterizovaných  páry torzních úhlů 1,τ2) určujících polohu obou skupin OH vůči benzenovému jádru. Ukázalo se, že experimentální data jsou v dobré shodě s výpočty publikovanými Mezeyem a jeho spolupracovníky (Artega, Mezey, 1988; Artega, Heal, Mezey, 1990). Ve shodě s očekáváním se ukázalo, že nejvíce struktur se nachází v místech konformací s minimální potenciální energií, žádné v oblastech maxim potenciální energie a jen ojediněle v průsmycích spojujících jednotlivá minima potenciální energie. Uvedený příklad potvrzuje možnost odhadu nadplochy potenciální energie ze shlukové analýzy experimentálních dat a naopak.

 

Závěr

S rostoucím počtem experimentálních dat a účinnějších výpočetních programů rostou i možnosti rozsáhlejšího studia chování nejen izolovaných molekul, ale i molekulárních interakcí. Výsledky pak nalézají uplatnění jak v oblasti základního výzkumu, tak i v aplikacích, zejména v chemii nových léčiv.

 

Práce byla podpořena Grantovou agenturou Akademie věd  České republiky (grant č. S5020101).

 

Literatura

Alder B.J., Wainwright T.E.: J. Chem. Phys. 27 (1957) 1208.

Allen F.H.: Acta Crystallogr. B58 (2002) 380.

Artega G.A., Mezey P.G.: Int. J. Quantum Chem. QBS 15 (1988) 33.

Artega G.A., Heal G.A., Mezey P.G.: Theor. Chim. Acta 76 (1990) 377.

Berman H.M. et al : Nucleid Acids Res. 28 (2002) 235.

Bürgi H.-B., Dunic J.D.: Acc. Chem. Res. 16 (1983) 153.

Dunitz J.D.: X-ray Analysis and the Structure of Organic Molecules,

       Cornell Uni. Press, Ithaca 1979.

Hagler A.T., Osguthorpe D.J., Dauber-Ostguthorpe P., Hempel J.C.:

      Science 227 (1985) 1309.

Havel T.F., Kuntz I.D., Crippen G.M.: Bull. Math. Biol. 45 (1983) 665.

Huml K., Barth T.: Collection Symposium Series 3 (1999) 103.

Huml K., Soldán P., Zimmermann K.: Collect. Czech. Chem. Commun. 58, (1993) 1242.

Metropolis N., Rosenbluth A.W., Rosenbluth M.N., Teller A.H.: J. Chem.

       Phys.21(1953)1087.

Mezey P.G.: Potential Energy Hypersurfaces. Elsevier, Amsterdam, 1987.

Ottensmeyer F.P., Beniac D.R., Luo R.Z.,Yip C.C.: Biochemistry 39 (2000) 12103.

Payne A.W.R., Glen R.C.: J. Mol. Graphis 11 (1993) 74.

Schneider B., Hašek J., Huml K.: Z. Kristallogr. 185 (1988) 151.

Schneider B., Huml K., Rejholec V.: Collect. Czech. Chem. Commun.

       56 (1991) 2188.