­­­

Cambridgeská strukturní databáze organických a organometalických sloučenin v roce 2018

J. Hašek

Biotechnologický ústav AV ČR, Průmyslová 595, 252 50 Vestec, hasekjh@seznam.cz

 

Nekomerční zájemci v České republice, kteří jsou členy konzorcia CSD organizovaného Krystalografickou společností (https://www.xray.cz/xray/csca/data/r_form.htm), mají k dispozici Cambridgeskou strukturní databází nepřetržitě již 45 let (od roku 1973). Licence placená Krystalografickou společností je platná pouze pro akademické uživatele. Komerční organizace si musí  licenci vyžádat přímo na stránce https://www.ccdc.cam.ac.uk.

V současné době databáze CSD obsahuje téměř milion experimentálně stanovených organických a organometalických struktur a je doplněna rozsáhlým softwarovým vybavením užitečným nejen pro krystalografy ale i pro chemiky, biology, fyziky a pracovníky různých technologických oborů.   

Chemici tento software využívají pro návrh a optimalizaci nových molekul, objasnění jejich funkce, některých chemických rekcí a k analýze krystalových struktur.

Materiálová věda jej účinně využívá pro návrh nových materiálů a optimalizaci jejich vlastností.

Strukturní biologové jej využívají pro pochopení funkce proteinů, pro analýzu vztahů uvnitř systémů biomolekul a interakcí mezi ligandy a bio-makromolekulami.

Farmakologie a biochemie využívá CSD k návrhu a optimalizaci léčiv.

Základem systému CSD jsou uživatelsky příjemné vyhledávací a prohlížecí programy ConQuest a MERCURY. Základ CSD je doplněn dalším softwarem směrovaným do materiálového výzkumu, k řešení struktur z práškových dat. Dále je dolněn znalostními databázemi mezimolekulárních interakcí v chemických a biologických molekulárních systémech IsoStar a SuperStar a softwarem pro hledání vazebních míst v proteinech a pro vývoj nových léčiv [1].

DASH – Software pro řešení krystalových struktur z práškových dat, tj. na základě měření práškových difraktogramů. Program využívá metodu „simulated annealing“ k hledání globálního minima účelové funkce.

MOGUL – Program, který analyzuje geometrii všech struktur, ve kterých byl zadaný fragment nalezen. Snadno umožňuje vyloučit nevhodné případy. Nově byla zlepšena analýza skládání aromatických a cyklických skupin do krystalové struktury.

IsoStar – Statistická analýza experimentálně popsaných interakcí mezi centrálními funkčními skupinami a  vybranými interagujícími funkčními skupinami. Uživatel též může vytvářet svoje vlastní analýzy, zjišťovat korelace a zobrazovat histogramy a mapy hustoty výskytu konfigurací požadovaných funkčních skupin s vybranými reagenty. Nově  byly přidány kontaktní skupiny obsahující jód a brom.

SuperStar – Program pro identifikaci interakčních a katalytických míst ve strukturách proteinů.  Trojrozměrné mapy pravděpodobnosti výskytu odvozené z experimentálních rtg struktur ukazují vhodná místa pro interakce vybraných ligandů s proteiny zvolené třídy (vazebná místa proteinů).

GOLD (Genetic optimization for flexible ligand docking). Program umožňuje nalezení optimálního umístění ligandu v molekule proteinu na základě pseudopotenciálů nastavených tak, aby vypočítané modely souhlasily co nejlépe s experimentálně stanovenými strukturami. Formálně jsou použity atomové a vazebné typy známé z programu SYBYL, ale empirické potenciály (force fields) a geometrická omezení (constraints) jsou odlišná. Program samozřejmě vyžaduje kontrolu strukturních typů a pečlivé doplnění vodíkových atomů. Program používá „genetický algoritmus“ pro hledání optimální cesty pro vložení ligandu do vazebného místa v proteinu.

HERMES – Program pro "krásné" grafické znázornění a analýzu interakcí mezi proteiny. Je vhodný zejména pro návrh léčiv a usnadňuje práci se systémy SuperStar, Relibase, GOLD, Mogul a IsoStar.

GoldMiner – Program pro usnadnění zpracování výsledků získaných programem GOLD při hledání optimálního umístění skupiny ligandů v proteinu a pro vyhodnocování optimálního ligandu s volitelnými vahami  jednotlivých kriterií („figures of merit“) vystupujících v účelové funkci („evaluation of ligands docking using different scoring functions“).

CSD Python API - programování v pythonu umožňuje uživateli flexibilní řetězení běhů programů a opakování výpočtů.

RELIBASEplus – Program usnadňující analýzu mezimolekulárních interakcí mezi proteiny, ligandy a dalšími molekulami nalezenými  v "Proteinové strukturní databázi". V roce 2018 byl proveden poslední upgrade této obsáhlé databáze. Počítá se s tím, že tato analýza bude v budoucnu prováděna jiným způsobem.

CSD – CrossMiner - Software pro návrh léčiv a pro analýzu vazebných míst v komplexech bio-makromolekul zařazený nově do balíku Enterprise v roce 2018. CrossMiner je systém vyvinutý farmakologickou společností pro návrh léčiv [2].

Viz stránka https://www.ccdc.cam.ac.uk/solutions/csd-discovery/components/CSD-CrossMiner/

Licence systému CrossMiner je sice zaplacena v rámci balíku Enterprise, ale protože jde o poměrně rozsáhlou databázi předzpracovaných struktur z “Cambridgeské strukturní databáze” a z “Proteinové databanky” nenainstaluje se tento balík automaticky při instalaci CSD. Pokud chcete systém nainstalovat, musíte o povolení stažení požádat separátně v Cambridge a stažení provést použitím stejného jména a hesla jako u CSD.  

V CrossMineru pracuje uživatel s databázemi struktur (CSD, PDB), s databázemi vazebných vlastností ligandů a proteinů a s dalšími pojmy jako je vyloučený objem, farmakologický bod a výstupní vektor vazby. Na výstupu uživatel dostává poměrně přehledné porovnání strukturního uspořádání vazeb ligandů ve vazebních místech všech proteinů přítomných v PDB, nebo seznam všech potenciálních vazebných míst v bio-systémech. Pochopení funkce usnadní shlédnutí několika videí dostupných na webu.

Bylo by vhodné aby všechny vysoké školy vyučující chemii, strukturní biologii a strukturu materiálů extenzivně využívaly Cambridgeskou strukturní databázi při výuce, protože CSD učí studenty vnímat přirozeně jinak obtížně uchopitelné trojrozměrné vztahy uvnitř molekulárních systémů. Na internetu je k dispozici velké množství hotových přednášek a také více než sto vzorových příkladů vhodných pro výuku.

Viz stránka https://www.ccdc.cam.ac.uk/Community/educationalresources/.

Na gymnaziích a středních školách technického ražení by byla instalace kompletního systému CSD nepraktická, ale některé příklady z výše uvedeného obsáhlého seznamu "educational resources" jsou vhodné pro vysvětlování základních pojmů strukturní chemie.

 

1. J. Hašek, Chemické listy 105, (2011) 467-475.

2. O. Korb et al, J. Med. Chem. 59, (2016) 4257–4266.

Podpoprováno projekty 18-10687S, RVO 86652036.