ŘEŠENÍ KRYSTALOVÝCH STRUKTUR Z PRÁŠKOVÉ DIFRAKCE

 

Radovan Černý

 

Laboratoire de Cristallographie, Université de Genčve, 24 quai Ernest-Ansermet, CH-1211 Genčve 4, Suisse

 

Úvod

Ne vždy máme pro určení neznámé krystalové struktury k dispozici kvalitní monokrystal. Typickým případem jsou kovové slitiny a jejich intermetalické fáze, hydridy techto fází, některé molekulární krystaly a řada dalších. Byly to molekulární materiály, zvláště farmaceutické látky, které motivovaly v posledních 20 letech intenzivní vývoj v teorii i experimentu difrakčních metod používajících polykrystalický vzorek. Celkový počet krystalových struktur určených těmito metodami se pohybuje někde okolo 600 s roční produkcí vyšší než 50 (http://www.cristal.org/iniref.html). A přiznejme si, že vzrůstající síla těchto metod někdy vede k poklesu intensity práce v přípravě materiálu, neboť je rychlejší připravit polykrystalický vzorek než strávit řadu týdnů na přípravě dostatečně velkého monokrystalu (i když monokrystalové difraktometry při zdrojích synchrotronového záření posouvají potřebnou velikost monokrystalu stále dolů). Prášková difrakce nemůže nikdy dosáhnout prostorového rozlišení a strukturní přesnosti difrakce monokrystalové. Pracuje totiž s 1-rozměrnou projekcí původně 3-rozměrného difrakčního obrazu v reciprokém prostoru, která nutně vede k překryvu nezávislých informací i v ideálním případě difraktometru s nekonečně velkým úhlovým rozlišením. Prášková difrakce se může ve výkonosti pouze približovat difrakci monokrystalové a může těžit ze širokého arzenálu metod zde již existujících. Nižší rozlišení měřených dat práškové difrakce však vedlo k vývoji netradičních metod řešení struktur (globální optimalizace), které našly svou inspiraci v jiných oblastech výzkumu setkávajících se s podobným problémem: Obtížností přímé cesty od dat, která je možno měřit, k hodnotám hledaných parametrů.

 

Obr. 1: Bludiště řešení krystalové struktury; modifikováno z [1].

 

Současný limit práškové difrakce je asi 30 atomů v asymetrické buňce pro rutinní práci, struktury se 60 atomy už byly vyřešeny. Optimisté odhadují, že brzy můžeme dosáhnout limitu 100 atomů (http://www.sacrs.org.za/ecm21/plenary.html). Řešení krystalové struktury může být přirovnáno k bludišti (obr. 1): I když k cíli (struktuře) vede více cest, ne všechny jsou vhodné či dokonce možné pro daný problém. Základními etapami, komorami v bludišti, však musí projít každý, má však možnost volby mezi různými cestičkami. O některých z nich pojednává tento příspěvek. Nebudeme se zabývat přípravou vzorku a optimalizaci difrakčního experimentu ani poslední etapou – vypřesnění struktury pomocí Rietveldovy metody.

 

Indexace práškového difrakčního záznamu

První, a ne vždy lehký krok, je určení elementární buňky našeho neznámého krystalu – indexace difrakčního záznamu. Ve srovnání se monokrystalovými daty je to úloha o to těžší, že nemáme k dizpozici informaci o orientaci reciprokých vektorů r*hkl, ale jenom o jejich délce 1/dhkl. Základní soustavou rovnic, se kterou pracují všechny indexační algoritmy práškových dat je

 

     Qhkl = 1/d2hkl = h2a*2 + k2b*2 + l2c*2 + 2hka*b*cosg* + 2klb*c*cosa* + 2hla*c*cosb*            (1)

 

čili pro každou pozorovanou hodnotu Qhkl (danou polohou jedné reflexe hkl v práškovém difrakčním záznamu) máme najít tři celá čísla (Millerovy indexy hkl) a šest mřížových parametrů stejných pro celou soustavu rovnic. Rovnice (1) nabývá jednodušších forem pro vyšší symetrie krystalové mříže. Hodnoty Qhkl jsou měřeny s určitou přesností, tudíž teoreticky by bylo možné oindexovat každý difrakční záznam pomocí kubické elementární buňky s mřížovým parametrem ~ 105 Ĺ, což samozřejmě není správné řešení. Čili bez ohledu na to jak indexujeme difrakční záznam, potřebujeme jednoduché kriterium pro fyzikální správnost řešení. Takový parametrem je de Wolffovo kriterium (Figure-of-Merit)

 

M20 = Q20 / (2 <Q> N20)                                                                                           (2)

 

kde pracujeme s prvními 20 pozorovanými a oindexovanými reflexemi, Q20 je Q hodnota pro 20-tou reflexi, <Q> je průměrný rozdíl mezi pozorovanými a spočtenými Q hodnotami a N20 je počet spočtených reflexí až do pozorované 20-té reflexe. Hodnota M20 > 10 značí s velkou pravděpodobností fyzikálně správné řešení. Jiným kriteriem je Smithův a Snyderův F-index

 

            FN = 1 / <D2q> × N / N(qg)                                                                                        (3)

 

kde pracujeme s pozorovanými reflexemi až do úhlu qg, N je počet pozorovaných a N(qg) počet spočtených reflexí až do tohoto limitu a <D2q> je průměrný rozdíl mezi pozorovanými a spočtenými hodnotami 2q. Na rozdíl od M20 nezávisí FN na symetrii krystalové mříže, což však není vždy výhoda neboť kubické řešení je pravděpodobnější než triklinické pro stejný počet oindexovaných reflexí a stejnou přesnost poloh reflexí. Pro spravný výpočet M20 a FN by měly být vzaty v úvahu systematické absence, což je možné až po určení prostorové grupy. Úspěšnost indexace, tak jako celého procese určení struktury, závisí silně na kvalitě měřených dat včetně včasné identifikace reflexí příměsových fází. Obtížný je případ indexace krystalové mříže s dominantní zonou – jedna krystalová osa podstaně kratší než ostatní dvě.

Vlastní indexační proces používá různé algoritmy jak vyřešit soustavu, typicky 20-ti, rovnic (1) a provádí inteligentní nebo vyčerpávající hledání v přímém (mřížové parametry) nebo reciprokém (Millerovy indexy) prostoru. Program ITO [2] využívá toho, že reflexe náležijící stejné centrální zoně (rovina v reciprokém prostoru procházející počátkem) lze oindexovat pomocí pouze dvou indexů a hledá takové zony v pozorovaných datech. Program DICVOL91 [3] provádí vyčerpávající hledání v přímém prosotoru a využívá přitom principu dichotomie: systematicky hledá oblasti hodnot mřížových parametrů, které mohou obsahovat řešení a vylučuje ostatní oblasti. Program TREOR90 [4] provádí vyčerpávající hledání v reciprokém prostoru a využívá přitom určitého stupně inteligence plynoucího z předchozích zkušeností. CRYSFIRE (http://www.ccp14.ac.uk/tutorial/crys/index.html ) je rozhraní k více indexačním programům s analyzou výsledků. Jelikož řešení mnohaparametrové soustavy rovnic (1) je typický problém globální optimalizace, není překvapující, že se objevila řada indexačních programů uživajících algoritmy globální optimalizace jako metody Monte Carlo, genetický algoritmus a jiné. Přehled všech metod a odkazy na jednotlivé programy lze najít v (http://www.ccp14.ac.uk/solution/indexing/index.html).

Vlastní proces úspěšné indexace musí být zakončen prověřením správnosti nalezené elementární buňky pomocí Whole-Pattern-Profile-Fitting, tak jak je popsán v následující kapitole, a rovněž i redukcí buňky a nalezením buňky Bravaisovy, která vykazuje přijatelné systematické absence.

 

Určení prostorové grupy a integrovaných intenzit jednotlivých reflexí

Základní problem práškové difrakce, 1-rozměrná projekce původně 3-rozměrného difrakčního obrazu, vede k částečnému či úplnému překryvu reflexí v difrakčním záznamu. Obtížnost pracovat s integralními intenzitami jako s nezávislými pozorováními vedla H. Rietvelda [5] ke slavné metodě nesoucí dnes jeho jméno, modelování celého digitálního práškového difrakčního záznamu, a užití každého bodu jako nezávislého pozorování. Tento přístup lze také nazvat Whole-Pattern-Profile-Fitting (WPPF) a má dvě varianty: (a) užívající strukturní model – vlastní Rietveldova metoda, (b) bez strukturního modelu – metoda Le Bailova [6] nebo Pawleyho [7]. Je dobré si uvědomit, že (a) je ve své podstatě vypřesňovnání strukturních parametrů z dat práškové difrakce, zatímco (b) slouží hlavně k dekompozici práškového difrakčního záznamu na jednotlivé integrální intenzity. Obě metody, (a) i (b), však mají mnoho společného, takže je vždy najdeme jako součast jednoho výpočetního programu. Nebudeme zde podávat matematický základ Rietveldovy metody, to lze najít v příslušné kapitole tohoto přehledu, budeme se zde zabývat pouze metodou (b) neboť lze pomocí ní ověřit správnost indexace, získat informace o systematických absencích – prostorové grupě krystalu a získat jednotlivé integrální intenzity.

Metoda Le Bailova je WPPF bez strukturního modelu, avšak s mřížovými parametry a prostorovou grupou (pro začátek to může být grupa holoedrie). Mřížové parametry, profilové parametry (šířky a tvar reflexí) a instrumentální parametry (kalibrace 2q, pozadí) jsou upřesňovány (např. metodou nejmenších čtverců) a hodnoty integrálních intenzit jsou upřesňovány pomocí iterativní metody založené na původním Rietveldově vztahu pro výpočet pozorovaných integrálních intenzit. Při iterování se pozorované intenzity z n-té iterace stávají vypočtenými intenzitami pro (n+1)-tou iteraci, přičemž počáteční hodnoty vypočtených intenzit v 0-té iteraci odpovídají např. rovnoměrnému rozdělení celkové intenzity mezi překrývající se reflexe. Metoda Pawleyho se liší tím, že integrální intenzity jsou považovány za volné parametry a jsou upřesňovány současně se všemi ostatními volnými parametry.

Úspěšně provedené La Bailovo nebo Pawleyho vypřesnění slouží v prvé řadě pro prověření správnosti elementární buňky, dále pro získání informací o systematických absencích a nakonec i pro získání hodnot pozorovaných integrálních intenzit Ihkl(obs) jednotlivých reflexí pro jejich další použití při určení krystalové struktury pomocí metod monokrystalových. Určení prostorové grupy z práškových dat se ve své podstatě řídí stejnými pravidly jako pro data monokrystalová. Překryv jednotlivých reflexí v práškovém difrakčním záznamu však způsobí omezení pouze na nízkoúhlové reflexe a prakticky znemožní určení ze statistiky intenzit zda prostorová grupa obsahuje střed symetrie. Užití celého difrakčního záznamu a zkoumání systematických absencí pomocí Bayesovy teorie pravděpodobnosti [8] znamená mnohem kompletnější analyzu. Pro určení integrálních intenzit Ihkl(obs) pomocí WPPF musíme rozhodnout jak budeme zacházet s částečně a úplně se překrývajícími reflexemi. O nových metodách založených na užití dodatečné krystalografické informaci anebo na dodatečném experimentu pojednává následující kapitola.

 

Metody určení integrovaných intenzit překrývajících se reflexí

Užití dodatečné krystalografické informace (atomicita a pozitivnost)

Během procesu určovaní fází reflexí jejichž integrální intenzity již byly spolehlivě určeny (nepřekrývající se reflexe) získáme řadu dodatečných informací, které můžeme použít pro separaci překrývajících se reflexí. Informace o pseudo-translační symetrii byla použita v programu EXPO [9]: Překrývají-li se reflexe super-struktury s reflexí sub-struktury, je pravděpodobnější, že druhá bude mít větší intenzitu. Užití fázové informace již lokalizované částečné struktury (molekulární fragment) se provádí ve stejném programu. Uzití informace o strukturních invariantech se užívá v programu DOREES-POWSIM [10]: Známe-li již moduly dvou reflexí v silném tripletu çEkça çEh+kçmůžeme s velkou pravděpodobností tvrdit, že modul třetí reflexe v tripletu, çEhç, bude rovněž velký.

Očekávaná pozitivnost Pattersonovy funkce v přímém prostoru: Pattersonova funkce spočtena z dat, která jsou k dispozici (nepřekrývající se reflexe), je ne-lineárním způsobem  modifikována, přičemž je Pattersonově funkci vnucena pozitivnost. Z této modifikované Pattersonovy funkce pak můžeme zpětnou transformací obdržet druhé mocniny modulů všech reflexí, tedy i překrývajících se. Tyto nové odhady pak mohou sloužit jako nové počáteční hodnoty pro Le Bailovu metodu anebo celý proces může být iterativně opakován. Pattersonova mapa může být modifikována na základě principu maximální entropie [11] anebo na základě Sayerova argumentu „Druhá mocnina Fourierovy mapy je podobná Fourierově mapě samotné“ aplikovaného v iterativní podobě jako Fast-Iterative-Patterson-Squaring v [12].

Užití dodatečného experimentu – více difrakčních záznamů

Měřením více difrakčních záznamů na jednom vzorku při různých, ale kontrolovaných, vnějších podmínkách můžeme získat více informace o intenzitách překrývajících se reflexí. Vztah mezi difrakčními záznamy musí být znám anebo měřitelný. Dva případy měněných vnějších podmínek byly úspěšně aplikovány: teplota a textura.

Máme-li materiál s anisotropní teplotní roztažností potom relativní intenzity reflexí se téměř s teplotou nemění, avšak jejich relativní polohy ano. Tím se mění i obraz překryvu reflexí a měřením difrakčních záznamů při různých teplotách obdržíme dodatečnou informaci, která může pomoci separaci reflexí. Tato myšlenka byla poprve použita již v [13] a v moderní podobě v [14].

Tak jako anisotropní teplotní roztažnost mění anisotropně polohy reflexí s teplotou, tak textura (přednostní orientace krystalitů) mění anisotropně intenzity reflexí se změnou orientace difrakčního vektoru. Podmínkou využití textury k separaci překrývajících se reflexí je texturovaný vzorek a znalost textury (např. jejím změřením na nepřekrývajících se reflexích). Máme-li potom n překrývajících se reflexí tak, že můžeme pouze určit jejich souhrnou intenzitu Itot, můžeme získat jejich integrální intenzity Ii (i = 1 ... n) řešením soustavy rovnic (4) můžeme-li určit texturní korekci Ti(aj). Parametr aj označuje m měření difrakčního záznamu při m různých orientacích difrakčního vektoru vůči vzorku, např. náklon vzorku o úhel aj na texturním goniometru.

 

            Itot (a1)              =          I1 T1(a1) + I2 T2(a1) + ... + In Tn(a1)

            Itot (a2)              =          I1 T1(a2) + I2 T2(a2) + ... + In Tn(a2)

            ..............................................................................................                        m ≥ n               (4)

            Itot (am)             =          I1 T1(am) + I2 T2(am) +... + In Tn(am)

Textura jako nástroj pro zisk maximální informace z práškové difrakce byla navržena a poprvé využita v [15] a úspěšně použita v [16, 17].

 

Metody řešení krystalové struktury vyžadující integrované intenzity – metody reciprokého prostoru

Přímé metody

Přímé metody založené na teorii pravděpodobnosti fází pozorovaných strukturních faktorů známe-li jejich moduly, se vyvinuly v mocný nástroj určování krystalových struktur z monokrystalových dat. Nic nám nebrání, pokud se nám podaří získat integrální intenzity jednotlivých reflexí, aplikovat stejné metody na prášková data. Přímé metody vyžadují pro svou úspěšnou funkci kvalitní data s rozlišením odpovídajícím typické meziatomové vzdálenosti v krystalu (~1 Ĺ pro organické látky, nižší rozlišení pro latky s těžkým atomem), což může být problém pro prášková data díky vzrůstajícímu překryvu reflexí se vrůstajícím difrakčním úhlem. Díky menší přesnosti modulů strukturních faktorů získaných z práškových dat a jejich možnému systematickému ovlivnění metodou separace překrývajích se reflexí, standardní statistické testy přímých metod (Wilsonův test, rozdělení normalizovaných modulů, Figures-of-Merit) nemusí vždy spolehlivě fungovat. Dva výpočetní programy přímých metod byly optimalizovány pro užití práškových dat, POWSIM [10] a EXPO [9]. Dekompozice práškového záznamu je jejich integrální součástí, tak jak je diskutováno v předchozí kapitole. Jiný způsob využití teorie, která je základem přímých metod, je maximalizace Sayreovy rovnice vzhledem k fázím, kde je v součtové funkci modulů Pattersonova typu odstraněno maximum v počátku [18].

Pattersonova funkce

Pattersonova funkce byla s úspěchem použita již v raném období práškové difrakce, protože zvláště při aplikaci na struktury obsahující těžký atom je tato metoda robustní a funguje i s daty s nízkým rozlišením. Čitelnost Pattersonových map je však omezena jejich “rozmazáním“ díky problemům uvedeným v předchozím odstavci. Čitelnější mapy lze obdržet z neutronové difrakce zvláště v případě přítomnosti atomu s negativním rozptylovým faktorem. Elegantní způsob “zaostření“ Pattersonových map z práškové difrakce je uveden v [11]. Celková intenzita skupiny překrývajících se reflexí je považována za jeden údaj a digitalizována Pattersonova mapa je rekonstruována na principu maximální entropie tak jak je známo v metodách rekonstrukce obrazu. Stejná procedura může rovněž sloužit ke zlepšení rozdělení celkové intenzity skupiny mezi jednotlivé reflexe, tak jak je uvedeno v předchozí kapitole.

Maximalizování entropie

Princip maximalizování entropie může být uplatněn přímo v procesu konstrukce map elektronových hustot. Ukázalo se [19], že tento přístup je obzvláště užitečný pro data z nižším rozlišením - data z práškové difrakce. Fázování všech strukturních faktorů ze základního souboru se provádí na základě maximalizování vhodné pravděpodobnostní (likelihood) funkce a stejný princip lze použít i pro separaci překrávajících se reflexí. Celý proces lze najít ve výpočetním programu MICE [20].

 

Metody řešení krystalové struktury globální optimalizací strukturního modelu a kompletního difrakčního obrazu – metody přímého prostoru

Základní problém práškové difrakce, obtížnost získání kvalitních odhadů intenzit jednotlivých reflexí, lze obejít tím, že se o žádné odhady nebudeme pokoušet. Místo analýzy (rozkladu) difrakčního obrazu přejdeme k jeho syntéze (simulaci) s “náhodným“ (zde můžeme vložit do procesu dodatečnou chemickou či jinou informaci a zvýšit tak jinak značně deficitní informační obsah dat) strukturním modelem, který dále optimalizujeme vhodným algoritmem globální optimalizace. Můžeme na základě Rietveldova principu porovnávat celý difrakční profil, anebo počítat jenom integrované intenzity a porovnávat je s korelovanámi integrálními intenzitami získanými z WPPF. Pro rozhodování o vhodnosti (fitness) aktuálního strukturního modelu musíme zavést funkci, která bude vhodnost charakterizovat - cost function (CF). Může to být např. parametr Rwp známý z Rietveldovy metody nebo lépe parametr c2

 

c2 = D/(M - N)                       D = ĺi=1…M wi [yobsi - ycali]2                                                      (5)

 

kde yobs a ycal jsou pozorované, s vahou w, a spočtené intenzity v bodě i digitálního difrakčního záznamu a D je kvadratická forma minimalizovaná v Rietveldově metodě pomocí metody nejmenších čtverců pro M pozorování a N volných parametrů. Parametr c2 je vhodnější z důvodu správnější vážené kombinace CF založené na difrakčních datech s CF založené na dodatečných informacích. Při práci s korelovanými integrálnímí intenzitami je takovou CF např. [21]

 

c2 = ĺh ĺk [(Iobsh - Icalh) (Vhk)-1 (Iobsk - Icalk)]                                                                                    (6)

 

kde Iobsh a Icalh jsou pozorované a spočtené integrální intenzity reflexe h a Vhk je matice kovariancí integrálních intenzit reflexí h a k z WPPF (Pawleyho metoda).

CF založené na difrakčních datech mohou být kombinovány s CF založenými na dodatečných pozorováních či chemických informacích. Kombinování (např. součet CF) musí být váženo, správná kvantifikace váh je stále objektem diskuse v literatuře. Nejčastěji používanou ne-difrakční CF je energie krystalové mříže, nejčastěji pro tyto účely popisovaná potenciální energií aktuálního uspořádání atomů. Potenciální energie může být modelována nejjednoduššeji Coulombovskou interakcí (látky z iontovou vazbou) nebo popsána vhodným potenciálem (Buckingham, Leonard-Jones nebo Born-Mayer) za předpokladu, že vhodné parametry potenciálu jsou známé pro daný problém [22]. Pro většinu intermetalických látek stačí popis meziatomové interakce pouze pomocí její repulsivní části – minimální meziatomové vzdálenosti (anti-bump); každý strukturní model obsahující příliš krátké meziatomové vzdálenosti je penalizován vysokou hodnotou této CF. Výpočty ab-initio krystalové energie jsou ve většině případů příliš časově náročné pro jejich použití v globální optimalizaci. Energie krystalové mříže jako součást CF je používaná ve výpočetních programech [23-26], anti-bump CF jsou pak k dizpozici téměř ve všech programech.

Aktuální strukturní model se skládá z jednotlivých strukturních bloků: izolovaných atomů, molekulárních fragmentů, celých molekul, koordinačních mnohostěnů aj. Je výhodné použít jednotný popis strukturních bloků pomocí vnitřních souřadnic (stereochemical descriptors) jako vazebné vzdalenosti, vazebné úhly a torzní úhly. Polohu a orientaci celého bloku pak pomoci tří krystalografických souřadnic (popisujících polohu těžiště anebo jednoduššeji polohu vybraného atomu) a tří úhlů (např. Eulerových). Výhody jsou hned dvojí: nižší počet volných parametrů N (pro popis koordinačního čtyřstěnu potřebujeme 5´3=15 krystalografických souřadnic jednotlivých atomů, ale jenom 3+3=6 polohových a orientačních souřadnic bloku) a jejich přímý fyzikálně-chemický význam umožňující vložení jejich správných hodnot do strukturního modelu. Hodnoty vnitřních souřadnic mohou být buď pevné (rigid body) anebo proměnné v předem odhadnutelném (např. ze znalosti struktur příbuzných krystalů) a většinou úzkém (ne však pro torzní úhly v molekulách) intervalu. Vnitřní souřadnice bloků mohou být obdrženy z kartezských souřadnic daného bloku [27] nebo uloženy v tzv. Z-maticích (http://chemistry.umeche.maine.edu/Modeling/GGZmat.html).

Algoritmus globální optimalizace


Úkolem algoritmu je najít globální minimum celkové CF, kterou si můžeme představit jako hyperplochu v N-rozměrném prostoru (N parametrů, které určujeme). Příklad dvojrozměrného řezu takovou hyperplochou je znázorněn na obr. 2.

Obr. 2: Dvojrozměrný řez 12-rozměrnou hyperplochou c2 famotidinu B ; převzato z [1].

Jak je vidět, hyperplocha CF obsahuje řadu lokálních minim a algoritmus musí být schopen najít minimum globální (odpovídající spravnému strukturnímu modelu), ale i být schopen uniknout z minima lokálního. Je vidět, že jakýkoli algoritmus kontrolovaný pouze gradientem hyperplochy (např. metoda nejmenčích čtverců) skončí dříve či později v lokálním minimu. Je to typický problém globální optimalizace a krystalografie zde našla řadu inspiraci v ostatních vědách jako teoretická fyzika, sociologie (modelování složitých společenských systemů) či ekonomie (předpovídání ekonomických vývojů). Pro více informací o globální optimalizaci lze doporučit [28]. Je nutné zdůraznit, že každý algoritmus globální optimalizace je výpočetně nesmírně náročný. První příklady řešení struktur globální optimalizace strukturního modelu jsou spojeny s předpovídáním existence nových látek na základě minimalizace krystalové energie a prášková difrakční data byla užívána spíše pro kontrolu správnosti modelu a posteriori [29, 30].

1. Trial-and-error, grid search

První práce řešení struktur globální optimalizací s difrakčními daty užívaly jednoduše metodu zkoušky a omylu (trial-and-error) [31], která se, zjednodušeně řečeno, vyvinula v systematické prohledávání objemu elementární buňky [32, 33]. Oba přístupy však brzy narazily na hranice svých možností a bylo jasné, že je musí nahradit “inteligentnější“ algoritmy.

2. Monte Carlo - simulované žíhání

Termín “Monte Carlo“ je v literatuře rezervován pro metodu vzorkování určitého prostoru parametrů (hyperplochy) pomocí náhodných kroků zajištujících ergodicitu vzorkování, t.j. každý bod hyperplochy může být dosažen se stejnou pravděpodobností. Je to globální vzorkování nikoliv optimalizace. Teprve při užití určité “inteligence“, jako např. simulované žíhání se algoritmus stává globální optimalizací. Simulované žíhání se nejčastějí provádí pomocí Metropolisova algoritmu [34] navrženého při simulaci chování soustavy pevných koulí - plynu. Schema algoritmu je na obr. 3.

Obr. 3: Schema Monte-Carlo optimalizace s Metropolisovým algoritmem.

Pravděpodobnost přijmutí “horšího“ modelu stoupá se teplotou žíhání T a zajišťuje, že algoritmus nezůstane během svého optimalizovaného vzorkování uvězněn v lokálním minimu hyperplochy CF. Optimalizace začíná s vysokou teplotou T a s ní i spojenými velkými náhodnými změnami modelu (změny N volných parametrů). To zajišťuje rychlé avšak hrubé vzorkování hyperplochy. V dalších krocích algoritmu se teplota postupně snižuje s cílem jemněji vzorkovat hyperplochu v okolí již globálního minima, kam algoritmus mělo zavést žíhání při vyšší teplotě. Odtud název algoritmu. První užití Monte Carlo optimalizace pro řešení struktur z práškových difrakčních dat [35] užívalo žíhání při konstantní teplotě T. Simulované žíhání s různými způsoby kontroly postupného snižování teploty T je v současné době nejrozšířenější metoda globální optimalizace aplikovaná na řešení struktur z práškových dat [23-25, 36-41]. Při aplikování simulovaného žíhání je nutno správně odhadnout rychlost “chlazení“, která závisí na počtu volných parametrů N a také na kvalitě dat. Velká rychlost vede k “zakalení“ vysokoteplotního modelu (systém zůstane v lokálním minimu), nízká rychlost vede ke neúměrně dlouhým časům optimalizace (je nutno říci, že ne každý běh algoritmu vede do globálního minima; je to přece jenom algoritmus založený na náhodnosti). Proto byla v [42] navržena alternativa algoritmu známá jako paralelní žíhání, které probíhá souběžně při několika teplotách Ti rozdělěných mezi nejnižší a nejvyšší vhodnou teplotu a algoritmus pravidelně porovnává nejlepší řešení (strukturní modely) v sousedních (vzhledem k teplotě) optimalizacích pomocí např. opět Metropolisova algoritmu. Tím je zajištěna přítomnost všech teplot žíhání v každém okamžiku optimalizace a parametry algoritmu jsou tak nezávislé na problému i datech. Velikost náhodných změn strukturního modelu je větší pro vyšší teploty a může být automaticky kontrolována např. předem daným pevným poměrem mezi přijatými “lepšími“ a “horšími“ modely v Metropolisově algoritmu (obr. 3).

Někdy se v krystalografické literatuře setkáme s pojmem “Reverse Monte Carlo“, který je užíván některými autory [43] pro aplikaci tohoto optimalizačního algoritmu na neuspřádané struktury a kapaliny (modelování Pair Distribution Function), ale i na krystalické látky [40].

3. Vývojové teorie - genetický algoritmus

Genetický algoritmus je založen na Darwinově evoluční teorii. Pro historii jeho využití v globální optimalizaci odkazujeme čtenáře na [44], jeho schema je znázorněno na obr. 4.


Obr. 4: Schema genetického algoritmu .

Každý strukturní model z aktuální populace np modelů je popsán svým “chromozomem“, který je souborem “genů“ – strukturních parametrů, které určujeme. Charakteristickou každého modelu – jedince je jeho vhodnost (fitness), popsána opět jednou CF nebo kombinací více CF. Aplikováním genetických operátorů, “páření“ (kombinace genů obou “rodičů“) a náhodné “mutace“, jsou vytvářeni noví jedinci a jejich vhodnost je testována. Dle Darwinova principu o přežití “nejlepších“ jedinců jsou formovány nové a nové generace; populace se vyvíjí směrem ke globálnímu minimu hyperplochy CF. Tak jako v simulovaném žíhání jsou kontrolnímí parametry algoritmu žíhací teplota a velikost náhodných změn modelu, jsou v genetickém algoritmu těmito parametry podíl a typ mutace na změně jedné generace, způsob výběru “rodičů“ a typ jejich “páření“ a velikost populace. Podíl mutace musí být dost výrazný, aby se zamezilo “degeneraci“ genetického fondu (uvěznění v lokálním mimimu), způsob výběru “rodičů“ může být např. “elitistický“. Genetický algoritmus jako metodu globální optimalizace aplikovanou na řešení struktur z práškových dat lze najít např. v [45, 46]. Jeho verze dle Lamarkianovy evoluční teorie [47] aplikuje také “vývoj“ jedince během jeho “života“ pomocí lokální minimalizace (posun jedince k nejbližšímu lokálnímu minimu hyperplochy CF).

4. Další algoritmy

Řada dalších algoritmů byla testována v globální optimalizaci aplikované na řešení struktur z práškových dat. Jmenujme zde pouze algoritmus založený na sociálním chování hejna jedinců, “swarm“, aplikovaný v [48] a velmi slibný hybridní Monte Carlo algoritmus, aplikovaný v [49], který kombinuje výhody Monte Carlo vzorkování hyperplochy CF s efektivností lokalizace jejích minim pomocí formalismu molekulární dynamiky.

Který algoritmus je nejlepší? Přímá odpověď neexistuje neboť srovnání není jednoduché a závisí ve velké míře na problému, na který globální optimalizaci aplikujeme. Simulované žíhání má však velkou výhodu oproti genetickému algoritmu v menším počtu kontrolních parametrů algoritmu a může být proto snadněji naprogramován (zvlástě ve své podobě paralelního žíhání) jako “black-box“ algoritmus. Řada pokusů byla také učiněna o kombinaci výhod obou algoritmů v jeden hybridní [50].

Jak pomoci globální optimalizaci?

Pravděpodobnost nalezení globálního minima lze zvýšit omezením objemu elementární buňky, kterou musí algoritmus vzorkovat (to odpovídá zjednodušení tvaru hyperplochy CF). Lze použít např. informaci o molekulárních obálkách, metodu známou z krystalografie proteinů (kde prášková difrakce našla řadu inspirací, protože se potýká se stejným problémem, nízký poměr počtu dat k volným parametrům). Molekulární obálky jsou vlastně Fourierovy mapy s velmi nízkým rozlišením (periodické nodální plochy), zpočtené z několika nízkoúhlových dobře rozlišených reflexí. Iso-plochy v takovéto mapě od sebe oddělují oblasti s vyšší (polohy atomů) a nízkou (prázdné oblasti) elektronovou hustotou. Algoritmus globální optimalizace pak prohledává jen ty první. Aplikaci lze najít v [51].

Na začátku optimalizace je strukturní model mnohem více vzdálen od pravdivého řešení než když se algoritmus blíží globálnímu minimu. Tuto informaci lze do algoritmu vložit pomoci pravděpodobnosti (likelihood), že takový model bude odpovídat pozorovaným difrakčním (či jiným) datům. Hrubě řečeno modifikujeme algoritmus tak, aby byl více “tolerantní“ ke špatným modelům a nebral je příliž “vážně“. Myšlenku lze rozšířit tak, že produkujeme úmyslně špatný model tím, že je jenom částečný (vynecháme např. molekulu rozpouštědla). Takový model je pak menší (méně volných parametrů) a hyperplocha CF jednodušší. Chybějící část modelu (blur) a její příspěvek do difrakce však musí být správně popsán, právě pomocí maximum likelihood formalismu. Aplikaci lze najít v [52].

Poslední příspěvek, výpočetní program FOCUS, vlastně nepatří do metod globální optimalizace strukturního modelu, ale zařazujeme ho zde, protože využívá také “inteligentní“ vzorkování přímého prostoru (elementární buňky). Je to metoda, která pracuje s integrálními intensitami obdrženými s práškového difrakčního záznamu a používá dodatečnou chemickou informaci (znalost typických topologií, atomových koordinací, příbuzných krystalových struktur) pro interpretaci a vzorkování Fourierových map elektronových hustot. Při nalezení “slibného“ fragmentu v mapě je celý cyklus opakován s fázemi reflexí obdrženými z tohoto částečného strukturního modelu až do identifikace modelu schopného již vypřesňování. Aplikaci na krystalografii zeolitů lze najít v [53].

 

 

Závěr

Zde končí etapa řešení strukury, na kterou navazuje vypřesnění struktury prováděné dnes téměř výhradně pomocí Rietveldovy metody a analýzy Fourierových map. Jak je vidět z obr. 1 neexistuje jediná “zlatá“ cesta v bludišti řešení krystalových struktur pomocí práškové difrakce. Výkonnost metod pracujících v reciprokém a v přímém prostoru je dnes srovnatelná jak pro molekulární krystaly, tak i pro látky neobsahující jasně definované molekuly (extended crystals, inorganické látky). Větší úspěšnost jedné nebo druhé metody je silně podmíněna daným problémem. Vývoj obou typů metod stále intenzivně pokračuje, je zajímavé podotknout, že úspěch globální optimalizace není dán jenom vzrůstem výpočetní výkonnosti, ale ve velké míře i vývojem lepších algoritmů.

Ve spěchu aplikace dnešních výkonných metod práškové difrakce je však nutno nezapomenout na první kroky v bludišti obr. 1, vzorek a měření dat. Více času stráveného na syntéze naší látky produkující vzorek bez příměsí a s užšími difrakčními liniemi jakož i na optimalizaci difrakčního experimentu se nám bohatě vrátí ve snazší analyze dat. Staré přísloví stále platí: “práce kvapná, málo platná“.

Odkazy

 

[1]       David W.I.F, Shankland K., McCusker L.B. & Baerlocher Ch., Editors; Structure Determination from Powder Diffraction Data, IUCr. Monographs on Crystallography 13, Oxford University Press, 2002

[2]       Visser, J.; J. Appl. Crystallogr. 2 (1969) 89-95

[3]       Boultif, A. & Loüer, D.; J. Appl. Crystallogr. 24 (1991) 987-993

[4]       Werner, P.-E., Eriksson, L. & Westdahl, M. ; J. Appl. Crystallogr. 18 (1985) 108-113

[5]       Rietveld, H.M.; J. Appl. Crystallogr. 2 (1969) 65-71

[6]       Le Bail, A.; Accuracy in Powder Diffraction II, Proceedings of the International Conference, May 26-29, 1992 NIST Special Publication 846, E. Prince and J.K. Stalick, Editors page 213.

Také: http://www.cristal.org/iniref/lbmeth.html

[7]       Pawley, G.S.; J. Appl. Crystallogr. 14 (1981) 357-361

[8]       Markvardsen, A., David, W.I.F., Johnson, J.C. & Shankland, K.; Acta Crystallogr. A57 (2001) 47-54

[9]       Altomare, A., Foadi, J., Giacovazzo, C., Guagliardi, A. & Moliterni, A.G.G.; J. Appl. Crystallogr. 29 (1996) 674-681

            Také: http://www.irmec.ba.cnr.it/

[10]     Jansen, J., Peschar, R. & Schenk, H. ; J. Appl. Crystallogr. 25 (1992) 237-243

[11]     David, W.I.F.; J. Appl. Crystallogr. 20 (1987) 316-319

[12]     Estermann, M.A. & Gramlich, V.; J. Appl. Crystallogr. 26 (1993) 396-404

[13]     Zachariasen, W.H. & Ellinger, F.H.; Acta Crystallogr. 16 (1963) 369-375

[14]     Shankland, K., David, W.I.F. & Sivia, D.S.; J. Mater. Chem. 7(3) (1997) 569-572

            Také: Brunelli, M., Wright, J.P., Vaughan, G.B.M., Mora, A.J. & Fitch, A.N.; Angew. Chem. Int. Ed. 42 (2003) 2029-2032

[15]     Dahms, M. & Bunge, H.J.;  Textures and Microstructures 6 (1986) 167-179

            Také: Bunge, H.J., Dahms, M. & Brokmeier, H.G.; Cryst. Rev. 2 (1989) 67-88

            Také: Hedel, R., Bunge, H.J. & Reck, G.; Textures and Microstructures 29 (1997) 103-126

[16]     Wessels, T., Baerlocher, Ch., McCusker, L.B. & Creyghton, E.J.; J. Am. Chem. Soc. 121 (1999) 6242-6247

Také: Wessels, T., Baerlocher, Ch. & McCusker, L.B.; Science 284 (1999) 477-479

            Také: http://www.kristall.ethz.ch/LFK/research/zeolite_group/Texture/Texture.html

[17]     Černý, R.; Advances in X-ray Analysis 40 (1998) CD-ROM

            Také: Černý, R. Mat. Sci. Forum 321-324 (1999) 22-28

            Také: Černý, R. Mat. Sci. Forum 378-381 (2001) 24-29

            Také: http://crystsun1.unige.ch/cerny/rcerny.htm

[18]     Rius, J.; Acta Crystallogr. A49 (1993) 406-409

[19]     Bricogne, G.; Acta Crystallogr. A47 (1991) 803-829

[20]     Gilmore, C.J. & Nicholson, W. ; Trans. Amer. Cryst. Association. 30 (1994) 15-27 Také: http://www.chem.gla.ac.uk/staff/chris/powder.htm

[21]     Shankland, K., David, W.I.F. & Csoka, T.; Z. Kristallogr. 212 (1997) 550-552

[22]                 GULP(General Utility Lattice Program)

Také: http://www.ch.ic.ac.uk/gale/Research/gulp.html

[23]     Engel G.E., Wilke S., Knig O., Harris K.D.M. & Leusen F.J.J.; J. Appl. Cryst. 32 (1999) 1169-1179

            Také: http://www.accelrys.com/cerius2/powder.html

[24]     TOPAS User’s Manual, Bruker AXS GmbH, 2000

            Také: Coelho, A.A.; J. Appl. Cryst. 33 (2000) 899-908

[25]     Putz H., Schön J.C. & Jansen M.; J. Appl. Cryst. 32 (1999) 864-870

            Také: http://www.crystalimpact.com/endeavour/

[26]                 Kariuki B.M., Serrano-Gonzáles H., Johnston R.L. & Harris K.D.M.; Chem. Phys. Lett. 280 (1997) 189-195

[27]     Andreev Y.G., Lighfoot, P. & Bruce P.G.; J. Appl. Cryst. 30 (1997) 294-305

[28]     Floudas, C.A.; Deterministic Global Optimization: Theory, Algorithms and Applications, Kluwer, Dordrecht 1999.

            Také: http://www.princeton.edu/~chemical/faculty/floudas/floudas.html

[29]     Catlow, C.R.A., Cormack, A.N. & Theobald, F. ; Acta Crystallogr. B40 (1984) 195-200

[30]     Deem, M.W. & Newsam, J.M.; Nature 342 (1989) 260-262

[31]     Taylor, J.C. & Wilson, P.W.; Acta Crystallogr. B30 (1974) 2664-2667

[32]     Chernyshev, V.V. & Schenk, H.; Z. Kristallogr. 213 (1998) L1-L3

[33]     Masciocchi, N., Bianchi, R., Cairati, P., Mezza, G., Pulati, T. & Sironi, A.; J. Appl. Cryst. 27 (1994) 426-429

[34]     N. Metropolis, A.W. Rosenbluth, M.N. Rosenbluth, A.H. Teller and E. Teller:  J.Chem. Phys. 21 (1953) 1087-1092

[35]     Harris, K.D.M., Tremayne, M., Lightfoot, P. & Bruce, P.G.; J. Am. Chem. Soc. 116 (1994) 3543-3547

[36]     Andreev Y.G., MacGlashan G.S. & Bruce P.G.; Phys. Rev B, Cond. Matter 55 (1997) 12011-12017

[37]                 David W.I.F., Shankland K. & Shankland N.; J. Chem Soc. Chem. Commun. 8 (1998) 931-932

            Také: http://www.ccdc.cam.ac.uk/prods/dash/#ref1

[38]     Pagola, S., Stephens, P.W., Bohle, D.S., Kosar, A.D. & Madsen, S.K.; Nature 404 (2000) 307-310

            Také: http://powder.physics.sunysb.edu/programPSSP/pssp.html

[39]     Favre-Nicolin, V. & Černý, R.; J. Appl. Cryst. 35 (2002) 734-743

            Také: http://objcryst.sourceforge.net/

[40]       Le Bail, A; Materials Science Forum 378-381(2001) 65-70

            Také:  http://www.cristal.org/sdpd/espoir/index.html

[41]     Toraya, H. & Yamazaki, S.; Acta Crystallogr. B58 (2002) 613-621

[42]     Falcioni M. & Deem. M.W.; J. Chem. Phys. 110 (1999) 1754-1766

            Také: http://ccp14.semo.edu/ccp/web-mirrors/zefsa/zefsaII/

[43]     Tucker, M.G., Dove, M.T. & Keen, D.A.; J. Appl. Cryst. 34 (2001) 630-638

            Také: http://www.studsvik.uu.se/Software/rmc/rmcpow.htm

[44]     Michalewicz, Z.; Genetic Algorithms + Data Structures = Evolution Programs,

3rd edn., Springer-Verlag, Berlin 1996

[45]     Shankland K., David W.I.F. & Csoka T.;  Z. Kristallogr. 212 (1997) 550-552

[46]                 Kariuki B.M., Serrano-Gonzáles H., Johnston R.L. & Harris K.D.M.; Chem. Phys. Lett. 280 (1997) 189-195

            Také: http://www.dur.ac.uk/j.m.hutson/ccp6-98/node36.html

[47]     Turner, G.W., Tedesco, E., Harris, K.D.M., Johnston, R.L. & Kariuki, B.M.;

Chem. Phys. Letters 321 (2000) 183-190

[48]     Csoka, T. & David, W.I.F.; Acta Crystallogr. A55 (1999) Supplement

[49]     Johnston J. C., David W. I. F., Markvardsen A. J. and Shankland K.; Acta Cryst. A 58 (2002) 441-447

[50]     http://www.densis.fee.unicamp.br/~moscato/memetic_home.html

            Také: http://bruce.edmonds.name/aigp/

[51]     Brenner S., McCusker L. B. & Baerlocher Ch.; J. Appl. Cryst. 35 (2002) 243-252

Také:http://www.kristall.ethz.ch/LFK/research/zeolite_group/PNS/Structure_Envelopes.html

[52]     Markvardsen A.J, David W.I.F. & Shankland K.;  Acta Cryst. A58 (2002) 316 – 326

[53]     Grosse-Kunstleve R.W., McCusker L.B. & Baerlocher Ch.; J. Appl. Cryst. 30 (1997) 985-995

            Také: http://www.kristall.ethz.ch/LFK/research/zeolite_group/FOCUS/FOCUS.html