Predicciones fiables de estructuras cristalinas a partir de primeros principios

Noticias

HogarHogar / Noticias / Predicciones fiables de estructuras cristalinas a partir de primeros principios

Apr 26, 2023

Predicciones fiables de estructuras cristalinas a partir de primeros principios

Volumen de comunicaciones de la naturaleza

Nature Communications volumen 13, Número de artículo: 3095 (2022) Citar este artículo

3507 Accesos

8 citas

8 Altmetric

Detalles de métricas

Se ha desarrollado un método económico y fiable para la predicción de la estructura cristalina molecular (CSP). El nuevo protocolo CSP parte de un gráfico bidimensional de los monómeros del cristal y no utiliza información experimental. Utilizando los resultados de los cálculos de mecánica cuántica para dímeros moleculares, se desarrolla un campo de fuerza preciso de dos cuerpos, monómero rígido ab initio (aiFF) para el cristal. Dado que los CSP con aiFF son esencialmente tan costosos como con los FF empíricos, se pueden optimizar decenas de miles de polimorfos plausibles generados por los procedimientos de empaquetamiento de cristal. Aquí mostramos la solidez de este protocolo que encontró el cristal experimental dentro de los 20 polimorfos predichos más estables para cada una de las 15 moléculas investigadas. La clasificación se refinó aún más mediante la realización de cálculos periódicos de la teoría funcional de la densidad (DFT) más la corrección de la dispersión (pDFT+D) para estos 20 polimorfos mejor clasificados, lo que dio como resultado que el cristal experimental se clasificara como el número uno para todos los sistemas estudiados (y el segundo). polimorfo, si se conoce, clasificado entre los primeros). Alternativamente, los polimorfos generados se pueden usar para mejorar los aiFF, lo que también conduce a predicciones de rango uno. El protocolo de CSP propuesto debería dar como resultado que los aiFF reemplacen a los FF empíricos en la investigación de CSP.

Las propiedades de los sólidos cristalinos dependen críticamente de la forma polimórfica de una sustancia dada y muchos cristales pueden existir en varias de estas formas1,2. El conocimiento de posibles formas polimórficas estables de un cristal es de particular importancia para la industria farmacéutica3. Si durante la fabricación de un fármaco cristaliza un polimorfo diferente al obtenido en los laboratorios, tendrá propiedades fisicoquímicas diferentes y puede dar lugar a efectos terapéuticos indeseables, dos ejemplos son el ritonavir4,5 y la rotigotina6,7,8. Por tanto, en el proceso de desarrollo de fármacos, a uno le gustaría saber si el polimorfo utilizado es termodinámicamente la forma más estable en condiciones ambientales. En la industria de la defensa, los desarrollos de materiales energéticos son costosos y muy peligrosos9,10 y el conocimiento a priori de la estructura cristalina de los materiales teóricos permitiría acelerar el cribado de dichos materiales. También la industria de semiconductores puede beneficiarse de dicho conocimiento11. Los métodos CSP responden a estas necesidades encontrando un conjunto de polimorfos cristalinos más estables de una molécula determinada a partir de su diagrama bidimensional y sin utilizar ninguna información experimental específica para esta molécula.

Los CSP confiables para cristales moleculares a partir del conocimiento de solo diagramas bidimensionales de monómero (s) fueron casi imposibles durante mucho tiempo. En 1988, Maddox12 describió la falla de los CSP como un escándalo continuo en las ciencias físicas y afirmó que, en general, incluso los sólidos cristalinos más simples plantean un gran desafío. A mediados de la década de 1990, Gavezzotti13 planteó la pregunta fundamental: '¿Son predecibles las estructuras cristalinas?', y su respuesta fue 'No'. En respuesta a esta crítica, el Centro de datos cristalográficos de Cambridge (CCDC) realizó una serie de pruebas "ciegas"14,15,16,17,18,19 proporcionando solo diagramas bidimensionales de monómeros de cristales que se han medido pero no publicado y solicitar a los grupos de investigación que envíen sus predicciones, con los resultados de la primera prueba publicados en 2000. Si bien el campo ha avanzado significativamente desde la primera prueba, los resultados de la última, la sexta prueba19, aún no son completamente satisfactorios. Los grupos participantes lograron una tasa de éxito entre el 13% y el 57% (sin incluir los polimorfos C y E del sistema XXIII), donde el éxito significa que el polimorfo experimental se encontró entre los polimorfos en dos listas que contenían 100 polimorfos cada una.

Cabe señalar aquí que las predicciones de las estructuras de los cristales son en realidad un problema difícil para la ciencia física, al contrario de lo que implicaba Maddox12. La razón es la alta dimensionalidad del espacio conformacional y cristalográfico que da como resultado miles de polimorfos plausibles producidos por el muestreo de este espacio dentro de una ventana relativamente estrecha de densidades y energías de red. Las distancias energéticas entre polimorfos consecutivos ordenados por energía reticular son del orden de 1 kJ/mol en el extremo de baja energía, lo que requiere precisiones casi imposibles de lograr mediante FF empíricas. Además, para los polimorfos observados experimentalmente, las diferencias entre sus energías reticulares calculadas son del mismo orden20.

Si bien existen varias variantes de CSP, incluido un uso reciente de redes neuronales profundas21, la mayoría de los grupos que participaron en la sexta prueba ciega utilizaron alguna forma de FF, en su mayoría de carácter empírico. Neumann et al.22,23 desarrollaron el protocolo de CSP más exitoso que consta de muestreo de espacio polimorfo más minimización de energía de red. Este protocolo utiliza un FF a la medida que se obtiene refinando los parámetros de un FF empírico para reproducir lo más cerca posible las energías de red pDFT+D (y sus derivados). Los polimorfos iniciales para los cálculos de pDFT+D se obtienen utilizando la FF empírica. El método está incluido en el paquete de software comercial GRACE (Generation Ranking and Characterization Engine)24, pero algunos de sus detalles no están disponibles. Las revisiones recientes del campo de los CSP se pueden encontrar en las refs. 25,26,27,28,29,30,31.

En el presente trabajo, se propone un protocolo CSP basado completamente en los primeros principios, es decir, que no utiliza ninguna información experimental. Dado que la característica principal de este método es el uso de aiFF, nos referiremos a él como el protocolo CSP (aiFF). Este protocolo consta de varias etapas que se muestran en la Fig. 1. Si bien los aiFF se han utilizado en los CSP durante algún tiempo19,32,33,34, tales predicciones tomaban mucho tiempo (varios meses como mínimo), requerían una gran cantidad de esfuerzo humano. , y eran posibles para monómeros con hasta aproximadamente 20 átomos. En el presente trabajo, se combinan cuatro desarrollos recientes para reducir drásticamente los costos y aumentar la previsibilidad de tales CSP: (a) El desarrollo de una variante muy efectiva35 de la teoría de la perturbación adaptada a la simetría (SAPT)36 para cálculos ab initio de energías de interacción; (b) La creación de autoPES37,38: un método automático, efectivo y confiable para la generación de superficies de energía potencial (PES) con una participación humana mínima; (c) Permitir el uso de tales AiFF en la etapa de minimización de la energía de red de los CSP, una parte del presente trabajo; ( d ) La aplicación de pDFT + D para un refinamiento final de las clasificaciones de polimorfos. La etapa 3 de la figura 1 puede producir incluso millones de polimorfos a bajo costo y la experiencia anterior indica que los polimorfos experimentalmente relevantes casi siempre se encuentran entre ellos. Por lo tanto, la esencia de los protocolos CSP es filtrar todos los polimorfos relevantes de baja energía de red de este conjunto. En los últimos años, varios grupos han demostrado que la optimización geométrica pDFT+D de polimorfos coloca al polimorfo experimental clasificado entre los primeros, a menudo como el número uno19,39,40,41. Sin embargo, tales cálculos son tan costosos que solo se pueden permitir para un centenar de polimorfos. Por el contrario, si se utiliza un FF en la Etapa 4, se pueden optimizar decenas de miles de polimorfos. Este FF tiene que ser lo suficientemente preciso para no perder ningún polimorfo importante. Por lo tanto, tanto el método ab initio como el ajuste a las energías de interacción calculadas usando este método deben tener incertidumbres suficientemente pequeñas. En los cálculos de las energías de interacción de los dímeros, la variante de SAPT que usamos (ver "Métodos") es casi tan precisa35,42,43 como el método de agrupamiento acoplado con excitaciones simples, dobles y triples no iterativas, CCSD(T), el " "estándar de oro" de la teoría de la estructura electrónica, pero es significativamente menos costoso. Para evitar la pérdida de precisión debido al ajuste, la forma de la función de ajuste debe ser significativamente más complicada que las de los FF empíricos que normalmente se construyen a partir de los potenciales de Lennard-Jones más Coulomb, consulte "Métodos". La forma extendida puede adaptarse a datos ab initio con incertidumbres de alrededor de 1 kJ/mol, lo que demostraremos que es suficiente para CSP confiables. Esta forma nunca se ha utilizado en minimizaciones de energía de red y tuvimos que modificar el software CSP para que fuera posible. Finalmente, para que la Etapa 2 sea asequible, la cantidad de puntos de cuadrícula ab initio necesarios para adaptarse a un aiFF debe ser razonablemente pequeña. El método autoPES37,38 reduce este número en dos órdenes de magnitud en comparación con los enfoques de ajuste de superficie típicos, reduciendo así los costes de desarrollo en la misma proporción. También reduce la cantidad de participación humana casi a cero, ya que todo el proceso está completamente automatizado. Mostramos a continuación que el protocolo propuesto encontró el cristal experimental clasificado como el número uno para las 15 moléculas estudiadas (y el segundo polimorfo, si se conoce, clasificado entre los primeros).

Etapa 1: minimización de la energía del monómero para encontrar la geometría de equilibrio. Etapa 2: cálculos ab initio de las energías de interacción intermolecular de los dímeros seguidos del ajuste de una forma analítica de aiFF a estos datos. Etapa 3: generación de millones de arreglos de empaquetamiento plausibles de polimorfos mediante el muestreo de diferentes grupos espaciales, orientaciones de monómeros y parámetros de celda unitaria, seguido de una reducción de este conjunto a decenas de miles de polimorfos utilizando criterios de densidad o minimizaciones de energía reticular cruda con simple FF. Etapa 4: minimización fina con aiFFs para todos los polimorfos en el conjunto reducido. Etapa 5: refinamiento de la clasificación a través de cálculos de pDFT+D en un par de docenas de polimorfos mejor clasificados de la Etapa 4.

Para evaluar el rendimiento de nuestro método, llevamos a cabo CSP para 15 moléculas, incluidos varios sistemas de las pruebas ciegas CCDC14,15,16,17,18,19 (indicadas con números romanos), así como para metanol, benceno, nitrometano, 5,5′-dinitro-2H,2′H-3,3′-bi-1,2,4-triazol (DNBT), 1-3-5-trinitrobenceno (TNB), deferiprona y fluorouracilo. Los gráficos moleculares se muestran en la Fig. 1 complementaria. Los resultados se resumen en la Tabla 1. Una versión extendida de esta tabla está disponible en la Tabla 1 complementaria.

El protocolo CSP (aiFF) clasificó el polimorfo experimental como el número 1 en 5 casos, como el número 2-6 en 7 casos y como los números 9, 9 y 16. También hemos incluido un segundo polimorfo identificado experimentalmente en los casos de sistema I, benceno y deferiprona, indicados como "Poly2" en la Tabla 1, y estos se clasifican con los números 8, 4 y 8, respectivamente. Después de los cálculos de pDFT+D en los 20 polimorfos mejor clasificados de cada cristal, sin ninguna optimización geométrica adicional, un cristal experimental se clasificó como el número 1 en cada caso. Para la deferiprona, Poly2 pasó a ser el polimorfo de rango 1, mientras que Poly1 permaneció en el rango 2. Para el sistema I y el benceno, Poly2 cambió de rango de 8 a 2 y de 4 a 3, respectivamente. Los RMSD20 entre los cristales calculados y experimentales varían entre 0,09 y 0,67 Å, ​​por debajo del umbral CCDC de 0,8 Å. Además, las densidades y los parámetros de las celdas, que se muestran en la Tabla complementaria 1, concuerdan muy de cerca. La Fig. 2 complementaria muestra las desviaciones porcentuales entre los parámetros de red calculados y experimentales. Los errores promedio para los parámetros de celda a, b, c y β ascienden a 4,3 %, 2,6 %, 4,3 % y 2,4 %, respectivamente. Tal nivel de predictividad no tiene precedentes para un protocolo CSP basado completamente en los primeros principios. Las superposiciones de los polimorfos experimentales con los calculados más cercanos se muestran en la Fig. 2. Esta figura permite una apreciación intuitiva de cuán cerca están estas estructuras. Este rendimiento excepcional de CSP (aiFF) se ha logrado a pesar de que los sistemas investigados presentan dificultades típicas debido a la cercanía de las energías reticulares de los polimorfos y a pesar de utilizar la aproximación de monómero rígido. Los paisajes de energía de red frente a densidad de las minimizaciones de aiFF para los sistemas IV y XXII se muestran en la Fig. 3 complementaria. Los gráficos análogos para los otros sistemas se ven similares. Los 100 polimorfos de energía más baja distribuyen el rango de alrededor de 5 kJ/mol para los sistemas I, XII, XIII, benceno y nitrometano, alrededor de 10 kJ/mol para los sistemas II, IV, VIII, XVI, XXII, metanol, TNB, deferiprona y fluorouracilo, y alrededor de 20 kJ/mol para DNBT. En el extremo de baja energía, las diferencias de energía entre polimorfos consecutivos son inferiores a 1 kJ/mol, es decir, comparables a los RMSE de los ajustes sobre todas las configuraciones de dímeros con energías de interacción negativas, que se muestran en la Tabla 1.

Superposición de la estructura cristalina experimental (colores específicos del elemento) con la estructura cristalina calculada más cercana (verde) usando aiFF basados ​​en SAPT (DFT) para sistemas: a y b I, c II, d IV, e VIII, f XII, g XIII, h XVI, i XXII, j metanol, k y l benceno, m nitrometano, n DNBT, o TNB, p y q Deferiprona, r Fluorouracilo.

El uso de la forma funcional extendida de aiFF en las minimizaciones de energía de red en lugar de la forma más simple exp-6-1 (sin incluir un polinomio frente a exponencial, funciones de amortiguamiento, etc., consulte "Métodos") utilizado en algunos FF empíricos conduce a enormes mejoras en las clasificaciones. Para cuantificar tales mejoras, realizamos minimizaciones de energía de red con la forma exp-6-1 de aiFFs, ajustada usando el mismo nivel de teoría que en el caso de la forma extendida, para los sistemas I, II, IV y XXII, logrando clasificaciones de 138, 2231, 49 y 60, respectivamente, mientras que las clasificaciones de la forma aiFF extendida para estos sistemas son 1 o 2, consulte la Tabla 1. La razón principal de esta mejora es que los RMSE para las energías de interacción negativas son de 2,3 a 5,3 veces menor en el último caso (estas relaciones están correlacionadas con el número de parámetros de ajuste: por ejemplo, 30 y 270 para el exp-6-1 y la forma extendida, respectivamente, en el caso del sistema IV).

Para cuantificar mejor el poder predictivo de nuestro enfoque, se han realizado cálculos análogos a los descritos anteriormente con un FF empírico. Hemos elegido el W99 FF44 con cargas puntuales calculadas por nosotros utilizando el método CHELPG45. Para los 18 polimorfos experimentales considerados, W99+charges FF encontró el 33% de ellos en el rango 10 o mejor, mientras que el resultado análogo para aiFF (sin el paso pDFT+D) es del 94%. Esto equivale a una diferencia cualitativa para las aplicaciones tecnológicas. Para obtener más detalles sobre los CSP con W99+charges FF, consulte las tablas complementarias 1 y 2.

Uno puede preguntarse por qué se necesitan los cálculos de pDFT+D para mejorar las clasificaciones, mientras que varias comparaciones sobre las energías de interacción de referencia, véanse, por ejemplo, las refs. 42,43, muestran que SAPT(DFT) es casi tan preciso como CCSD(T) y más preciso que los métodos DFT+D. La razón principal es que lo que se usa en los CSP son aiFF, e incluyen incertidumbres adicionales debido al ajuste. Aunque el error de ajuste promedio para las energías de interacción negativas es de solo ~1 kJ/mol, los errores pueden ser mayores en algunas configuraciones. Si una configuración con una energía de interacción demasiado negativa es importante para un polimorfo, este polimorfo puede volverse demasiado estable y, por lo tanto, demasiado clasificado. Otras dos posibles razones, el tamaño del conjunto de bases y el descuido de los efectos de muchos cuerpos en CSP (aiFF), se analizan en Información complementaria y es poco probable que sean una razón. Para mejorar las predicciones de la Etapa 4, hemos desarrollado una versión alternativa de nuestro método, alt-CSP(aiFF). Después de ejecutar el protocolo CSP(aiFF) menos la etapa pDFT+D, se examinan las geometrías de 20 polimorfos con las energías de red más bajas y se identifican los dímeros vecinos más cercanos consecutivos. Luego se realizan cálculos SAPT para estos dímeros, se reajusta el aiFF y se realizan minimizaciones de red para los 20 polimorfos con el nuevo aiFF. Este procedimiento se itera hasta que las energías de los clusters 5x5x5 extraídos de cada polimorfo computado de dos formas: solo del aiFF y de forma híbrida, reemplazando las energías de interacción del aiFF por las del SAPT disponible, son las mismas dentro de un cierto umbral. Hemos aplicado alt-CSP (aiFF) a dos de los cristales de peor clasificación de la Tabla 1: sistema XVI (rango 16) y fluorouracilo (rango 9). En cada caso, alt-CSP(aiFF) dio como resultado el polimorfo experimental en el rango 1, mientras que RMSD20 se redujo de 0,29 a 0,15 Å y de 0,61 a 0,42 Å, respectivamente. Por lo tanto, alt-CSP(aiFF) puede usarse sin la etapa pDFT+D. Sin embargo, los cálculos ab initio adicionales son tan caros como los de pDFT+D, por lo que no hay ganancia en términos de eficiencia.

El método propuesto no solo es altamente confiable, como se muestra arriba, sino que también es muy eficiente en comparación con formas alternativas de combinar CSP basados ​​en FF con cálculos de pDFT+D. Para demostrar esto, mostramos en la Fig. 3 los costos de tres posibles estrategias CSP en términos de tiempos de pared de un solo núcleo en el ejemplo del sistema I. Tenga en cuenta que este tipo de cálculos generalmente se realizan en cientos de núcleos, por lo que la pared real el tiempo es solo un par de horas para la Estrategia 1, el enfoque propuesto aquí. La mayor parte del tiempo para la Estrategia 1, 7 días centrales, se dedica al desarrollo de un aiFF y la mayor parte de este tiempo se utiliza para calcular las energías de interacción SAPT (DFT) para configuraciones de 706 dímeros, con muy poco tiempo dedicado a ajustar estas energías. . La siguiente etapa, el empaquetamiento y minimización (PACK+MIN) de cientos de miles de cristales, requiere solo menos de un tercio de un día. La etapa final, los cálculos de pDFT+D para los 20 polimorfos principales en geometrías aiFF, requiere aproximadamente un día. La estrategia hipotética 2 difiere de la estrategia 1 por el uso de un FF empírico en la etapa PACK+MIN y por realizar cálculos de pDFT+D para 100 polimorfos con reoptimización de geometrías (este número de polimorfos se eligió como una compensación entre la tasa de éxito y costes computacionales). El tiempo requerido para la última etapa sería de 70 días centrales, por lo que la Estrategia 2 es aproximadamente un orden de magnitud más costosa que la Estrategia 1. Además, si se usara el FF de carga W99+, la tasa de éxito de la Estrategia 2 en el conjunto de 18 polimorfos examinados aquí serían del 72 % (consulte la Tabla complementaria 2), mientras que la tasa de éxito de la estrategia 1 ya es del 100 % con 16 polimorfos clasificados en la parte superior. Todas las barras PACK+MIN parecen tener aproximadamente la misma altura para aiFF y para el FF empírico. Esto se debe a que el cálculo de la energía de la red es solo dos veces más costoso en el primer caso. La estrategia hipotética 3 realiza cálculos de pDFT+D con optimización de geometría para los 25 500 polimorfos producidos por PACK+MIN. Esta estrategia tendría una confiabilidad muy alta (ya que la práctica indica que los polimorfos experimentales casi siempre se incluyen en un grupo tan grande de estructuras candidatas), pero sería extremadamente costoso, 49 años de un solo núcleo y, por lo tanto, no sería práctico (aunque posible). si se usaran unos pocos miles de núcleos). Con el uso de un FF empírico, se puede establecer el número de polimorfos incluidos en la etapa pDFT+D entre 100 y 25 000, aumentando sistemáticamente los costos y la confiabilidad en relación con la estrategia 2. Sin embargo, con las cargas W99+ y nuestro conjunto de polimorfos, la tasa de éxito se mantendría en 72 % hasta que el número de polimorfos sea de al menos 589. Para las Estrategias 2 y 3, la etapa PACK+MIN puede ser reemplazada por cualquier otro protocolo que produzca el número requerido de polimorfos candidatos, con efectos insignificantes en el total horarios

Tiempos de pared totales requeridos para los CSP del sistema I en un solo núcleo del procesador Intel E5-2670 usando diferentes estrategias. Las filas "aiFF", "PACK+MIN" y "pDFT+D" indican tiempos de desarrollo, empaquetado y minimización de un aiFF, y de cálculos periódicos de DFT+D.

Dado que los aiFF son sumas de interacciones de dos cuerpos, ignoran los efectos de muchos cuerpos mencionados anteriormente y discutidos en Información complementaria. Si bien mostramos que estos efectos no son críticos en los CSP para los cristales considerados aquí, pueden ser significativos para algunos otros cristales46,47,48. El efecto de muchos cuerpos más importante, la polarización de muchos cuerpos, puede explicarse usando aiFF polarizables que pueden desarrollarse usando autoPES, pero que aún no están implementados en nuestros códigos CSP. En Información complementaria, también explicamos por qué el conjunto de bases relativamente pequeño que usamos es adecuado para los CSP. Un efecto ignorado mucho más importante es la flexibilidad de los monómeros. Aunque se asumió que los monómeros considerados por nosotros eran rígidos, el protocolo CSP (aiFF) propuesto se puede aplicar a monómeros con grados de libertad suaves. Dichos monómeros pueden deformarse significativamente en cristales en comparación con sus estructuras de equilibrio en fase gaseosa. La versión reciente de autoPES38 tiene la capacidad de calcular las energías de interacción que representan todos los grados de libertad de los intramonómeros o algunos seleccionados, y la mayoría de los códigos CSP pueden realizar empaquetamiento y minimización, incluidos todos los grados de libertad, por lo que tales predicciones se pueden realizar completamente desde los primeros principios. Sin embargo, los costos de dichos cálculos aumentan abruptamente con el número total de grados de libertad. Una forma de solucionar este problema es suponer la separación de los grados de libertad inter e intramonómeros en la Etapa 2, como se ha hecho en todos los FF biomoleculares y en todos los FF utilizados en CSP de monómeros flexibles. Dado que nuestros aiFF dependen solo de las separaciones entre átomos de diferentes monómeros, las energías de interacción se pueden calcular para configuraciones arbitrarias de monómeros. Tal FF de intermonómero "flexibilizado" puede reemplazar el componente de intermonómero de los FF empíricos actuales, mientras que el componente de intramonómero puede mantenerse sin cambios. Uno puede esperar que dicho reemplazo conduzca a mejores predicciones en los CSP de monómero flexible.

Otros efectos ignorados por la presente versión de CSP(aiFF) son los térmicos y entrópicos, ya que los resultados presentados por nosotros corresponden a una temperatura de 0 K. Para algunos cristales, estos efectos pueden cambiar la clasificación de los polimorfos, como lo señalaron Brandenburg y Grimme39 y recientemente investigado extensamente por Hoja et al.41. Los efectos térmicos y entrópicos se pueden calcular de forma rutinaria usando pDFT+D, aunque dichos cálculos son varias veces más costosos que los cálculos de pDFT+D con geometrías estáticas. Como prueba, hemos calculado ambos efectos para los 5 polimorfos de energía reticular más bajos del sistema XXII, lo que no lleva a ningún cambio de clasificación.

El método CSP (aiFF) de primeros principios desarrollado aquí se aplicó a cristales de 15 moléculas rígidas con 18 polimorfos experimentales conocidos. Cuando se aplican aiFF en CSP para cristales de estas moléculas, el 17 o el 94 % de los polimorfos se clasifican en el rango 1–10, mientras que el restante tiene el rango 16. A modo de comparación, los CSP análogos con las cargas W99+ empíricas FF se clasifican solo en 33 % de polimorfos en el rango 1–10, 3 polimorfos experimentales no se encuentran dentro de 568 o más generados, y para dos moléculas las predicciones no fueron posibles debido a la falta de tipos de átomos. La capacidad de CSP(aiFF) para minimizar decenas de miles de polimorfos es su ventaja clave sobre los enfoques alternativos que tienen que usar métodos de baja precisión en esta etapa, lo que a menudo conduce erróneamente al descarte de estructuras correctas. Tras una reclasificación posterior de los 20 polimorfos principales con cálculos pDFT+D en geometrías aiFF fijas, para las 15 moléculas, un polimorfo experimental se clasificó como el número 1, mientras que los segundos polimorfos se clasificaron como los números 2, 2 y 3. El pDFT+ El paso D se puede omitir si los aiFF se mejoran iterativamente realizando cálculos ab initio en dímeros extraídos de cristales predichos con la iteración anterior de un aiFF [el protocolo alt-CSP (aiFF)]. El protocolo CSP propuesto no solo muestra el máximo poder predictivo para los sistemas probados, sino que también es económico en comparación con otros enfoques altamente predictivos. En alrededor de cien núcleos, las predicciones completas para cualquiera de los sistemas investigados aquí toman menos de un día, incluida la generación aiFF. El protocolo CSP (aiFF) requiere una participación humana mínima, que consiste solo en la preparación de entrada para los cálculos de autoPES, UPACK y pDFT+D, e incluye solo software gratuito con códigos fuente abiertos. Se han discutido las limitaciones de la implementación actual de la metodología CSP (aiFF), en particular, el descuido de las interacciones de muchos cuerpos y la aproximación de monómero rígido. Aunque el conjunto de prueba incluyó solo cristales homogéneos, no hay razones para dudar de que el método funcionará igualmente bien para cocristales que incluyen sales, ya que la calidad de los aiFF no depende de que los dímeros sean homogéneos o heterogéneos (por supuesto, para cocristales de dos componentes, se deben desarrollar tres PES). Además, aunque la mayor de las moléculas de prueba incluía 22 átomos, el método debería aplicarse igualmente bien a moléculas más grandes, ya que la precisión relativa de SAPT (DFT) no cambia con el tamaño del sistema35. Por supuesto, los cálculos serán más costosos a medida que aumente el tamaño, pero las moléculas con alrededor de 100 átomos están al alcance. La efectividad del protocolo CSP propuesto se debe al uso del método SAPT (DFT) que es computacionalmente eficiente en relación con otros métodos precisos de estructura electrónica y al uso del método autoPES para ajustar aiFF ya que este método no solo reduce los costos de tales ajustes por órdenes de magnitud, pero también reduce el esfuerzo humano de este paso más difícil de automatizar casi a cero. Un elemento importante del protocolo CSP (aiFF) es que reemplaza las formas potenciales simples utilizadas en todos los protocolos CSP anteriores por una forma extendida capaz de ajustar las energías de interacción ab initio con incertidumbres significativamente menores. Una ventaja del protocolo propuesto es que constituye un procedimiento completo de primeros principios para investigar estructuras y propiedades cristalinas. Tal protocolo debería funcionar igual de bien para cualquier tipo de monómero, en contraste con los protocolos que usan FF empíricos, que se espera que funcionen bien solo para sistemas similares a los que se usan para ajustar tales FF. Creemos que el efecto general del protocolo CSP propuesto será que el campo de los CSP pasará del uso de FF empíricos a aiFF. Esto debería aumentar la confiabilidad de las predicciones y, por lo tanto, si bien los CSP han desempeñado hasta ahora el mejor papel de asesores en desarrollos tecnológicos, pueden convertirse en un elemento principal en el desarrollo de nuevos materiales cristalinos. De manera más general, los aiFF se pueden usar en varios tipos de diseño de material computacional.

En la Etapa 1, las geometrías de los monómeros se optimizaron usando ORCA49,50 con la corrección funcional PBE51 y D352 en el conjunto base aug-cc-pVTZ53.

Para que el protocolo CSP(aiFF) sea práctico, los aiFF deben construirse en la Etapa 2 a costos razonablemente bajos, pero al mismo tiempo con pequeñas incertidumbres, para monómeros con docenas de átomos. Esto requiere primero que el método ab initio utilizado para calcular las energías de interacción intermolecular sea económico y preciso. Parece que la mejor opción actual para tales cálculos es SAPT36,54, un método ab initio que calcula las energías de interacción directamente, a partir de monómeros aislados e imponiendo la simetría de permutación de electrones correcta. Aplicamos la variante SAPT basada en DFT, SAPT(DFT)55,56, ver ref. 35 para una revisión reciente de este método. Los cálculos de SAPT(DFT) y CCSD(T) escalan como \({{{{{{{\mathcal{O}}}}}}}}({n}^{5})\) y \({{{ {{{{\mathcal{O}}}}}}}}({n}^{7})\) con el tamaño del sistema, respectivamente, donde n es el número de electrones, y para dímeros con un par de docenas de átomos , los cálculos SAPT(DFT) son aproximadamente dos órdenes de magnitud menos costosos que los cálculos CCSD(T). Los nuevos algoritmos SAPT (DFT) recientemente desarrollados y los códigos informáticos efectivos35,42 se pueden usar para calcular miles de puntos de cuadrícula para dímeros con monómeros de ~ 100 átomos utilizando recursos informáticos razonables y pudiendo lograr esto en unos pocos días si un número suficiente de núcleos de computadora están disponibles.

Los detalles de los cálculos de las energías de interacción de primer y segundo orden de SAPT(DFT)55,56,57,58 son los siguientes. Usamos la versión de ajuste de densidad35,59,60 en los códigos SAPT202061 interconectados con el paquete ORCA49,50 para cálculos en monómeros. El funcional PBE51 se utilizó en los cálculos de DFT aplicando la corrección asintótica regulada por gradiente (GRAC)62,63. Se utilizó el conjunto básico aug-cc-pVDZ53 más un conjunto de funciones midbond 3s3p2d2f (predeterminado de autoPES) en el formato de conjunto básico más centrado en monómeros (MC+BS)64. Los términos que explican los efectos de inducción de orden superior y de inducción de intercambio, indicados como \(\delta {E}_{{{{{{{\rm{int}}}}}}}},{{{{{ {{\rm{resp}}}}}}}}}^{{{{{{{{\rm{HF}}}}}}}}}\) y obtenido como diferencia entre Hartree-Fock (HF ) las energías de interacción y la suma de las correcciones de primer y segundo orden SAPT(HF) apropiadas en sus versiones de respuesta (resp), se incluyeron para todos los sistemas excepto el sistema XIII, benceno, DNBT y TNB. Usamos una notación abreviada para los componentes de energía de interacción SAPT: "indx" es la suma de los componentes de inducción de segundo orden y de inducción de intercambio, así como de \(\delta {E}_{{{{{{ {{\rm{int}}}}}}}},{{{{{{{\rm{resp}}}}}}}}}^{{{{{{{\rm{HF}} }}}}}}}\), "dispx" es la suma de los componentes de dispersión y de intercambio-dispersión, "elst" es el componente electrostático y "exch" es el componente de intercambio de primer orden. La importancia relativa de los componentes atractivos se ilustra en la figura complementaria 4.

En todos los CSP anteriores, solo se han utilizado FF simples en la etapa de minimización de energía de red. Las dos formas más utilizadas son el potencial Lennard-Jones 12-6-1: A12/r12 − C6/r6 + qaqb/r, y el potencial Buckingham exp-6-1: Ae−βr − C6/r6 + qaqb/ r, donde r es una distancia átomo-átomo y A12, A, β, C6, qa y qb son parámetros ajustables. Los aiFF basados ​​en SAPT(DFT) se han utilizado en los CSP, pero siempre con la forma potencial exp-6-1 en la etapa de minimización. Este formulario no es lo suficientemente flexible para adaptarse bien a los datos ab initio, lo que genera incertidumbres de unos pocos kJ/mol, demasiado grandes para CSP confiables. Por el contrario, la forma extendida que usamos en el protocolo CSP (aiFF) puede ajustar datos ab initio con incertidumbres de aproximadamente 1 kJ/mol, que demostramos que es suficiente para CSP confiables. Esta forma funcional es37,38

donde a (b) recorre los conjuntos de átomos en el monómero A (B), respectivamente, αab, βab, \({a}_{i}^{ab}\), \({A}_{12}^ {ab}\) son parámetros de energía de repulsión, \({C}_{n}^{ab}\) son parámetros de dispersión de largo alcance más energía de inducción, qx, x = a, b, son cargas parciales atómicas, \ ({\delta }_{n}^{ab}\) son parámetros de amortiguamiento, y fn son las funciones de amortiguamiento Tang-Toennies65: \({f}_{n}(\delta ,r)=1-{e} ^{-\delta r}\mathop{\sum }\nolimits_{m = 0}^{n}{(\delta r)}^{m}/m!\) Las energías de interacción de largo alcance se calcularon usando un ab enfoque distribuido en el inicio. Los parámetros de amortiguamiento en el término de dispersión más inducción se ajustaron por separado a la suma de todos los componentes de segundo orden de rango cercano más \(\delta {E}_{{{{{{{{\rm{int}}}}} }}},{{{{{{\rm{resp}}}}}}}}}^{{{{{{{\rm{HF}}}}}}}}}\), mientras que \({\delta }_{1}^{ab}\) se ajustaron a energías electrostáticas. Todos los PES desarrollados aquí son PES de dos cuerpos y 6 dimensiones, es decir, asumen monómeros rígidos. Los aiFF se construyeron como sumas de estos PES de dos cuerpos. Se debe agregar que la forma extendida de FF dada por Eq. (1) se ha utilizado en algunos CSP publicados, pero solo en simulaciones de dinámica molecular (MD) que pueden reemplazar los cálculos de pDFT+D de la Etapa 5. Tenga en cuenta que los cálculos de MD son tan caros como los de pDFT+D y significativamente más caros que las minimizaciones de la Etapa 4. Los gráficos que muestran los componentes de energía de interacción SAPT (DFT) y sus ajustes como funciones de la distancia R entre los centros de masa de los monómeros se incluyen en la Fig. 5 complementaria. Se puede ver en particular que las energías electrostáticas ab initio se reproducen muy bien para valores de R mayores que la distancia mínima de van der Waals RvdW a pesar de utilizar únicamente interacciones carga-carga amortiguadas, es decir, omitiendo términos multipolares superiores. Si bien el uso de estos últimos términos en las FF empíricas mejora las predicciones en comparación con el uso de cargas únicamente66,67, nuestros resultados muestran que no se necesitan multipolos de mayor rango si la función electrostática incluye amortiguamiento y se ajusta a energías electrostáticas ab initio. El empeoramiento de la concordancia con los valores ab initio observados para R < RvdW es inevitable y se debe a los efectos de superposición de carga que no son proporcionales a las potencias inversas de R36. Estos efectos se tienen en cuenta en el ajuste global por el primer término de la ecuación. (1). Esta es la razón por la cual las energías de interacción total ajustada y ab initio están en excelente acuerdo para todo R.

Dado que ninguno de los paquetes CSP disponibles es capaz de usar la forma de aiFF dada por la ecuación. (1), hemos modificado dos de estos paquetes: MOLPAK68 y UPACK69 para ser aplicados en las Etapas 3 y 4. MOLPAK usa el concepto de geometría de coordinación y por defecto busca en 26 grupos espaciales: P1, \(P\bar{1}\ ), P2, Pm, PC, P21, P2/c, P21/m, P2/m, P21/c, Cc, C2, C2/c, Pnn2, Pba2, Pnc2, P221, Pmn21, Pma2, P21212, P212121, Pca21, Pna21, Pnma, Fdd2, Pbcn y Pbca. Genera polimorfos en una cuadrícula en un espacio de búsqueda tridimensional variando sistemáticamente la orientación de la molécula central en pasos de 10∘. Esta generación se realiza en las 51 geometrías de coordinación. El empaquetamiento en la celda unitaria está controlado por una simple interacción repulsiva 1/r12 entre átomos: las moléculas se juntan hasta que se alcanza un umbral de energía. Este paso proporciona un conjunto inicial de 6859 combinaciones de ángulos × 51 geometrías de coordinación = 349 809 polimorfos hipotéticos. De este conjunto, se minimizan 25.500 polimorfos más densos, 500 de cada geometría de coordinación, utilizando el programa WMIN70. La forma funcional predeterminada de FF en WMIN es exp-6-1. Hemos modificado este código para incluir FF de la forma de Eq. (1).

UPACK genera estructuras cristalinas aleatorias en 13 grupos espaciales predeterminados: C2, C2/c, Cc, P1, \(P\bar{1}\), P21, P21/c, P212121, Pbca, Pc, Pbcn, Pca21 y Pna21 . Puede usar cualquier potencial 12-6-1 y seleccionamos el OPLS-AA FF71. La etapa de empaque se divide en UPACK en dos pasos. En el primer paso, solo 500 estructuras razonables por grupo de simetría se generan aleatoriamente sin restricciones y luego se utilizan para estimar las dimensiones de la celda. En el segundo paso, la generación aleatoria se realiza en un espacio de coordenadas restringido utilizando esta estimación de celda. La mayoría de las estructuras generadas se rechazan inmediatamente utilizando el criterio de que las interacciones átomo-átomo 12-6-1 no pueden ser mayores de 2000 kJ/mol para ningún par. Dichas generaciones más las pruebas del criterio de energía continúan hasta que se encuentran 5000 polimorfos por grupo de simetría, es decir, se encuentran un total de 65.000 polimorfos. Este segundo paso implica también una optimización aproximada de las energías de red. La lista resultante se somete a agrupamiento72 para eliminar los duplicados. La agrupación en clústeres reduce significativamente el grupo. Por ejemplo, para el sistema XXII se reduce a 13.014 polimorfos.

En la Etapa 4 de CSP (aiFF) realizada con UPACK, todos los polimorfos del conjunto reducido se minimizan con umbrales ajustados. Hemos modificado UPACK para poder usar FFs de la forma de Eq. (1). Encontramos que es ventajoso realizar la Etapa 4 primero con OPLS-AA FF, es decir, usando la ruta UPACK original que incluye el agrupamiento, y luego minimizar el conjunto reducido usando aiFF. El procedimiento se eligió no para ahorrar tiempo, aunque da como resultado ahorros menores, sino para evitar que las minimizaciones terminen en "agujeros" de un FF, es decir, mínimos no físicos en separaciones de intermonómeros muy cortas. Por construcción, los FF 12-6-1 no tienen agujeros, mientras que exp-6-1 y nuestros FF de forma extendida casi siempre tienen agujeros (aunque detrás de barreras de aproximadamente 100 kJ/mol, una de las limitaciones del ajuste autoPES). Descubrimos que las minimizaciones de aiFF a partir de las estructuras minimizadas por OPLS casi nunca terminan en agujeros. Podríamos haber evitado fácilmente el uso de OPLS ajustando un FF 12-6-1 a los datos ab initio.

Los dos paquetes CSP modificados por nosotros produjeron predicciones casi idénticas para los casos en los que usamos ambos. MOLPAK se utilizó para los sistemas I, II, XII, XXII, nitrometano y benceno. Para los sistemas restantes se utilizó UPACK, así como para el sistema I, II y XXII tratados también por MOLPAK. Para estos tres sistemas, las clasificaciones del cristal experimental por los dos paquetes fueron idénticas.

PLATON73 se usó para verificar simetrías faltantes74 y para transformaciones de grupos espaciales de configuración no estándar a configuración estándar asignando al cristal objetivo el grupo espacial adecuado y los parámetros de celda, lo que lleva a los datos en la Tabla 1. Por ejemplo, para el sistema II, tanto MOLPAK como UPACK predijo el cristal experimental en simetría P21/c, y PLATON lo transformó en simetría P21/n.

En la Etapa 5, se realizaron cálculos periódicos de energía de red DFT+D de un solo punto, es decir, sin optimizaciones de geometría, para los 20 polimorfos mejor clasificados de las minimizaciones de aiFF utilizando el funcional PBE51 con pseudopotenciales75 más la corrección de dispersión D352 con Becke-Johnson ( BJ) amortiguamiento76,77. Usamos códigos Quantum ESPRESSO (QE)78,79, con cortes de energía cinética de onda plana de 340 y 3061 eV para las funciones de onda y densidades de carga, respectivamente.

La energía vibratoria de punto cero (ZPVE) y los efectos térmicos se calcularon dentro de la aproximación armónica usando Phonopy 2.8.180 y VASP 5.4.481,82,83,84,85 con el mismo enfoque DFT+D aplicado en QE. Se utilizó el proyector de pseudopotenciales de onda aumentada86,87. Para la relajación del cristal se utilizó un corte de 1000 eV para el conjunto de base de onda plana. La relajación se detuvo si el cambio de energía total entre dos pasos para movimientos electrónicos e iónicos era menor que 10−5 y 0.5 10−2 eV, respectivamente. Los cálculos de fonones se realizaron en el punto Γ utilizando una supercélula de al menos 10 Å de longitud en cada dirección. De manera similar al paso de relajación, se utilizó un límite de 1000 eV para el conjunto de base de onda plana y un umbral de convergencia de 10−8 eV en el cálculo de la energía total. A continuación, se calcularon los efectos ZPVE y térmicos en una malla de 8 × 8 × 8 utilizando la matriz dinámica construida a partir de las constantes de fuerza de los átomos desplazados en la supercélula.

Los datos que respaldan los hallazgos de este estudio se incluyen en el artículo y la información complementaria. En particular, el archivo .zip contiene las coordenadas y las energías de todos los puntos de datos calculados, los parámetros de los ajustes y los archivos de información cristalográfica para un conjunto de polimorfos mejor clasificados.

Los códigos utilizados para los cálculos de estructura electrónica, ajuste, CSP y cálculos de pDFT+D: SAPT, ORCA, autoPES (parte del paquete SAPT), MOLPAK, UPACK, Quantum Espresso y VASP están disponibles en la web y se proporcionan los enlaces en las referencias del artículo principal y de la Información Complementaria. Un parche para UPACK está disponible en el sitio web de SAPT. En el archivo Supplementary_Data_1.zip se incluye un programa FORTRAN que calcula los potenciales ajustados.

Cruz-Cabeza, AJ, Reutzel-Edens, SM & Bernstein, J. Realidades y ficciones sobre el polimorfismo. química Soc. Rev. 44, 8619–8635 (2015).

Artículo CAS PubMed Google Académico

Bučar, D., Lancaster, RW y Bernstein, J. Revisitando los polimorfos que desaparecen. Angew. química En t. ed. 54, 6972–6993 (2015).

Artículo CAS Google Académico

Hilfiker, R. & von Raumer, M. (eds.) Polimorfismo en la industria farmacéutica: forma sólida y desarrollo de fármacos (Wiley-VCH, Weinheim, Alemania, 2019).

Bauer, J. et al. Ritonavir: un ejemplo extraordinario de polimorfismo conformacional. Farmacia Resolución 18, 859–866 (2001).

Artículo CAS PubMed Google Académico

Chemburkar, SR et al. Lidiando con el impacto de los polimorfos de ritonavir en las últimas etapas del desarrollo del proceso de fármacos a granel. org. Resolución de proceso desarrollo 4, 413–417 (2000).

Artículo CAS Google Académico

Waknine, Y. Retiro del parche de rotigotina debido a la cristalización del fármaco. Medscape (2008).

Rietveld, IB & Ceolin, R. Rotigotine: polimorfismo inesperado con comportamiento monotrópico general predecible. J. Pharm. ciencia 104, 4117–4122 (2015).

Artículo CAS PubMed Google Académico

Mortazavi, M. et al. La detección polimorfa computacional revela una forma de rotigotina de aparición tardía y poco soluble. Com. química 2, 70 (2019).

Artículo CAS Google Académico

Badgujar, DM, Talawar, MB, Asthana, SN y Mahulikar, PP Avances en ciencia y tecnología de materiales energéticos modernos: una descripción general. J. Peligro. Mate. 151, 289–305 (2008).

Artículo CAS PubMed Google Académico

Zhang, C. Orígenes de la energía y la seguridad de los materiales energéticos y de la contradicción de la energía y la seguridad. Explos propulsores. Pirotecnología. 43, 855–856 (2018).

Artículo CAS Google Académico

Jurchescu, OD et al. Efectos del polimorfismo en el transporte de carga en semiconductores orgánicos. física Rev. B 80, 085201 (2009).

Artículo ADS CAS Google Académico

Maddox, J. Cristales desde primeros principios. Naturaleza 335, 201 (1988).

Artículo ANUNCIOS Google Académico

Gavezzotti, A. ¿Son predecibles las estructuras cristalinas? Cuenta química Res. 27, 309–314 (1994).

Artículo CAS Google Académico

Lommerse, JPM et al. Una prueba de predicción de la estructura cristalina de pequeñas moléculas orgánicas. Acta Cryst. B 56, 697–714 (2000).

Artículo CAS Google Académico

Motherwell, WDS et al. Predicción de la estructura cristalina de pequeñas moléculas orgánicas: una segunda prueba ciega. Acta Cryst. B 58, 647–661 (2002).

Artículo CAS Google Académico

Día, GM et al. Una tercera prueba ciega de predicción de estructuras cristalinas. Acta Cryst. B 61, 511–527 (2005).

Artículo CAS Google Académico

Día, GM et al. Progreso significativo en la predicción de estructuras cristalinas de pequeñas moléculas orgánicas: un informe sobre la cuarta prueba ciega. Acta Cryst. B 65, 107–125 (2009).

Artículo CAS Google Académico

Bardwell, DA et al. Hacia la predicción de la estructura cristalina de compuestos orgánicos complejos: un informe sobre la quinta prueba ciega. Acta Cryst. B 67, 535–551 (2011).

Artículo CAS Google Académico

Reilly, AM et al. Informe sobre la sexta prueba ciega de métodos de predicción de estructuras cristalinas orgánicas. Acta Cryst. B 72, 439–459 (2016).

Artículo CAS Google Académico

Nyman, J. & Day, GM Diferencias de energía vibratoria estática y reticular entre polimorfos. CrystEngComm 17, 5154–5165 (2015).

Artículo CAS Google Académico

Ryan, K., Lengyel, J. y Shatruk, M. Predicción de la estructura cristalina a través del aprendizaje profundo. Mermelada. química Soc. 140, 10158–10168 (2018).

Artículo PubMed CAS Google Académico

Neumann, MA, Leusen, FJJ y Kendrick, J. Un gran avance en la predicción de estructuras cristalinas. Angew. química En t. ed. 47, 1–5 (2008).

Artículo Google Académico

Neumann, MA Campos de fuerza hechos a medida para la predicción de estructuras cristalinas. J. física. química B 112, 9810–9829 (2008).

Artículo CAS PubMed Google Académico

Neumann, MI GRACIA; Simulación de materiales de vanguardia: St-Germain-en-Laye, Francia. https://www.avmatsim.eu/ (2008).

Day, GM Enfoques actuales para predecir estructuras cristalinas orgánicas moleculares. cristalogr. Rev. 17, 3–52 (2011).

Artículo Google Académico

Price, SL Predicción de estructuras cristalinas de compuestos orgánicos. química Soc. Rev. 43, 2098–2111 (2014).

Artículo CAS PubMed Google Académico

Szalewicz, K. Determinación de la estructura y propiedades de cristales moleculares a partir de primeros principios. Cuenta química Res. 47, 3266–3274 (2014).

Artículo CAS PubMed Google Académico

Hoja, J., Reilly, AM & Tkatchenko, A. Modelado de primeros principios de cristales moleculares: estructuras y estabilidades, temperatura y presión. Wiley Interdiscip. Rev.: Cómp. mol. ciencia 7, e1294 (2017).

Google Académico

Oganov, AR Predicción de la estructura cristalina: reflexiones sobre el estado actual y los desafíos. Discusión de Faraday. R. Soc. química 211, 643–660 (2018).

Artículo ADS CAS Google Académico

Price, SL & Brandenburg, JG Predicción de la estructura cristalina molecular. En Interacciones no covalentes en química y física cuánticas, (eds de-la Roza, AO & DiLabio, GA) 333–363 (Elsevier, 2017).

Price, SL ¿Está llegando a su madurez la predicción de estructuras cristalinas de orden cero (CSP_0)? ¿Qué debemos buscar en un código de predicción de estructura cristalina ideal? Discusión de Faraday. R. Soc. química 211, 9–30 (2018).

Artículo ADS CAS Google Académico

Podeszwa, R., Bukowski, R., Rice, BM y Szalewicz, K. Superficie de energía potencial para el dímero de ciclotrimetileno trinitramina a partir de la teoría de la perturbación adaptada a la simetría. física química química física 9, 5561–5569 (2007).

Artículo CAS PubMed Google Académico

Podeszwa, R., Rice, BM & Szalewicz, K. Predicción de la estructura de los cristales moleculares a partir de los primeros principios. física Rev. Lett. 101, 115503 (2008).

Artículo ADS PubMed CAS Google Scholar

Misquitta, AJ, Welch, GWA, Stone, AJ & Price, SL Una predicción de primeros principios de la estructura cristalina de C6Br2ClFH2. química física Letón. 456, 105–109 (2008).

Artículo ADS CAS Google Académico

Garcia, J., Podeszwa, R. & Szalewicz, K. Códigos SAPT para cálculos de energías de interacción intermolecular. J. Chem. física 152, 184109 (2020).

Artículo ADS CAS PubMed Google Scholar

Jeziorski, B., Moszyński, R. & Szalewicz, K. Enfoque de la teoría de la perturbación de las superficies de energía potencial intermolecular de los complejos de van der Waals. química Rev. 94, 1887–1930 (1994).

Artículo CAS Google Académico

Metz, MP, Piszczatowski, K. & Szalewicz, K. Generación automática de superficies de energía potencial intermolecular. J. Chem. Cálculo de la teoría. 12, 5895–5919 (2016).

Artículo CAS PubMed Google Académico

Metz, MP & Szalewicz, K. Generación automática de superficies de energía potencial intermolecular de monómero flexible. J. Chem. Cálculo de la teoría. 16, 2317–2339 (2020).

Artículo CAS PubMed Google Académico

Brandenburg, JG & Grimme, S. Polimorfismo de cristal orgánico: un punto de referencia para los métodos de estructura electrónica de campo medio corregido por dispersión. cristal. Acta B 52, 502–513 (2016).

Artículo CAS Google Académico

Whittleton, SR, de-la Roza, AO & Johnson, ER Modelo de dispersión de dipolo de orificio de intercambio para una clasificación de energía precisa en la predicción de la estructura cristalina molecular. J. Chem. Cálculo de la teoría. 13, 441–450 (2017).

Artículo CAS PubMed Google Académico

Hoja, J. et al. Descripción computacional confiable y práctica de polimorfos de cristales moleculares. ciencia Adv. 5, eaau3338 (2019).

Artículo ADS PubMed PubMed Central Google Scholar

Garcia, J. & Szalewicz, K. Ab Initio Extended Hartree-Fock plus Método de dispersión aplicado a dímeros con cientos de átomos. J. física. química A 124, 1196–1203 (2020).

Artículo CAS PubMed Google Académico

Taylor, DC et al. Prueba ciega de métodos basados ​​en funcionales de densidad sobre energías de interacción intermolecular. J. Chem. física 145, 124105 (2016).

Artículo ADS PubMed CAS Google Scholar

Williams, DE Campo de fuerza intermolecular mejorado para moléculas que contienen átomos de H, C, N y O, con aplicación a cristales de nucleósidos y péptidos. J. Cómputo. química 22, 1154–1166 (2001).

Artículo CAS Google Académico

Breneman, CM & Wiberg, KB Determinación de monopolos centrados en átomos a partir de potenciales electrostáticos moleculares. La necesidad de una alta densidad de muestreo en el análisis conformacional de formamida. J.Comp. química 11, 361 (1990).

Artículo CAS Google Académico

Welch, GWA, Karamertzanis, PG, Misquitta, AJ, Stone, AJ & Price, SL ¿Es importante la energía de inducción para modelar cristales orgánicos? J. Chem. Cálculo de la teoría. 4, 522–532 (2008).

Artículo CAS PubMed Google Académico

Karamertzanis, PG et al. Modelado de la interacción de enlaces de hidrógeno intermoleculares e intramoleculares en polimorfos conformacionales. J. Chem. física 128, 244708 (2008).

Artículo ADS PubMed CAS Google Scholar

Greenwell, C. et al. Superar las dificultades de predecir la energía polimorfa conformacional en cristales moleculares a través de métodos de función de onda correlacionados. química ciencia 11, 2200–2214 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Neese, F. El sistema del programa ORCA. Wiley Interdiscip. Rev.: Cómp. mol. ciencia 2, 73–78 (2012).

CAS Google Académico

Neese, F. ORCA, un paquete de estructura electrónica ab initio, DFT y semiempírica. con contribuciones de U. Becker, et al. https://orcaforum.kofo.mpg.de.

Perdew, JP, Burke, K. & Ernzerhof, M. Aproximación de gradiente generalizada simplificada. física Rev. Lett. 77, 3865–3868 (1996).

Artículo ADS CAS PubMed Google Scholar

Grimme, S., Antony, J., Elrich, S. & Krieg, H. Una parametrización ab initio consistente y precisa de la corrección de dispersión funcional de la densidad (DFT-D) para los 94 elementos H-Pu. J. Chem. física 132, 154104 (2010).

Artículo ADS PubMed CAS Google Scholar

Kendall, RA, Dunning, TH Jr & Harrison, RJ Revisión de las afinidades electrónicas de los átomos de la primera fila. Conjuntos de bases sistemáticas y funciones de onda. J. Chem. Phys 96, 6796–6806 (1992).

Artículo ADS CAS Google Académico

Szalewicz, K. Teoría de la perturbación de las fuerzas intermoleculares adaptada a la simetría. Wiley Interdisco. Rev. comp. mol. ciencia 2, 254–272 (2012).

Artículo CAS Google Académico

Misquitta, AJ, Podeszwa, R., Jeziorski, B. & Szalewicz, K. Potenciales intermoleculares basados ​​en la teoría de la perturbación adaptada a la simetría, incluidas las energías de dispersión de los cálculos funcionales de densidad dependientes del tiempo. J. Chem. física 123, 214103 (2005).

Artículo ADS PubMed CAS Google Scholar

Hesselmann, A., Jansen, G. & Schütz, M. Teoría de la perturbación intermolecular adaptada a la simetría de la teoría funcional de la densidad con ajuste de la densidad: un nuevo método eficiente para estudiar las energías de interacción intermolecular. J. Chem. física 122, 014103 (2005).

Artículo ADS CAS Google Académico

Misquitta, AJ, Jeziorski, B. & Szalewicz, K. Energía de dispersión de la teoría funcional de la densidad Descripción de los monómeros. física Rev. Lett. 91, 033201 (2003).

Artículo ADS PubMed CAS Google Scholar

Hesselmann, A. & Jansen, G. Energías de dispersión intermolecular de la teoría del funcional de densidad dependiente del tiempo. química física Letón. 367, 778–784 (2003).

Artículo ADS CAS Google Académico

Bukowski, R., Podeszwa, R. & Szalewicz, K. Cálculos eficientes de funciones de susceptibilidad dinámica acopladas de Kohn-Sham y energías de dispersión con ajuste de densidad. química física Letón. 414, 111–116 (2005).

Artículo ADS CAS Google Académico

Podeszwa, R., Bukowski, R. & Szalewicz, K. Método de ajuste de densidad en la teoría de perturbación adaptada a la simetría basada en la descripción de monómeros de Kohn-Sham. J. Chem. Cálculo de la teoría. 2, 400–412 (2006).

Artículo CAS PubMed Google Académico

Bukowski, R. et al. SAPT2020: un programa ab initio para los cálculos de la teoría de la perturbación adaptada a la simetría de muchos cuerpos de las energías de interacción intermolecular. http://www.physics.udel.edu/~szalewic/SAPT/SAPT.html (2020).

Grüning, M., Gritsenko, OV, van Gisbergen, SJA & Baerends, EJ Correcciones de forma a los potenciales de correlación de intercambio mediante una conexión continua regulada por gradiente de los potenciales del modelo para la región interna y externa. J. Chem. física 114, 652–660 (2001).

Artículo ANUNCIOS Google Académico

Cencek, W. & Szalewicz, K. Sobre el comportamiento asintótico de la teoría funcional de la densidad. J. Chem. física 139, 024104–(1:27) (2013). Fe de erratas: 140, 149902 (2014).

Artículo ADS CAS Google Académico

Williams, HL, Mas, EM, Szalewicz, K. & Jeziorski, B. Sobre la efectividad de las funciones de base centradas en monómeros, dímeros y enlaces en los cálculos de las energías de interacción intermolecular. J. Chem. física 103, 7374–7391 (1995).

Artículo ADS CAS Google Académico

Tang, KT & Toennies, JP Un modelo simple mejorado para el potencial de van der Waals basado en funciones de amortiguamiento universales para los coeficientes de dispersión. J. Chem. física 80, 3726–3741 (1984).

Artículo ADS CAS Google Académico

Day, GM, Motherwell, WDS & Jones, W. Más allá del modelo de átomo isotrópico en la predicción de estructuras cristalinas de moléculas rígidas: multipolos atómicos frente a cargas puntuales. cristal. Crecimiento Des. 5, 1023–1033 (2005).

Artículo CAS Google Académico

Price, SL Predicción computacional de estructuras cristalinas orgánicas y polimorfismos. En t. Rev. Phys. química 27, 541–568 (2008).

Artículo CAS Google Académico

Holden, JR, Du, Z. & Ammon, HL Predicción de posibles estructuras cristalinas para compuestos orgánicos que contienen C, H, N, O y F. J. Cómputo. química 14, 422–437 (1993).

Artículo CAS Google Académico

van Eijck, BP & Kroon, J. Paquete de programas UPACK para predicción de estructuras cristalinas: campos de fuerza y ​​generación de estructuras cristalinas para moléculas pequeñas de carbohidratos. J. Cómputo. química 20, 799–812 (1999).

3.0.CO;2-Z" data-track-action="article reference" href="https://doi.org/10.1002%2F%28SICI%291096-987X%28199906%2920%3A8%3C799%3A%3AAID-JCC6%3E3.0.CO%3B2-Z" aria-label="Article reference 69" data-doi="10.1002/(SICI)1096-987X(199906)20:83.0.CO;2-Z">Artículo PubMed Google Académico

Transporte, Informe WR ORNL-5747. Laboratorio Nacional de Oak Ridge, Oak Ridge, TN (1981).

Jorgensen, WL & Tirado-Rives, J. Las funciones potenciales OPLS [potenciales optimizados para simulaciones de líquidos] para proteínas, minimizaciones de energía para cristales de péptidos cíclicos y crambin. Mermelada. química Soc. 110, 1657–1666 (1988).

Artículo CAS PubMed Google Académico

Van Eijck, BP & Kroon, J. Agrupamiento rápido de estructuras equivalentes en la predicción de estructuras cristalinas. J. Cómputo. química 18, 1036–1042 (1997).

3.0.CO;2-U" data-track-action="article reference" href="https://doi.org/10.1002%2F%28SICI%291096-987X%28199706%2918%3A8%3C1036%3A%3AAID-JCC7%3E3.0.CO%3B2-U" aria-label="Article reference 72" data-doi="10.1002/(SICI)1096-987X(199706)18:83.0.CO;2-U">Artículo Google Académico

Spek, AL Validación de estructuras monocristalinas con el programa PLATON. Aplicación J. cristalogr. 36, 7–13 (2003).

Artículo CAS Google Académico

Spek, AL Validación de estructuras en cristalografía química. Acta Crystallogr., Secc. D: Biol. cristalogr. 65, 148–155 (2009).

Artículo CAS Google Académico

Rappe, AM, Rabe, KM, Kaxiras, E. & Joannopoulos, JD Pseudopotenciales optimizados. física Rev. B: Condens. Asunto 41, 1227 (1990).

Artículo ADS CAS Google Académico

Becke, AD & Johnson, ER Momento dipolar del pozo de intercambio y la interacción de dispersión. J. Chem. física 122, 154104–(1:5) (2005).

Artículo ANUNCIOS Google Académico

Grimme, S., Ehrlich, S. & Goerigk, L. Efecto de la función de amortiguamiento en la teoría funcional de densidad corregida por dispersión. J.Comp. química 32, 1456–1465 (2011).

Artículo CAS Google Académico

Giannozzi, P. et al. Quantum ESPRESSO: un proyecto de software modular y de código abierto para simulaciones cuánticas de materiales. J. física. condensa. Materia 21, 395502 http://www.quantum-espresso.org (2009).

Artículo PubMed Google Académico

Giannozzi, P. et al. Capacidades avanzadas para el modelado de materiales con quantum ESPRESSO. J. física. condensa. Asunto 29, 465901 (2017).

Artículo CAS PubMed Google Académico

Togo, A. & Tanaka, I. Primeros principios de cálculos de fonones en ciencia de materiales. Scr. Mate. 108, 1–5 (2015).

Artículo ADS CAS Google Académico

Kresse, G. & Hafner, J. Ab initio dinámica molecular para metales líquidos. física Rev. B 47, 558–561 (1993).

Artículo ADS CAS Google Académico

Kresse, G. & Hafner, J. Ab initio simulación de dinámica molecular de la transición líquido-metal-amorfo-semiconductor en germanio. física Rev. B: Condens. Asunto 49, 14251–14269 (1994).

Artículo ADS CAS Google Académico

Kresse, G. & Furthmüller, J. Eficiencia de los cálculos de energía total ab-initio para metales y semiconductores utilizando un conjunto de base de onda plana. computar Mate. ciencia 6, 15–50 (1996).

Artículo CAS Google Académico

Kresse, G. & Furthmüller, J. Esquemas iterativos eficientes para cálculos de energía total ab initio utilizando un conjunto de base de onda plana. física Rev. B: Condens. Asunto 54, 11169–11186 (1996).

Artículo ADS CAS Google Académico

Kresse, G. et al. VASP: paquete de simulación Viena desde cero. http://www.vasp.at (2021).

Blöchl, método de onda aumentada del proyector PE. física Rev. B: Condens. Asunto 50, 17953-17979 (1994).

Artículo ANUNCIOS Google Académico

Kresse, G. & Joubert, D. De los pseudopotenciales ultrasuaves al método de onda aumentada del proyector. física Rev. B: Condens. Asunto 59, 1758-1775 (1999).

Artículo ADS CAS Google Académico

Descargar referencias

Este trabajo fue apoyado por el Laboratorio de Investigación del Ejército de EE. UU. y la Oficina de Investigación del Ejército (Concesión No. W911NF-19-1-0117) y la NSF (Concesión No. CHE-1900551). Damos las gracias a Rafał Podeszwa por los comentarios sobre el manuscrito.

Departamento de Física y Astronomía, Universidad de Delaware, Newark, DE, 19716, EE. UU.

Rahul Nikhar y Krzysztof Szalewicz

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

RN y KS diseñaron el método. RN lo codificó y realizó cálculos numéricos. Ambos autores analizaron los resultados, escribieron el manuscrito y lo revisaron.

La correspondencia es Krzysztof Szalewicz.

Los autores declaran no tener conflictos de intereses.

Nature Communications agradece a Gregory Beran, Graeme Day y al otro revisor anónimo por su contribución a la revisión por pares de este trabajo. Los informes de los revisores están disponibles.

Nota del editor Springer Nature se mantiene neutral con respecto a los reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso abierto Este artículo tiene una licencia internacional Creative Commons Attribution 4.0, que permite el uso, el intercambio, la adaptación, la distribución y la reproducción en cualquier medio o formato, siempre que se otorgue el crédito correspondiente al autor o autores originales y a la fuente. proporcionar un enlace a la licencia Creative Commons e indicar si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la regulación legal o excede el uso permitido, deberá obtener el permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Nikhar, R., Szalewicz, K. Predicciones confiables de estructuras cristalinas a partir de primeros principios. Nat Comun 13, 3095 (2022). https://doi.org/10.1038/s41467-022-30692-y

Descargar cita

Recibido: 17 noviembre 2021

Aceptado: 10 de mayo de 2022

Publicado: 02 junio 2022

DOI: https://doi.org/10.1038/s41467-022-30692-y

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, un enlace para compartir no está disponible actualmente para este artículo.

Proporcionado por la iniciativa de intercambio de contenido Springer Nature SharedIt

Al enviar un comentario, acepta cumplir con nuestros Términos y Pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.