目前高性能计算已成为当代科学与工程发展的关键性技术和手段.高性能计算已经能够用来模拟越来越精细和复杂的模型和问题, 并提供越来越可靠的计算结果.量子化学一直是高性能计算应用最活跃的领域之一, 量子化学的计算模拟已成为现代工业和学术研究的重要支柱之一.人们结合量子化学理论、计算机技术和编程算法等编写了大量的量子化学计算程序, 如Gaussian、NWChem、Q-Chem、MOLPRO、MPQC、ACES、GAMESS、PSI、Dalton、Turbomole、MOLCAS、PQS、ORCA和COLUMBUS等等[1-15], 广泛用于计算分子的结构、性质以及化学物质之间的相互作用.这些计算通常应用于传统实验手段无法解决的化学和生物学问题, 例如研究和表征生物分子与材料, 研究它们之间在原子、分子、超分子和系统级的相互作用, 提供定性和定量的分析等.
早在计算机发明之前, 人们就已经开始使用计算的方式或量子力学的方法来研究化学问题.随着计算机技术和计算技术的进步, 研究人员逐渐开始依赖并行计算机作为量子化学计算模拟的主要工具.量子化学计算可以在个人电脑、工作站、部门级(T级)并行计算机和超级计算机(P级)等多种平台上进行.目前的个人电脑已经拥有了多个计算单元(多核CPU), 因而并行计算已经成为量子化学计算的主要方式, 绝大多数目前流行的量子化学计算软件都可以采用并行计算.
在计算机发展的早期, 由于计算机存储能力的匮乏, 人们想要计算模拟较大的分子体系, 主要通过改进或发展新的算法来实现, 包括直接积分法[16]、单元分解法[17]、从头计算法局域积分[18]和冻结实近似[19]等等, 将限制大分子从头计算的内存或硬盘存储能力的不足转换为相对宽松的处理器计算能力的需求.此外, 人们也充分利用特定计算平台的硬件特性来增加量子化学计算的效率.每一次硬件技术的提升, 都促使计算化学家们改进计算理论和算法以充分利用硬件的潜能.并行计算方法最早出现在量子化学领域中是1980年[20], 在该项研究中, 微程序设计技术被用来实现内存和基本运算操作的并行使用, 并获得了2.5
目前计算化学研究人员已经能够广泛地使用T级或P级计算系统开展化学领域的研究, 使用的计算规模从数核到数十万核, 计算模拟的体系和精度也越来越复杂.本文将介绍量子化学的计算方法和并行特性, 并对未来量子化学软件的发展和应用进行了展望.
1 计算方法与特性量子化学计算一般是为了获取原子或分子的电子结构和能量特征, 进而获得相关的物理或化学性质.根据近似程度和能量表述的不同, 可以区分为两类方法.一类为单电子近似方法, 例如Hartree-Fock方法(HF)[23]和密度泛函理论(DFT)[24].此类方法通过准确地计算单电子函数, 采用近似的能量表达式来计算总能量.另外一类为后Hartree-Fock方法或相关能方法, 例如组态相互作用方法(CI)[25]、多体扰动理论(MBPT)[26]、耦合簇理论(CC)[26]等.此类方法在Hartree-Fock方法的基础上, 引入激发态slater行列式计算相关能, 通过多个slater行列式的线性组合来实现双电子相互作用的计算.从计算复杂度来说, 假设需要计算的体系的电子数为
目前在一些量子化学软件中, 也有一些时间复杂度为
HF或自洽场(SCF)方法是所有量子化学计算程序的核心和基础.其他高阶的计算方法包括CI、MBPT和CC等方法都是在SCF方法的基础上进行扩展的. SCF方法是一种求解全同多粒子体系的定态薛定谔方程的近似方法.其近似地用一个平均场来代替其他粒子对任意一个粒子的相互作用, 这个平均场又能用单粒子波函数表示, 从而将多粒子系的薛定谔方程简化成单粒子波函数所满足的非线性方程组来解.对于一个N电子原子来说, 其能量或者薛定谔方程为
$ \begin{align} \Big[-\dfrac{1}{2}\sum\limits^{n}_{i=1}\nabla^{2}_{i}-\sum\limits^{n}_{i=1} \dfrac{Z}{r_i}+\sum\limits^{n}_{i=1}\sum\limits_{i>j}\dfrac{1}{r_{ij}}\Big]\varphi=E \varphi. \end{align} $ | (1) |
在上式中, 左边第一项是电子的动能, 第二项是电子与原子核的库仑吸引能, 第三项是电子间库仑排斥能, 右边
$ \begin{align} \Big[-\dfrac{1}{2}\nabla^{2}_{i}-\dfrac{Z}{r_i}+ \sum\limits^{n}_{j\neq i}\int\dfrac{\varphi^{2}_{j}}{r_{ij}}{\rm d}\tau_j\Big]\varphi_i=E_{i} \varphi_{i}. \end{align} $ | (2) |
这样就可以列出
密度泛函理论(DFT)采用的是另外一种方式来处理多电子问题.由于它既有较为准确的计算结果, 又有较高的计算效率, 因此得到了非常广泛的应用, 尤其是在材料科学领域中处理较大规模的体系.与HF方程类似, DFT的基本方程是Kohn-Sham方程(KS方程)[24].在DFT中, 多电子相互作用被处理成与密度相关的交换相关项, 一般来说, 这个交换相关项是非局域化的.由于KS方程和HF方程在数学上具有相似性, 因此也可以使用自洽的方式来求解. DFT中的关键问题就是处理这个交换相关项.由于交换相关项的密度表示的确切形式是未知的, 人们发展了很多近似方法, 包括纯密度形式的局域密度近似LDA和广义梯度近似GGA (如PW91、BLYP和PBE96等), 以及更复杂的杂化形式(如B3LYP、PBE0和CAM-B3LYP等).杂化形式包含了HF的双电子交换贡献, 应用更为广泛.由于HF和DFT的相似性, 这两种方法在程序实现上会共用许多核心代码. HF和DFT方程原则上都可以数值求解, 但实际上都是用基组展开的方式求解.人们已经发展了大量的基组方法, 这些方法可以分为两类, 一类是局域基组方法, 另一类是平面波方法, 两类方法各有优缺点.
在局域基组方法中, HF和KS方程可以用一个矩阵方程来表示[34],
$ \begin{align} FC=SC\varepsilon. \end{align} $ | (3) |
其中
SCF方法和DFT方法的并行化主要集中在FOCK矩阵对角化、DFT交换相关贡献和双电子贡献部分.对于大分子来说, 上述3个部分的时间复杂度分别是
多体扰动理论(MBPT)是重要的量子化学相关能计算方法之一.所谓相关能指的是体系的实际能量与独立粒子模型(即HF计算)获得的能量之差.虽然相关能占体系总能量不到1%, 但对准确描述化学反应过程至关重要.相关能或相关效应一般是由电子的瞬间相互作用产生的. MBPT就是用来精确求解薛定谔方程以更为准确的获得体系能量的方法之一. MBPT根据扰动阶数的不同可以分为二阶微扰处理、三阶微扰处理、四阶微扰处理等等, 阶数越高, 计算结果越准确.但在实际应用中, 由于计算复杂度的增加, MBPT的应用一般只限于低阶微扰处理.例如MBPT2和MBPT3方法计算能量的时间复杂度分别为
在过去的几十年里, 人们做了许多工作使得MP2能够应用到较大的分子体系, 包括拉普拉斯变换法消除能量分母[46]、双电子积分分解的直接实现(RI-MP2等)[47]和局域MBPT2方法[18]等. MBPT2方法的并行实现需要仔细处理通讯和内存的消耗.最早的数据分发并行模式的MP2算法出现在1995年[48], 但这个方法具有较高的通讯和内存消耗. NWChem基于数据分发模型和Global Array环境(GA)也实现了MP2和RI-MP2的并行[49-50], 该实现属于计算密集型, 可以扩展到较多的处理器.另外一种MBPT2的并行实现采用了直接积分数据分发模型, 并获得了超线性加速性能[51].其他通讯密集型[52]和I/O密集型MP2并行算法[53]的实现也可以满足涉及几千个基组函数的化学体系的计算.近期的一些MBPT2并行实现的进展包括可以扩展到32核, 计算4 000个基组函数的RI-MP2方法[54]; 使用MPI通讯, 并可以扩展到数百核的局域MP2并行实现(LMP2)[30]; 可以在一个处理器上计算由一万个基组函数描述的含一千个原子体系的线性标度原子轨道MP2方法及其并行实现[55]等等.
1.3 CC方法耦合簇(CC)方法是另外一种广泛使用的相关能计算方法, 其与MBPT方法具有一定的关联性. CC方法可以准确地描述多电子体系的相关效应, 包括弱相关体系和强相关体系.根据CC簇算符激发阶数近似的不同, 可以分为CCSD方法(单、双激发CC方法)、CCSDT (单、双、三激发CC方法)和CCSDTQ (单、双、三、四激发CC方法)等.高阶的CC方法意味着算法复杂性和计算消耗的快速增加.例如CCSD的计算复杂性为
与其他方法相比, CC代码的并行化具有相当的困难.早期人们也对CC代码的并行化做了一些工作[64], 目前能够提供CC并行计算的量子化学计算程序主要包括NWChem、MOLPRO、GAMESS、ACES Ⅲ和PQS等. NWChem中的CC代码的并行实现主要分为两类, 适用于闭壳层体系的非自旋代码和使用自旋轨道的TCE实现.闭壳层CC代码是基于GA库实现的, 可以计算CCSD和CCSD(T)方法, 对处理器之间互联通讯的性能要求较高. TCE产生的CC代码可广泛地使用与限制性HF(RHF)、非限制性HF(UHF)、限制性开壳层(ROHF)、DFT模型等有关的参考态函数, 其扩展性可达到数万核, 计算的体系可使用超过一千个基组函数. MOLPRO中的CC代码也是基于GA库实现了基于RHF和ROHF的CCSD和CCSD(T)方法的并行计算. GAMESS-US[7]的CC代码利用的是分布式数据界面(DDI)实现了CCSD、CCSD(T)和CR-CCSD(T)的并行计算, 其扩展性可达到数十个核, 计算的体系可使用数百个基组. ACES Ⅲ使用超级指令架构语言(Super Instruction Architecture Language, SIAL)来编写CC并行代码.目前已实现了基于RHF和UHF参考态函数的CCSD、CCSD(T)和EOMCCSD方法, 其并行规模可达数千核. ASES Ⅲ的设计分为两个领域, 一个领域是使用SIAL控制电子结构方法的理论部分, 而不需要控制计算细节, 另一个领域是使用超级指令处理器(Super Instruction Processor, SIP)执行、解释SIAL代码, 并为给定的计算机架构提供必要优化和调试. PQS实现的闭壳层CCSD和CCSD(T)并行计算主要是针对中等规模的计算机群, 计算的并行规模在数十核左右.
1.4 MCSCF方法多构型SCF方法(MCSCF)的波函数是自旋匹配构型态函数(CSF)的线性展开, CSF的展开系数与分子轨道系数同时优化. CSF空间常常通过将初始的
在MCSCF计算中, 最耗时的部分包括: ①原子轨道---分子轨道(AO-MO)积分变换; ②组态相互作用(CI)本征值问题包括密度矩阵; ③求解Newton-Raphson方程(NR方程).对于第一部分, 数据副本模式实现简单, 但会导致内存和I/O负载过高.但如果有高效的并行积分代码, AO积分可以在使用时计算, 通过增加CPU时间来减少I/O负载, 同时产生的MO和中间量可以保存在分布式内存中.此外, 通过利用辅助基组扩展的方式[67], 可以显著减少AO-MO变换计算消耗.对于第二部分, 将波函数限制在CASSCF比使用一般性的MCSCF波函数更有效率.此外, 将波函数在CAS和RAS上用行列式展开[68]更有利于减少计算消耗.对于第三部分, 一般以亚空间展开的形式迭代求解NR方程.在亚空间展开只需要计算部分矩阵矢量与猜测矢量的积, 这样就不需要存储所有的大型矩阵, 以免在NR迭代循环中增加额外的计算消耗.
目前, 已有不少MCSCF方法的并行实现[69], 例如GMAESS使用并行MCSCF方法在128CPU上并行, 实现了58%的效率[8].但是, 由于CSF空间数目的指数性增长, CASSCF方法的扩展性能和计算效率已接近极限.减少昂贵的四坐标变换的数目, 同时保留二阶收敛的并行实现, 以及限制性组态相互作用展开将是可行的解决方案.
1.5 CI方法组态相互作用CI方法在概念上有不同的实现方式, 从而影响其并行实现方式和应用方式.在CI方法中, 波函数的主要形式是CSF的线性展开或行列式的线性展开.由于一般情况下, 人们只需要最低的几个本征值, CI方法可以在一些较小的子空间上进行迭代, 从而避免存储较大的CI稀疏矩阵, 计算消耗可以减少一个级别. CI方法中每一次迭代循环的计算处理过程一般分为三步: ①组成波函数矢量; ②计算哈密顿量的子空间表示和重叠矩阵; ③求解非正交子空间本征值问题.组成波函数矢量是最耗时的部分, 其耦合系数是一个酉阵的矩阵元素, 这个矩阵非常稀疏, 一般在使用时直接计算出来.波函数矢量的计算需要遍历所有的积分, 主要的计算包括矩阵和矩阵乘、矩阵和矢量乘以及矢量操作.第二和第三步对数据的吞吐要求比较大.如果将数据保留在内存中, 将极大地减少第二和第三步的通讯和I/O的压力, 但内存的消耗会增加很多.
组成波函数矢量的并行实现具有相当的困难, 需要同时考虑负载均衡、带宽和内存限制.在得到耦合系数的前提下, 波函数矢量通过遍历所有积分来计算, 并可随机读取.这需要将积分和波函数矢量保存在本地内存中, 并可通过全局操作求和.这种方法严重受限于CI方法的维度和本地内存的容量, 但很容易实现动态的负载均衡.另外一种方式是将CI矩阵分区为小块, 同时波函数矢量也相应的分成小段.矩阵矢量乘可以分解成独立的部分矩阵矢量乘(独立的任务), 并可随机读取相应的小段波函数矢量.为了减少数据传输量随着处理器的增加而增加, 波函数矢量可以保存在分布式内存中, 而积分可在本地内存保留副本.每一个独立的部分矩阵矢量乘需要拷贝波函数矢量到本地内存, 遍历积分子集来计算部分波函数矢量, 同时更新整个波函数矢量. CI矩阵块计算的消耗变化范围非常大.工作负载的空间分布很大程度上取决于CSF空间的选择, 并且反映了CI矩阵的稀疏性.因而, 如果不使用性能模型, 平衡内存消耗、通讯负载以及工作负载将会非常困难.足够灵活的任务分配机制和合理准确的性能模型对在当前并行计算机上进行CI计算非常重要.例如, 在CULUMBUS软件中, 其任务分配机制使得CI方法计算在1~024核的时候都具有非常理想的加速比[70].在该软件中, 每个CPU处理的任务一般不超过4
此外, I/O是制约CI大规模计算的并行效率的瓶颈之一, 尽管在获取非本地数据的时候采用压缩技术可以提高有效带宽.例如, 根据文献[71]报道, 一个基于行列式的MRCI并行代码, 在带本地盘的四核Linux机群系统上实现了16亿个行列式的计算.该实现在16个节点内, 每个节点使用一个核时, 都具有良好的加速比, 加速性能达到0.88以上.而如果增加核数, 则加速性能迅速下降到0.3.尽管使用了本地盘, I/O仍然是一个主要瓶颈, 如果使用并行文件系统, 则性能会更差.
目前, CULUMBUS软件是唯一有能力使用上千核实现CI方法的高效并行计算. I/O、负载均衡等困难导致目前各种CI方法的实现缺乏可扩展性.人们还需进一步修改计算模型, 以获得更高的可扩展性.
2 结语随着高性能计算技术的进步, 尤其是协处理器技术(如GPGPU、Intel Xeon Phi等)的进步, T级的计算机已从十多年前的稀缺性发展到目前的桌面平台, P级系统的计算资源也已逐渐丰富, 未来几年E级系统的出现将可能导致P级系统更加大众化.这些都为大幅度提高量子化学计算模拟的广度和精度创造了机会.计算化学家们已逐渐可以使用更准确同时也更消耗计算资源的计算方法来进行更大体系的量子力学计算模拟.当前为高端设备研制的量子化学计算程序将在未来成为日常设备使用的计算工具.同时, 当前的高性能计算平台已不再是单一的CPU计算平台, 而是由CPU和协处理器共同组成的混合平台, 未来的E级计算机将可能包含百万以上的混合计算单元, 互联设备也将可能采用混合结构.人们需要开发新的量子化学计算模型和算法, 调整量子化学软件和设计思路, 充分利用硬件的特性, 进一步提高量子化学软件的计算效率和并行规模.一些可行的思路包括: ①修改计算模型和算法.借鉴结构力学或流体力学模拟中的有限元分析的方式, 将大的研究体系网格化或碎片化, 进行分布式量子力学计算, 同时处理好边界关系. ②采用混合编程模型.考虑到未来的CPU和协处理器均含有大量的核处理单元, 采用多线程或openmp与mpi混合编程模型将能更好的利用这些设备, 提高计算效率.目前广泛使用的量子化学计算软件如Gaussian (openmp并行)、NWChem (mpi并行)、Q-Chem (mpi并行)等尚未实现这一点. ③增强软件的容错性和健壮性.未来E级平台计算时涉及的设备单元非常多, 平均无故障时间将会减少, 因而软件的容错性和健壮性将会被进一步考验.量子化学软件将需要更细致的考虑容错机制, 如线程级的检查点、回滚、进程迁移等, 减少由于硬件故障导致的计算失败, 或者尽快从硬件故障中恢复之前的计算.这也是目前大多数量子化学计算软件所欠缺的.
[1] | FRISH M J, TRUCKS G W, SCHLEGEL H B, et al. Gaussian 09[CP]. Wallingford, CT: Gaussian Inc, 2009. |
[2] | VAN DAM H J J, DE JONG W A, BYLASKA E, et al. NWChem:Scalable parallel computational chemistry[J]. Wiley Interdisciplinary Reviews Computational Molecular Science, 2011, 1(6): 888-894. DOI:10.1002/wcms.62 |
[3] | KRYLOV A I, GILL P M W. Q-Chem:An engine for innovation[J]. Wiley Interdisciplinary Reviews Computational Molecular Science, 2013, 3(3): 317-326. DOI:10.1002/wcms.1122 |
[4] | WERNER H J, KNOWLES P J, KNIZIA G, et al. Molpro:A general-purpose quantum chemistry program package[J]. Wiley Interdisciplinary Reviews Computational Molecular Science, 2012, 2(2): 242-253. DOI:10.1002/wcms.82 |
[5] | JANSSEN C L, NIELSEN I M B, LEININGER M L, et al. The Massively Parallel Quantum Chemistry Program (MPQC), Version 3. 0[CP]. Livermore, CA, USA: Sandia National Laboratories, 2008. |
[6] | DEUMENS E, LOTRICH V F, PERERA A, et al. Software design of ACES Ⅲ with the super instruction architecture[J]. Wiley Interdisciplinary Reviews Computational Molecular Science, 2011, 1(6): 895-901. DOI:10.1002/wcms.77 |
[7] | SCHMIDT M W, BALDRIDGE K K, BOATZ J A, et al. General atomic and molecular electronic structure system[J]. Journal of Computational Chemistry, 1993, 14(11): 1347-1363. DOI:10.1002/(ISSN)1096-987X |
[8] | GUEST M F, BUSH I J, VAN DAM H J J, et al. The GAMESS-UK electronic structure package:Algorithms, developments and applications[J]. Molecular Physics, 2005, 103(6-8): 719-747. DOI:10.1080/00268970512331340592 |
[9] | TURNEY J M, SIMMONETT A C, PARRISH R M. Psi4:An open-source ab initio electronic structure program[J]. Wiley Interdisciplinary Reviews Computational Molecular Science, 2013, 2(4): 556-565. |
[10] | AIDAS K, ANGELI C, BAK K L, et al. The Dalton quantum chemistry program system[J]. Wiley Interdisciplinary Reviews Computational Molecular Science, 2014, 4(3): 269-284. DOI:10.1002/wcms.1172 |
[11] | FURCHE F, AHLRICHS R, HÄTTIG C, et al. Turbomole[J]. Wiley Interdisciplinary Reviews Computational Molecular Science, 2014, 4(2): 91-100. DOI:10.1002/wcms.1162 |
[12] | AQUILANTE F, PEDERSEN T B, VERYAZOV V, et al. MOLCAS-a software for multiconfigurational quantum chemistry calculations[J]. Wiley Interdisciplinary Reviews Computational Molecular Science, 2013, 3(2): 143-149. DOI:10.1002/wcms.1117 |
[13] | BAKER J, JANOWSKI T, WOLINSKI K, et al. Recent developments in the PQS program[J]. Wiley Interdisciplinary Reviews Computational Molecular Science, 2012, 2(1): 63-72. DOI:10.1002/wcms.80 |
[14] | NEESE F. The ORCA program system[J]. Wiley Interdisciplinary Reviews Computational Molecular Science, 2012, 2(1): 73-78. DOI:10.1002/wcms.81 |
[15] | LISCHKA H, MÜLLER T, SZALAY P G, et al. COLUMBUS-a program system for advanced multireference theory calculations[J]. Wiley Interdisciplinary Reviews Computational Molecular Science, 2011, 1(2): 191-199. DOI:10.1002/wcms.25 |
[16] | ALMLOF J, FAEGRI K, KORSELL K. Principles for a direct SCF approach to LICAO-MO ab-initio calculations[J]. Journal of Computational Chemistry, 1982, 3(3): 385-399. DOI:10.1002/jcc.v3:3 |
[17] | VAHTRAS O, ALMLOF J, FEYEREISEN M. Integral approximations for LCAO-SCF calculations[J]. Chemical Physics Letters, 1993, 213(5): 514-518. |
[18] | PULAY P, SAEBO S. Orbital-invariant formulation and 2nd-order gradient evaluation in moller-plesset perturbation-theory[J]. Theoretica Chimica Acta, 1986, 69(5): 357-368. |
[19] | MCEACHRA R P, TULL C E, COHEN M. mFrozen core approximation for atoms and atomic ions[J]. Canadian Journal of Physics, 1968, 46(23): 2675-2678. DOI:10.1139/p68-634 |
[20] | SEEGER R. Parallel processing on minicomputers:A powerful tool for quantum chemistry[J]. Journal of Computational Chemistry, 1981, 2(2): 168-176. DOI:10.1002/(ISSN)1096-987X |
[21] | HARVEY M J, FABRITⅡS G. A survey of computational molecular science using graphics processing units[J]. Wiley Interdisciplinary Reviews Computational Molecular Science, 2012, 2(5): 734-742. DOI:10.1002/wcms.1101 |
[22] | LEANG S S, RENDELL A P, GORDON M S. Quantum chemical calculations using accelerators:Migrating matrix operations to the NVIDIA kepler GPU and the intel xeon phi[J]. Journal of Chemical Theory and Computation, 2014, 10(3): 908-912. DOI:10.1021/ct4010596 |
[23] | FISCHER C F. The Hartree-Fock Method for Atoms[M]. New York: John Wiley and Sons Ltd, 1977. |
[24] | PARR R G, YANG W T. Density-Functional Theory of Atoms and Molecules[M]. New York: Oxford University Press, 1989. |
[25] | SHERRILL C D, SCHAEFER Ⅲ H F. The configurationinteraction method:Advances in highly correlated approaches[J]. Advances in Quantum Chemistry, 1999, 34: 143-269. DOI:10.1016/S0065-3276(08)60532-8 |
[26] | SHAVITT I, BARTLETT R J. Many-Body Methods in Chemistry and Physics:MBPT and Coupled-Cluster Theory[M]. Cambridge: Cambridge University Press, 2009. |
[27] | GOEDECKER S. Linear scaling electronic structure methods[J]. Reviews of Modern Physics, 1999, 71(4): 1085-1123. DOI:10.1103/RevModPhys.71.1085 |
[28] | KUSSMANN J, BEER M, OCHSENFELD C. Linear-scaling self-consistent field methods for large molecules[J]. Wiley Interdisciplinary Reviews Computational Molecular Science, 2014, 3(6): 614-636. |
[29] | CHALLACOMBE M, SCHWEGLER E. Linear scaling computation of the Fock matrix[J]. The Journal of Chemical Physics, 1997, 106(13): 5526-5536. DOI:10.1063/1.473575 |
[30] | NIELSEN I M B, JANSSEN C L. Local møller-plesset perturbation theory:A massively parallel algorithm[J]. Journal of Chemical Theory and Computation, 2007, 3(1): 71-79. DOI:10.1021/ct600188k |
[31] | FLOCKE N, BARTLETT R J. A natural linear scaling coupled-cluster method[J]. The Journal of Chemical Physics, 2004, 121(22): 10935-10944. DOI:10.1063/1.1811606 |
[32] | BOWLER D R, CHOUDHURY R, GILLAN M J, et al. Recent progress with large-scale ab initio calculations:the CONQUEST code[J]. Physica Status Solidi (b), 2006, 243(5): 989-1000. DOI:10.1002/(ISSN)1521-3951 |
[33] | JENSEN F. Introduction to Computational Chemistry[M]. Chichester: John Wiley & Sons Ltd, 1999. |
[34] | MARTIN R M. Electronic Structure:Basic Theory and Practical Methods[M]. Cambridge: Cambridge University Press, 2004. |
[35] | GILL P M W. Molecular integrals over gaussian basis functions[J]. Advances in Quantum Chemistry, 1994, 25: 141-205. DOI:10.1016/S0065-3276(08)60019-2 |
[36] | HÄSER M, AHLRICHS R. Improvements on the direct SCF method[J]. Journal of Computational Chemistry, 1989, 10(1): 104-111. DOI:10.1002/jcc.v10:1 |
[37] | PEDERSEN T B, AQUILANTE F, LINDH R. Density fitting with auxiliary basis sets from Cholesky decompositions[J]. Theoretical Chemistry Accounts, 2009, 124(1-2): 1-10. DOI:10.1007/s00214-009-0608-y |
[38] | DUNLAP B I, CONNOLLY J W D, SABIN J R. On some approximations in applications of Xα theory[J]. The Journal of Chemical Physics, 1979, 71(8): 3396-3402. DOI:10.1063/1.438728 |
[39] | RENDELL A P. Diagonalization-free SCF[J]. Chemical Physics Letters, 1994, 229(3): 204-210. DOI:10.1016/0009-2614(94)01053-6 |
[40] | FURLANI T R, KONG J, GILL P M W. Parallelization of SCF calculations within Q-Chem[J]. Computer Physics Communications, 2000, 128(1-2): 170-177. DOI:10.1016/S0010-4655(00)00059-X |
[41] | JANSSEN C L, NIELSEN I M B. Parallel Computing in Quantum Chemistry[M]. FL: CRC Press, Taylor & Francis Group, Boca Raton, 2008. |
[42] | FOSTER I T, TILSON J L, WAGNER A F, et al. Toward high-performance computational chemistry:Ⅰ. Scalable Fock matrix construction algorithms[J]. Journal of Computational Chemistry, 1996, 17(1): 109-123. DOI:10.1002/(ISSN)1096-987X |
[43] | FURLANI T R, KING H F. Implementation of a parallel direct SCF algorithm on distributed memory computers[J]. Journal of Computational Chemistry, 1995, 16(1): 91-104. DOI:10.1002/(ISSN)1096-987X |
[44] | ALEXEEV Y, SCHMIDT M W, WINDUS T L, et al. A parallel distributed data CPHF algorithm for analytic Hessians[J]. Journal of Computational Chemistry, 2007, 28(10): 1685-1694. DOI:10.1002/(ISSN)1096-987X |
[45] | MOLLER C, PLESSET M S. Note on an approximation treatment for many-electron systems[J]. Physical Review, 1934, 46(7): 618-622. DOI:10.1103/PhysRev.46.618 |
[46] | HÄSER M, ALMLÖF J. Laplace transform techniques in Møller-Plesset perturbation theory[J]. The Journal of Chemical Physics, 1992, 96(1): 489-494. DOI:10.1063/1.462485 |
[47] | HÄTTIG C. Optimization of auxiliary basis sets for RI-MP2 and RI-CC2 calculations:Core-valence and quintuple-ζ basis sets for H to Ar and QZVPP basis sets for Li to Kr[J]. Physical Chemistry Chemical Physics, 2005, 7(1): 59-66. DOI:10.1039/B415208E |
[48] | MÁRQUEZL A M, DUPUIS M. Parallel computation of the MP2 energy on distributed memory computers[J]. Journal of Computational Chemistry, 1995, 16(4): 395-404. DOI:10.1002/jcc.v16:4 |
[49] | BERNHOLDT D E, HARRISON R J. Fitting basis sets for the RI-MP2 approximate second-order many-body perturbation theory method[J]. The Journal of Chemical Physics, 1998, 109(5): 1593-1600. DOI:10.1063/1.476732 |
[50] | BERNHOLDT D E, HARRISON R J. Orbital-invariant second-order many-body perturbation theory on parallel computers:An approach for large molecules[J]. The Journal of Chemical Physics, 1995, 102(24): 9582-9589. DOI:10.1063/1.468774 |
[51] | SCHÜTZ M, LINDH R. An integral direct, distributed-data, parallel MP2 algorithm[J]. Theoretica chimica acta, 1997, 95(1): 13-34. DOI:10.1007/s002140050180 |
[52] | NIELSEN I M B, SEIDL E T. Parallel direct implementations of second-order perturbation theories[J]. Journal of Computational Chemistry, 1995, 16(10): 1301-1313. DOI:10.1002/(ISSN)1096-987X |
[53] | ISHIMURA K, PULAY P, NAGASE S. A new parallel algorithm of MP2 energy calculations[J]. Journal of Computational Chemistry, 2006, 27(4): 407-413. DOI:10.1002/(ISSN)1096-987X |
[54] | KATOUDA M, NAGASE S. Efficient parallel algorithm of second-order Møller-Plesset perturbation theory with resolution-of-identity approximation (RI-MP2)[J]. International Journal of Quantum Chemistry, 2009, 109(10): 2121-2130. DOI:10.1002/qua.v109:10 |
[55] | DOSER B, LAMBRECHT D S, KUSSMANN J, et al. Linear-scaling atomic orbital-based second-order Møller-Plesset perturbation theory by rigorous integral screening criteria[J]. The Journal of Chemical Physics, 2009, 130(6): 064107 DOI:10.1063/1.3072903 |
[56] | RAGHAVACHARI K, TRUCKS G W, POPLE J A, et al. A fifth-order perturbation comparison of electron correlation theories[J]. Chemical Physics Letters, 1989, 157(6): 479-483. DOI:10.1016/S0009-2614(89)87395-6 |
[57] | DALGAARD E, MONKHORST H J. Some aspects of the time-dependent coupled-cluster approach to dynamic response functions[J]. Physical Review A, 1983, 28(3): 1217-1222. DOI:10.1103/PhysRevA.28.1217 |
[58] | GEERTSEN J, RITTBY M, BARTLETT R J. The equation-of-motion coupled-cluster method:Excitation energies of Be and CO[J]. Chemical Physics Letters, 1989, 164(1): 57-62. |
[59] | KOWALSKI K, PIECUCH P. The active-space equation-of-motion coupled-cluster methods for excited electronic states:Full EOMCCSDt[J]. The Journal of Chemical Physics, 2001, 115(2): 643-651. DOI:10.1063/1.1378323 |
[60] | WANG T, KRYLOV A I. Electronic structure of the two dehydro-meta-xylylene triradicals and their derivatives[J]. Chemical Physics Letters, 2006, 425(4-6): 196-200. DOI:10.1016/j.cplett.2006.05.035 |
[61] | WATTS J D, BARTLETT R J. Economical triple excitation equation-of-motion coupled-cluster methods for excitation energies[J]. Chemical Physics Letters, 1995, 233(1-2): 81-87. DOI:10.1016/0009-2614(94)01434-W |
[62] | CHRISTIANSEN O, KOCH H, JORGENSEN P, et al. Excitation energies of H2O, N2 and C2 in full configuration interaction and coupled cluster theory[J]. Chemical Physics Letters, 1996, 256(1-2): 185-194. DOI:10.1016/0009-2614(96)00394-6 |
[63] | KOWALSKI K, PIECUCH P. New coupled-cluster methods with singles, doubles, and noniterative triples for high accuracy calculations of excited electronic states[J]. The Journal of Chemical Physics, 2004, 120(4): 1715-1738. DOI:10.1063/1.1632474 |
[64] | RENDELL A P, GUEST M F, KENDALL R A. Distributed data parallel coupled-cluster algorithm:Application to the 2-hydroxypyridine/2-pyridone tautomerism[J]. Journal of Computational Chemistry, 1993, 14(12): 1429-1439. DOI:10.1002/(ISSN)1096-987X |
[65] | MALMQVIST P A, RENDALL A, ROOS B O. The restricted active space self-consistent-field method, implemented with a split graph unitary group approach[J]. The Journal of Physical Chemistry, 1990, 94(14): 5477-5482. DOI:10.1021/j100377a011 |
[66] | HARDING L B, GODDARD Ⅲ W A. Generalized valence bond description of the low-lying states of formaldehyde[J]. Journal of the American Chemical Society, 1975, 97(22): 6293-6299. DOI:10.1021/ja00855a001 |
[67] | AQUILANTE F, PEDERSEN T B, ROOS B O, et al. Accurate ab initio density fitting for multiconfigurational self-consistent field methods[J]. The Journal of Chemical Physics, 2008, 129(2): 024113 DOI:10.1063/1.2953696 |
[68] | OLSEN J, ROOS B O, JØRGENSEN P, et al. Determinant based configuration interaction algorithms for complete and restricted configuration interaction spaces[J]. The Journal of Chemical Physics, 1988, 89(4): 2185-2192. DOI:10.1063/1.455063 |
[69] | FLETCHER G D. A parallel multi-configuration self-consistent field algorithm[J]. Molecular Physics, 2007, 105(23-24): 2971-2976. DOI:10.1080/00268970701722234 |
[70] | MÜLLER T. Large-scale parallel uncontracted multireference-averaged quadratic coupled cluster:The ground state of the chromium dimer revisited[J]. The Journal of Physical Chemistry A, 2009, 113(45): 12729-12740. DOI:10.1021/jp905254u |
[71] | KNECHT S, JENSEN H J A, FLEIG T. Large-scale parallel configuration interaction. Ⅰ. Nonrelativistic and scalar-relativistic general active space implementation with application to (Rb-Ba)+[J]. The Journal of Chemical Physics, 2008, 128(1): 014108 DOI:10.1063/1.2805369 |