JACS:基于“电化学描述符”的光催化反应动力学分析及高效机器学习模型预测

发布时间:2024-10-21浏览次数:161

近年来,光催化反应因其高效率、绿色、可持续性以及广泛的应用范围,已成为合成化学研究领域的一个热点。然而,光催化反应过程复杂,涉及到底物、光催化剂、溶剂、介质、添加剂、电极材料及光照条件等众多参数间的精细相互作用,反应参数空间庞大。因此,基于经典量子化学计算获取单一物种相关结构参数(描述符)的通用方法,在训练高效机器学习模型、准确预测反应性能上面临严峻挑战,尤其是在构建针对该类反应的非平衡(小样本)数据集机器学习模型时。挑战的核心在于,基于量子化学计算得到的反应描述符在全面、真实地捕捉所有反应条件下的微小变化以及反应物种间错综复杂的微观相互作用方面存在局限。

近日,南京大学化学化工学院丁梦宁课题组和黎书华、王国强课题组合作,针对光催化羧酸与烯烃的脱羟基耦联反应进行了深入探讨。团队成员通过对于反应体系的循环伏安特性及其光响应测量,提取出“电化学描述符“,用以反映光催化体系中的关键氧化还原动力学信息。研究发现,这些描述符不仅能够捕捉整个反应系统的复杂性,还能有效地减少数据集的维度,从而提高机器学习模型在评估反应性的可靠性与稳健性。该成果发表于Journal of the American Chemical Society。化学化工学院2021级博士生戴路晗为论文的第一作者。

研究团队在先前电有机、电催化反应相关研究工作(Angew. Chem. Int. Ed. 2021, 60, 4199–4207, Angew. Chem. Int. Ed. 2021, 60, 16448–16456)基础上,提出了一种针对光催化反应的新型电化学实验描述符方法。首先,通过循环伏安法(CV)对反应体系进行电化学分析,获得了一系列电化学描述符,这些描述符包括Q+Q-j+j-E+E-ΔQ等与反应中电荷转移密切关联的物理量,然后通过高产率点在描述符热点图上的分布确定这些描述符的有效性。研究团队在实验中选取了多种不同类型底物(如羧酸和烯烃)及多种反应条件组合,通过循环伏安法快速获得了每个反应体系的电化学描述符。该策略具有数据获取效率高的优势,并且所获得的描述符能够直接反映反应体系的实际动力学特性。

 

1. 循环伏安法获取反应体系的电化学特征 

研究团队通过构建光化学“反应热点图”,揭示了电化学描述符与反应产率之间的强相关性。不同底物和反应条件在电化学描述符空间中呈现出特定的聚集模式(如中心聚集和线性聚集),这些聚集模式与反应产率有显著的对应关系。通过非线性回归分析,团队确定了集中聚集和线性聚集数据集的指数关系,揭示了热点区的动力学内涵,在一定程度上为光催化反应性能分析提供了全新的视角。

 

2.电化学描述符聚集模式及光催化反应机理关联性 

进一步,研究团队通过机器学习模型的构建展示了该类电化学描述在反应性能预测的潜力。为了确保模型的稳定性和可靠性,研究团队进行了多次随机分割数据集的训练,并采用留一法交叉验证(LOOCV)进行模型评估。在单一底物数据集上,结合电化学描述符和计算描述符的模型表现最佳(R2-LOO = 0.79),仅电化学描述符的模型也表现良好(R2-LOO = 0.60)。对于包含多种底物和反应条件的完整数据集,电化学描述符依然展现出较高的预测性能(R2-LOO = 0.66),优于仅计算描述符的模型(R2-LOO = 0.57)。研究结果显示,电化学描述符在机器学习模型中的应用具有显著优势。实验获得的电化学描述符可以有效辅助机器学习模型,提高反应性能预测的准确性和效率。具体来说,对于单一底物的预测,结合电化学描述符和计算描述符的模型表现最佳;而在处理包含多种底物和反应条件的复杂数据集时,仅电化学描述符的模型也能取得优异的表现。此外,在外部数据验证中,电化学描述符构建的机器学习模型也体现出最佳的性能,证明了电化学描述符在描述反应性能方面的稳健性。


3. 机器学习模型的验证以及性能评估

化学研究人员能够迅速筛选和优化反应条件,显著缩短实验周期并降低成本。此外,这一策略有望与高通量实验技术相结合,实现对更大规模反应性能的评估与优化。未来,随着实验技术的进步和机器学习算法的持续优化,电化学描述符在光催化有机反应中的应用将变得更加广泛和深入。这项研究不仅为光催化有机反应的机理分析和性能预测提供了创新的思路,而且为化学研究和工业应用开辟了全新的途径。实验获得的电化学描述符在光催化有机反应的性能评估中显示出显著的优势。它们不仅能够揭示复杂反应系统的动力学特性,而且能够显著提升机器学习模型在反应性能预测方面的准确性和效率。

该研究工作得到了国家自然科学基金、中央高校科研经费、介观化学教育部重点实验室及生命分析化学国家重点实验室的支持。