基于机器学习的染料敏化剂分子光伏性能预测方法及系统
- 国知局
- 2024-07-12 10:40:24
本发明属于染料敏化剂性能预测,具体涉及一种基于机器学习的染料敏化剂分子光伏性能预测方法及系统。
背景技术:
1、公开该背景技术部分的信息仅仅旨在增加对本发明的总体背景的理解,而不必然被视为承认或以任何形式暗示该信息构成已经成为本领域一般技术人员所公知的现有技术。
2、太阳能是最丰富的可再生能源之一,具有储量丰富、清洁环保、地域限制较小等独特的优势和巨大的开发应用潜力。太阳能电池可以通过光电效应或者光化学效应将光能直接转化为电能,是一种利用太阳能最经济有效的方式。在诸多类型的太阳能电池中,染料敏化太阳能电池(dsscs)凭借其低成本、低污染、制备简单等优势受到广泛关注。染料敏化剂分子是dsscs中的核心组成部分,在太阳光的捕获和提供可转移的电子方面发挥着关键作用,直接决定着dsscs的光伏性能参数,比如光捕获效率、光生短路电流密度等。合理地优化和设计染料敏化剂能够有效提升dsscs的光电转化效率。
3、为了最大限度地利用太阳光,拓展dsscs的光捕获范围至可见光区乃至近红外光区,国内外的研究者们致力于研发各类染料敏化剂分子。迄今为止,已报道的染料敏化剂根据分子结构中是否含有金属元素,可分为无机染料和有机染料两种。前者主要包括金属配合物染料(大多数是以钌、锇为中心金属原子的卟啉、酞菁等)和无机量子点染料;后者则包括吲哚类、香豆素类、咔唑类、三苯胺类等有机合成染料以及天然有机染料。相较于无机染料复杂的合成工序和繁琐的提纯步骤,有机合成染料不含金属元素,原材料丰富且低廉,并且可通过适当的分子修饰来调控光吸收范围及光物理性能,更适合大规模生产。
4、在推进dsscs开发和应用的过程中,基于试错法合成敏化剂分子并测试其在dsscs中的性能是一个反复试验的过程,需要耗费大量的人力和物力资源,且研究周期较长。同时,由于环境条件、操作技术或其他因素的不确定性,试验结果可能不稳定或代表性不足。如果可以在试验之前对染料分子的光伏性能进行理论预判,进而对预测出的优异的染料分子进行实验验证,不但能够节省合成和测试成本,还可以加快研发的进程。近年来,随着理论计算软件的不断改进和完善,通过量子化学计算方法精准描述染料敏化剂分子的性质成为可能。然而,染料敏化剂分子性能的模拟依赖于对分子若干激发态进行高精度的迭代计算,这一过程需要大量的计算资源。对于复杂分子或较大分子体系的计算尤为耗时,甚至面临着计算瓶颈,并且在进行高通量筛选时,算力的局限性将更加突出。
技术实现思路
1、为了解决现有技术的不足,本发明的目的是提供一种基于机器学习的染料敏化剂分子光伏性能预测方法及系统,本发明通过训练好的基于前馈神经网络构建的染料敏化剂分子光伏性能预测模型,在给定染料敏化剂分子相关参数的情况下,能够准确、快速预测该染料敏化剂分子平均光捕获效率和短路电流密度,从而降低实验试错以及理论计算的成本,提高新型染料敏化剂分子的研发效率。
2、为了实现上述目的,本发明的技术方案为:
3、在本发明的第一个方面,提供一种基于机器学习的染料敏化剂分子光伏性能预测方法,包括如下步骤:
4、获取待预测的染料敏化剂分子的前线分子轨道能量和能量差;
5、将获取的前线分子轨道能量和能量差输入训练好的基于前馈神经网络构建的染料敏化剂分子光伏性能预测模型中,得到待预测的染料敏化剂分子的平均光捕获效率和短路电流密度;
6、其中,前线分子轨道能量和能量差的获取方法包括如下步骤:在gaussian16软件包中,选用b3lyp泛函和6-31g(d)基组,同时通过极化连续模型考虑溶剂效应的影响,对待预测的染料敏化剂分子结构进行优化;从优化得到的结果中提取待预测的染料敏化剂分子的前线分子轨道能量,并计算所述前线分子轨道能量之间的差值。
7、在本发明的一些实施例中,所述前线分子轨道能量包括最高占据轨道(homo)能量以及低于homo的n个轨道能量、最低未占据轨道(lumo)能量以及高于lumo的m个轨道能量;
8、所述能量差为homo及低于homo的n个轨道能量(共n+1个homo相关轨道能量)与lumo以及高于lumo的m个轨道能量(共m+1个lumo相关轨道能量)两两之间的能量差。
9、在本发明的一些实施例中,所述基于前馈神经网络构建的染料敏化剂分子光伏性能预测模型的训练方法为:
10、基于染料敏化剂分子历史结构构建包含smiles结构的染料敏化剂分子结构数据库;
11、将染料敏化剂分子结构数据库中的smiles结构转化为三维分子结构,并通过量化计算的密度泛函理论对三维分子结构进行优化;
12、基于优化得到的结果,提取前线分子轨道能量并计算能量差;
13、基于优化得到的三维分子结构,利用含时密度泛函理论计算激发态,得到分子的吸收光谱数据;根据吸收光谱数据计算分子的平均光捕获效率和短路电流密度;
14、所述前线分子轨道能量和能量差作为特征变量,所述平均光捕获效率和短路电流密度作为目标变量,对特征变量和目标变量构成的数据集进行特征工程;
15、将数据集划分为训练集和测试集,分别用于模型训练和模型评估;基于前馈神经网络构建染料敏化剂分子光伏性能的预测模型,包括设置输入层、隐藏层和输出层的层数以及神经元个数,选择激活函数,采用数据集对模型进行训练,通过交叉验证确定模型的最佳超参数,并通过评价参数衡量模型的性能和效果,获得训练好的基于前馈神经网络构建的染料敏化剂分子光伏性能预测模型。
16、在本发明的一些实施例中,所述通过量化计算的密度泛函理论对三维分子结构进行优化为:采用gaussian 16软件,选用b3lyp泛函和6-31g(d)基组,同时在极化连续模型下考虑溶剂效应的影响,优化三维分子结构。
17、在本发明的一些实施例中,所述利用含时密度泛函理论计算激发态为:使用gaussian 16软件,选用b3lyp泛函和6-31g(d)基组,同时在极化连续模型下考虑溶剂效应的影响,利用含时密度泛函理论,对不少于20个分子的激发态进行计算。
18、在本发明的一些实施例中,所述光捕获效率lhe(λ)的计算公式如下:
19、
20、其中,ε(λ)为在某一波长下的摩尔吸光系数,λ为波长;
21、γ是敏化剂在半导体表面上的负载量,单位为mol/cm2。显然,计算得到的lhe(λ)依赖于波长,为了考虑平均作用效果,进一步计算平均光捕获效率作为一个后续机器学习特征变量。
22、在本发明的一些实施例中,所述短路电流密度jsc的计算公式为:
23、
24、其中,e为单个电子的电荷量;
25、是am1.5g太阳辐射光谱所对应的光子通量。
26、在本发明的一些实施例中,所述特征工程为数据预处理和特征降维;
27、所述数据预处理为数值归一化,选择最小-最大归一化,公式为:。
28、所述特征降维为主成分分析,通过正交变换,将原始特征空间中的特征变量转换为一组新的线性组合特征,即主成分;按照其对原始数据方差的大小进行排序,保留与原始数据相关性较大的主成分。
29、在本发明的一些实施例中,划分数据集时采用随机抽样保证划分的随机性,并且划分后的数据集是互相独立的,即每个样本只能出现在一个数据集中,确保模型在训练和评估过程中不会受到重复样本的影响。
30、在本发明的一些实施例中,所述前馈神经网络包含一个输入层、四个隐藏层和一个输出层,其中隐藏层的每一层都是一个全连接层,分别由256、256、128和128个神经元组成,并且每一层都使用relu函数作为激活函数。
31、在本发明的一些实施例中,所述交叉验证为十折交叉验证,评价参数优为皮尔逊系数r、均方根误差mse以及r2,评价参数的计算公式分别为:
32、
33、
34、
35、上式中xtrue、ytrue表示真实值,xpred、ypred表示模型的预测值,xmean、ymean表示真实值的平均值。
36、本发明的第二个方面,提供基于机器学习的染料敏化剂分子光伏性能预测系统,包括:
37、获取模块,其用于获取待预测的染料敏化剂分子的前线分子轨道能量和能量差;
38、预测模块,其用于将获取的前线分子轨道能量和能量差输入训练好的基于前馈神经网络构建的染料敏化剂分子光伏性能预测模型中,得到待预测的染料敏化剂分子的平均光捕获效率和短路电流密度;
39、其中,前线分子轨道能量和能量差的获取方法包括如下步骤:在gaussian16软件包中,选用b3lyp泛函和6-31g(d)基组,同时通过极化连续模型考虑溶剂效应的影响,对待预测的染料敏化剂分子结构进行优化;从优化得到的结果中提取待预测的染料敏化剂分子的前线分子轨道能量,并计算所述前线分子轨道能量之间的差值。
40、本发明的第三个方面,提供一种电子设备,包括存储器、处理器及存储在存储器上运行的计算机程序,所述处理器执行所述程序时实现如第一个方面所述的基于机器学习的染料敏化剂分子光伏性能预测方法。
41、本发明的第四个方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一个方面所述的基于机器学习的染料敏化剂分子光伏性能预测方法。
42、与现有技术相比,本发明的有益效果为:
43、与现有技术相比,本发明所提供的方法能够克服实验成本高、周期长以及量子化学计算耗时长、对算力要求高等缺点。本发明通过采用量化计算和机器学习相结合的方法,实现自主学习和识别特征变量与目标变量之间的相关性和规律性,建立了染料敏化剂分子结构与其光伏性能之间的联系,即训练好的基于前馈神经网络构建的染料敏化剂分子光伏性能预测模型。在给定染料敏化剂分子相关参数的情况下,通过该模型能够准确、快速预测染料敏化剂分子平均光捕获效率和短路电流密度,从而降低实验试错以及理论计算的成本,提高新型染料敏化剂分子的研发效率。具体的,采用本发明的方法预测染料敏化剂分子的光伏性能,只需基于优化好的分子结构生成特征变量,将特征变量输入训练好的基于前馈神经网络构建的染料敏化剂分子光伏性能预测模型中,即刻便可得到待预测染料敏化剂分子的光伏性能参数。此外,本发明利用主成分分析对自变量进行降维,把多维数据降到最具有代表性的16个维度,在降低数据维度的同时最大限度地保留原始信息,数据全面而准确。因此,本发明不仅成本低、操作简单,而且预测快速、准确、泛化性强,有助于提升高效染料敏化剂的研发效率。本发明无需进行实验合成和器件测试,不涉及化学试剂和材料的使用,大大节省了资源并且对环境零污染。
本文地址:https://www.jishuxx.com/zhuanli/20240614/88442.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表