基于多维数据分析的中药制剂质量检测方法与流程
- 国知局
- 2024-10-21 15:01:40
本发明涉及质量检测领域,尤其涉及一种基于多维数据分析的中药制剂质量检测方法。
背景技术:
1、中药制剂作为传统医学的重要组成部分,在全球范围内得到了广泛的关注和应用。然而,由于其成分的复杂性和制备工艺的多样性,中药制剂的质量控制一直是一个技术难题。传统的质量控制方法往往依赖于单一的检测指标,如有效成分的含量测定,这种方法虽然简单直接,但难以全面反映中药制剂的整体质量。因此,开发一种能够综合考虑多维数据,实现全面、准确质量检测的方法显得尤为重要。
2、近年来,随着数据分析技术的飞速发展,多维数据分析方法在各个领域得到了广泛应用。在中药制剂质量控制领域,研究人员也开始尝试利用多维数据来提高质量检测的准确性和全面性。然而,现有技术在应用多维数据分析进行中药制剂质量检测时仍存在一些不足:
3、数据融合问题:中药制剂的多维数据包括制剂成分、制备工艺参数以及对应的质量属性等,这些数据来源不同、性质各异,如何有效地融合这些数据,提取出对质量检测有用的信息是一个技术难题。
4、特征选择与降维:中药制剂的多维数据中往往包含大量的冗余和无关特征,这些特征不仅会增加模型的复杂性,还可能降低质量检测的准确性。因此,如何进行有效的特征选择和降维处理是另一个需要解决的问题。
5、模型选择与融合:在构建预测模型时,如何选择合适的模型以及如何将多个单一模型进行有效融合,以提高质量检测的准确性和稳定性,也是现有技术中需要改进的地方。
6、实时性与适应性:中药制剂的生产过程中会产生大量的实时数据,如何利用这些数据进行实时质量检测,并及时调整模型以适应生产过程中的变化,是现有技术面临的挑战。
7、综上所述,尽管多维数据分析在中药制剂质量检测中具有广阔的应用前景,但现有技术仍存在诸多不足。因此,本研究提出了一种基于多维数据分析的中药制剂质量检测方法,旨在解决上述问题。
技术实现思路
1、本发明提供了一种基于多维数据分析的中药制剂质量检测方法,通过综合运用特征选择、降维处理、模型构建与融合等技术手段,实现了对中药制剂质量的全面、准确检测,为中药制剂的质量控制提供了新的技术手段。
2、本发明第一方面提供了一种基于多维数据分析的中药制剂质量检测方法,所述基于多维数据分析的中药制剂质量检测方法包括:收集中药制剂多维数据,所述中药制剂多维数据包括制剂成分、制备工艺参数以及对应的质量属性;依据所述中药制剂多维数据结合套索回归进行特征选择,得到中药制剂质量关键影响数据,依据所述中药制剂质量关键影响数据应用主成分分析或独立成分分析进行降维处理,提取得到中药制剂质量主要特征;依据所述中药制剂质量主要特征构建预测模型,对于线性关系明显的质量属性采用岭回归建立预测模型,和/或对于非线性关系明显的质量属性采用多项式回归非线性模型,得到训练后的岭回归预测模型、多项式回归非线性模型,依据所述中药制剂质量主要特征构建深度学习模型,依据深度学习模型的自动特征提取能力,进一步提高预测精度,得到训练后的深度学习模型;依据训练后的岭回归预测模型、多项式回归非线性模型、深度学习模型,采用集成学习方法,将多个单一模型进行融合;依据中药制剂多维数据中的实时数据,输入到上述训练好的模型中,通过将多个单一模型进行融合,得到中药制剂质量检测结果。
3、可选的,在本发明第一方面的第一种实现方式中,所述收集中药制剂多维数据,所述中药制剂多维数据包括制剂成分、制备工艺参数以及对应的质量属性,包括:利用高效液相色谱法、气相色谱法测定中药制剂中的活性成分含量,通过色谱、质谱联用技术获取中药制剂的指纹图谱;和/或应用拉曼光谱或太赫兹光谱进行无损检测,快速获取中药制剂的成分信息,结合化学计量学方法对光谱数据进行解析,提取特征信息;和/或利用计算机视觉技术对中药制剂的外观进行缺陷检测,通过深度学习模型对显微图像进行分析,识别中药制剂的细胞结构和组织特征;利用数据融合算法将得到的数据进行融合,包括化学数据、光谱数据、图像数据,得到中药制剂多维数据;对所述中药制剂多维数据进行预处理,包括数据清洗、格式转换和标准化,对于数值型数据采用均值、中位数或众数填充进行缺失值处理,对于时间序列数据,采用插值方法,包括线性插值、拉格朗日插值进行缺失值处理,使用iqr方法来识别和处理异常值;和/或应用基于机器学习的异常检测算法,包括孤立森林或dbscan聚类来识别异常值;利用滤波器或平滑技术减少数据中的噪声;对数值型数据应用min-max scaling、z-score standardization方法进行归一化,以消除不同特征之间的量纲差异;对分类数据进行独热编码或标签编码,以便机器学习模型能够处理;对连续型变量进行分箱处理,将连续值转换为分类值;预处理后的数据应保持与输入数据相同的结构,输出数据包括清洗后无缺失、无异常、格式统一且标准化的多维数据表,其中每一列都代表一个特征,每一行代表一个样本。
4、可选的,在本发明第一方面的第二种实现方式中,所述依据所述中药制剂多维数据结合套索回归进行特征选择,得到中药制剂质量关键影响数据,依据所述中药制剂质量关键影响数据应用主成分分析或独立成分分析进行降维处理,提取得到中药制剂质量主要特征,包括:接收所述中药制剂多维数据作为输入,套索回归是一种线性回归方法,通过对回归系数进行l1正则化来实现特征选择,以中药制剂的质量指标作为因变量,质量指标包括有效成分含量、溶解速度,多维数据作为自变量,构建套索回归模型;通过交叉验证确定套索回归中的正则化参数\lambda,\lambda∈[\lambda_min,\lambda_max],对于每一个\lambda值,进行k次训练和验证,每次选择k-1份数据作为训练集,剩余1份作为验证集,计算每个\lambda值在k次验证中的平均性能指标,选择最佳\lambda,根据评估指标,选择性能最佳的\lambda值作为套索回归的正则化参数;根据回归系数的大小,选择对中药制剂质量有显著影响的特征,设定套索回归的目标函数公式为:
5、\min_{\beta}\left(\sum_{i=1}^{n}(y_i-\beta_0-\sum_{j=1}^{p}x_{ij}\beta_j)^2+\lambda\sum_{j=1}^{p}|\beta_j|\right);其中,\beta:代表回归系数的向量,包括\beta_0和\beta_j,\beta_0为截距项,\beta_j为第j个特征的系数,其中j=1,2,...,p;y_i:第i个观测值的目标变量;x_{ij}:第i个观测值的第j个特征;n:观测值的数量;p:特征的数量;\lambda:正则化参数,用于控制正则化项的强度;公式的目标是找到一组回归系数\beta,包括\beta_0和\beta_j,使得上述目标函数达到最小值,在最小化预测误差的同时,通过l1正则化来控制模型的复杂度,实现特征选择,并防止过拟合;通过交叉验证确定套索回归中的正则化参数\lambda,并根据回归系数选择对中药制剂质量有显著影响的特征,输出通过套索回归选择的关键特征得到中药制剂质量关键影响数据;对所述中药制剂质量关键影响数据进行标准化处理,设定标准化后的数据为z_{ij},则z_{ij}=\frac{x_{ij}-\bar{x}_j}{s_j};其中,x_{ij}是原始数据,\bar{x}_j是第j列的均值,s_j是第j列的标准差,消除量纲和数量级的影响;通过计算数据的协方差矩阵:cov(x)=\frac{1}{n-1}\sum_{i=1}^{n}(x_i-\bar{x})(x_i-\bar{x})^t;其中,cov(x)表示数据矩阵x的协方差矩阵,x_i是第i个观测值(行向量),\bar{x}是所有观测值的均值(行向量),n是观测值的数量;通过解方程cov(x)v=\lambdav得到特征值\lambda和对应的特征向量v,根据特征值的大小排序,选择前k个最大的特征值对应的特征向量作为主成分,将数据投影到选定的主成分上,即y=xv,其中x是原始数据矩阵,v是选定的主成分矩阵,y是降维后的数据,实现降维;和/或通过优化算法分离出这些独立成分,达到降维的目的;输出降维后的数据,得到中药制剂质量主要特征。
6、可选的,在本发明第一方面的第三种实现方式中,所述依据所述中药制剂质量主要特征构建预测模型,对于线性关系明显的质量属性采用岭回归建立预测模型,对于非线性关系明显的质量属性采用多项式回归非线性模型,得到训练后的岭回归预测模型、多项式回归非线性模型,依据所述中药制剂质量主要特征构建深度学习模型,依据深度学习模型的自动特征提取能力,进一步提高预测精度,得到训练后的深度学习模型,包括:依据所述中药制剂质量主要特征得到训练集及验证集;针对线性关系明显的质量属性,选择相应的特征,利用岭回归方法建立预测模型,通过引入l2正则化项来防止过拟合,通过交叉验证和网格搜索方法,确定岭回归中的正则化系数,在训练集上训练模型,并在验证集上评估其性能,得到训练后的岭回归预测模型;对于非线性关系明显的质量属性,通过构造特征的多项式形式来捕捉非线性关系,采用多项式回归方法建立非线性预测模型,通过交叉验证确定多项式的最佳阶数,同样在训练集上训练模型,并在验证集上评估性能,得到训练后的多项式回归非线性模型;根据数据特性设计深度学习网络,包括多层感知机(mlp)、卷积神经网络;利用深度学习模型的深层结构自动提取高级特征,使用反向传播和优化算法训练深度学习模型,同时应用早停、正则化技术防止过拟合,在验证集上评估深度学习模型的性能,得到训练后的深度学习模型。
7、可选的,在本发明第一方面的第四种实现方式中,所述依据训练后的岭回归预测模型、多项式回归非线性模型、深度学习模型,采用集成学习方法,将多个单一模型进行融合,包括:采用堆叠法来进行模型融合,为每个基模型分配不同的权重,基模型包括岭回归、多项式回归、深度学习模型;将训练集分为两部分,d_1用于训练基模型,d_2用于生成元学习器的训练数据;使用训练集的第一部分数据训练岭回归模型、多项式回归模型和深度学习模型,然后,使用这些训练好的模型对训练集的第二部分数据进行预测;得到预测值y_{\text{ridge},i}、y_{\text{poly},i}、y_{\text{dl},i};将预测结果作为新的特征,与实际标签y_i一起构成元学习器的训练数据集;使用决策树模型作为元学习器,使用上一步生成的新的训练数据集来训练元学习器,元学习器的训练数据集表示为:d_{\text{meta}}={(y_{\text{ridge},i},y_{\text{poly},i},y_{\text{dl},i},y_i)|i=1,2,\ldots,|d_2|};其中:y_{\text{ridge},i}、y_{\text{poly},i}、y_{\text{dl},i}分别是岭回归模型、多项式回归模型和深度学习模型对样本x_i的预测值;y_i是样本x_i的实际标签;|d_2|表示数据集d_2的样本数量;元学习器的预测函数表示为:y_{\text{ensemble},i}=f_{\text{meta}}(y_{\text{ridge},i},y_{\text{poly},i},y_{\text{dl},i});其中:y_{\text{ensemble},i}是元学习器对样本x_i的最终预测结果;f_{\text{meta}}是元学习器的预测函数;得到最终的预测结果,元学习器根据各个基模型的预测性能来动态调整它们的权重。
8、可选的,在本发明第一方面的第五种实现方式中,所述依据中药制剂多维数据中的实时数据,输入到上述训练好的模型中,通过将多个单一模型进行融合,得到中药制剂质量检测结果,包括:接收中药制剂的多维实时数据,对数据进行清洗、标准化和归一化处理,确保数据质量并消除不同特征之间的量纲差异;将预处理后的多维实时数据分别输入到训练好的岭回归模型、多项式回归模型和深度学习模型中;每个模型都会根据输入数据生成一个质量检测结果的预测值;利用一个额外的轻量级神经网络来学习并动态调整每个模型的权重,这个神经网络的输入是各个单一模型的预测结果以及输入数据的统计特征,输出是每个模型的权重;通过在验证集上优化这个神经网络的参数,使其能够根据实际情况动态分配权重,从而提高融合结果的准确性;根据动态权重分配机制得到的权重,对三个单一模型的预测结果进行加权平均,融合公式表示为:
9、quality_prediction=w1*ridge_prediction+w2*poly_prediction+w3*dl_prediction;其中w1、w2和w3是通过动态权重分配机制得到的权重;对融合后的预测结果进行后处理,包括反归一化、阈值判断,输出最终的中药制剂质量检测结果,包括具体的数值、等级或者合格/不合格的判定。
10、可选的,在本发明第一方面的第六种实现方式中,还包括:设计一个持续学习与优化机制,定期利用新收集的数据对单一模型和动态权重分配网络进行微调,以保持模型的准确性和适应性;和/或设立一个实时反馈机制,将模型融合后得到的质量检测结果与实际生产过程中的质量控制数据进行对比,通过分析模型预测与实际结果的差异,不断优化和调整模型的参数或结构,以提高预测的准确性和可靠性;和/或开发一个数据可视化平台,将多维数据以及模型的预测结果以直观的方式展示出来,预测结果偏离正常范围时,数据可视化平台自动触发预警。
11、本发明第二方面提供了一种基于多维数据分析的中药制剂质量检测装置,所述基于多维数据分析的中药制剂质量检测装置包括:获取模块,用于收集中药制剂多维数据,所述中药制剂多维数据包括制剂成分、制备工艺参数以及对应的质量属性;处理模块,用于依据所述中药制剂多维数据结合套索回归进行特征选择,得到中药制剂质量关键影响数据,依据所述中药制剂质量关键影响数据应用主成分分析或独立成分分析进行降维处理,提取得到中药制剂质量主要特征;设置模块,用于依据所述中药制剂质量主要特征构建预测模型,对于线性关系明显的质量属性采用岭回归建立预测模型,和/或对于非线性关系明显的质量属性采用多项式回归非线性模型,得到训练后的岭回归预测模型、多项式回归非线性模型,依据所述中药制剂质量主要特征构建深度学习模型,依据深度学习模型的自动特征提取能力,进一步提高预测精度,得到训练后的深度学习模型;融合模块,用于依据训练后的岭回归预测模型、多项式回归非线性模型、深度学习模型,采用集成学习方法,将多个单一模型进行融合;分配模块,用于依据中药制剂多维数据中的实时数据,输入到上述训练好的模型中,通过将多个单一模型进行融合,得到中药制剂质量检测结果。
12、本发明第三方面提供了一种基于多维数据分析的中药制剂质量检测设备,包括:存储器和至少一个处理器,所述存储器中存储有指令;所述至少一个处理器调用所述存储器中的所述指令,以使得所述基于多维数据分析的中药制剂质量检测设备执行上述的基于多维数据分析的中药制剂质量检测方法。
13、本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的基于多维数据分析的中药制剂质量检测方法。
14、本发明提供的技术方案中,提出了一种基于多维数据分析的中药制剂质量检测方法。首先收集包含制剂成分、制备工艺参数及对应质量属性的多维数据。接着,利用套索回归进行特征选择,提取关键影响数据,并通过主成分分析或独立成分分析进行降维,得到中药制剂质量的主要特征。然后,根据数据的线性或非线性关系,分别构建岭回归预测模型、多项式回归非线性模型以及深度学习模型,并通过集成学习方法将多个单一模型进行融合,以提高预测精度。最后,利用实时数据输入到训练好的模型中,得到中药制剂的质量检测结果。此外,本发明还包括持续学习与优化、实时反馈以及数据可视化等辅助机制。
15、有益效果好处:提高检测精度:通过多维数据的综合分析,以及多种模型的融合,能够更全面地捕捉影响中药制剂质量的各种因素,从而提高质量检测的精度和可靠性。增强适应性:该技术能够处理线性和非线性关系的质量属性,使得模型具有更广泛的适应性,能够应对不同种类的中药制剂质量检测需求。持续优化能力:通过持续学习与优化机制,模型能够不断利用新数据进行微调,保持其准确性和适应性,延长模型的使用寿命。实时反馈与预警:实时反馈机制可以及时发现模型预测与实际结果的差异,进行调整优化。同时,当预测结果偏离正常范围时,数据可视化平台能够自动触发预警,有助于及时发现问题并采取措施。提升效率与降低成本:自动化的质量检测方法可以大幅提高检测效率,减少人工干预和检测成本,对于中药制剂的批量生产与质量控制具有重要意义。
本文地址:https://www.jishuxx.com/zhuanli/20241021/320221.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表