一种风寒风热证型基因特征判定系统及装置的制作方法
- 国知局
- 2024-09-11 14:54:01
本发明涉及基因,尤其是涉及一种风寒风热证型基因特征判定系统及装置。
背景技术:
1、风寒证与风热证是急性上呼吸道感染最常见的两种证型,针对不同的证型,需要运用不同的中医药方进行应对,因此,准确辨证是保证良好临床疗效的前提。
2、在目前临床实践中,对风寒证或风热证的判定主要取决于医生对于不同患者临床症状的主观判断,缺乏客观的证型判定标志物。例如:如果患者表现为恶寒重发热轻,无汗,咽痒但无明显疼痛,流清稀鼻涕,则判定为风寒证;如果患者表现为发热重恶寒轻,汗出,咽痛甚至灼痛,流黄浊鼻涕,则判定为风热证。根据这种证型判定标准,不仅需要患者清晰地表述,还需要医生具备充足的知识储备和临床经验,才能够对症状信息进行准确鉴别。一旦辨证错误,则会导致中药使用不当,可能会加重患者病情,进而延长病程,并带来不必要的经济负担。
3、因此,寻找出急性上呼吸道感染风寒证与风热证的证型判定标志物对于提高辨证准确性及客观性具有十分重要的意义。
技术实现思路
1、本发明的目的在于提供一种风寒风热证型基因特征判定系统及装置,以解决现有技术中存在的至少一种上述技术问题。
2、第一方面,为解决上述技术问题,本发明提供一种风寒风热证型基因特征判定系统,包括数据收集模块、数据处理模块及结果生成模块;
3、所述数据收集模块,用于收集被测rna中标志基因的表达量数值;所述被测rna来自于患者的外周血样本,这样可以利于外周血富含各类rna、能够反应机体当前功能状态信息的特点,有效反应标志基因信息;所述标志基因包括ighe和/或hbg2和/或mt-nd5和/或mt-nd6和/或mt-te和/或egr3和/或gos2和/或fam156a和/或rpl34p18和/或pkd1p2和/或fosb;
4、所述数据处理模块,包括模型单元及预测单元;
5、所述模型单元,存储有预训练的判定模型;
6、所述预测单元,调用所述判定模型,输入标志基因的表达量数值,得到被测rna符合风寒证基因特征或风热证基因特征的预测结果;
7、所述结果生成模块,用于将所述预测结果外发。
8、通过上述系统,可以快速地判定出被测rna符合风寒性基因特征还是风热性基因特征,判定过程简便、客观,可有效提升辨证的准确性。
9、在一种可行的实施方式中,所述患者为急性上呼吸道感染患者。
10、在一种可行的实施方式中,所述标志基因的确定方法包括:
11、步骤1、制定风寒证判定标准及风热证判定标准。
12、在一种可行的实施方式中,可由领域专家,包括呼吸道疾病专家、国医大师及知名中医等,制定风寒证判定标准及风热证判定标准。
13、在一种可行的实施方式中,所述风寒证判定标准包括风寒纳入症状及风寒排除症状,当出现至少两条风寒纳入症状且没有出现任一风寒排除症状时,判定为风寒证;
14、所述风寒纳入症状包括:
15、症状11、自觉怕冷或增加衣物后仍感觉寒冷;
16、症状12、头痛或全身肌肉酸痛;
17、症状13、流清涕;
18、症状14、舌苔薄白;
19、所述风寒排除症状包括:
20、症状21、日常静息状态下,出汗比平时多(不包括服药后出汗及保暖措施后出汗);
21、症状22、黄脓涕或粘稠涕;
22、症状23、咽喉肿痛;
23、症状24、咳黄痰;
24、症状25、大便干燥。
25、在一种可行的实施方式中,所述风热证判定标准包括风热纳入症状及风热排除症状,当出现至少两条风热纳入症状且没有出现任一风热排除症状时,判定为风热证;
26、所述风热纳入症状包括:
27、症状31、头痛或全身肌肉酸痛;
28、症状32、咽喉疼痛;
29、症状33、黄脓涕或粘稠涕;
30、症状34、舌质红;
31、所述风热排除症状包括:
32、症状41、自觉怕冷或增加衣物后仍感觉寒冷;
33、症状42、流清涕。
34、步骤2、基于风寒证判定标准及风热证判定标准,筛选确定若干相应患者分别作为风寒证组及风热证组,并筛选若干健康人作为健康组进行对照;分别采集风寒证组第一、六天的外周血样本、风热证组第一、六天的外周血样本以及健康组的外周血样本;其中,第一天是指患者体温超过37.3℃后48小时以内的就诊当天,第六天是指以所述第一天起算后的第六天;将所述第六天作为外周血样本的采样时间点是因为急性上呼吸道感染在第六天开始进入恢复阶段;因此,通过鉴别风寒证或风热证在第一天与第六天的差异基因,能够筛选出仅在第一天发生显著变化的基因,该基因可以作为风寒证或风热证早期的标志基因。
35、在一种可行的实施方式中,所述风寒证组、所述风热证组及所述健康组中每个人的年龄、身高及体重无差异,以保证三组之间的数据可比性。
36、在一种可行的实施方式中,所述风寒证组与所述风热证组中每个人的体温、症状评分及血常规结果无差异,以保证两组之间的数据可比性。
37、步骤3、提取步骤2中各外周血样本中的rna;对各rna进行测序,得到相应的转录组数据;基于各转录组数据,提取宿主基因并计算表达量数值;通过无重复差异基因分析工具,例如edger、deseq2及limma等,鉴别出对照宿主基因之间的差异基因。
38、在一种可行的实施方式中,基于各转录组数据,提取宿主基因并计算表达量数值的具体步骤包括:
39、步骤31、通过测序数据质控工具,例如fastqc软件,对各转录组数据进行质控,以便后序处理;
40、步骤32、通过短序列比对工具,例如hisat2软件,将各转录组数据比对到grch38.195参考基因组(人类基因组)上,提取宿主基因,从而筛除微生物基因等;
41、步骤33、通过转录组定量工具,例如featurecounts软件,计算每个宿主基因比对到的reads(读长)数目;
42、步骤34、筛选高丰度基因的表达信息,并计算高丰度基因在每百万个reads中匹配的reads数目(cpm),再通过log2进行对数计算,得到表达量数值(log2cpm);所述高丰度基因是指在75%以上的外周血样本rna中都有表达的基因。
43、在一种可行的实施方式中,所述无重复差异基因分析工具为edger软件。
44、在一种可行的实施方式中,所述对照宿主基因的对照关系包括:风寒证组第一天对照健康组、风热证组第一天对照健康组、风寒证组第一天对照风寒证组第六天、风热证组第一天对照风热证组第六天以及风寒证组第一天对照风热证组第一天;这样可以通过交叉对照的方式,准确确定差异基因。
45、在一种可行的实施方式中,所述差异基因在各宿主基因中的表达量数值差异为至少2倍。
46、步骤4、通过韦恩图,从差异基因中筛选出仅在风寒证或风热证中发生特异性变化的基因,作为标志基因:在风寒证中发现的5个标志基因分别是:ighe、hbg2、mt-nd5、mt-nd6及mt-te;在风热证中发现的6个标志基因分别是:egr3、gos2、fam156a、rpl34p18、pkd1p2及fosb。
47、在一种可行的实施方式中,所述判定模型为随机森林模型。
48、在一种可行的实施方式中,所述随机森林模型的训练过程包括:通过python3.11中的sklearn机器学习工具包(1.3.0),构建随机森林模型,包括每种标志基因对应的分类器;将数据库中各标志基因样本的表达量数值(log2cpm)作为输入数据,将符合风寒证基因特征的标签赋值为0,将符合风热证基因特征的标签赋值为1,训练随机森林模型进行预测:先由每个分类器分别进行单独预测,再由随机森林模型集成所有分类器单独的预测结果,得到整体的预测结果;通过gridsearchcv网格搜索方法,基于交叉验证准确率,迭代得到随机森林模型的最优参数组合;通过交叉验证函数,获取标志基因样本符合风寒证基因特征或风热证基因特征的预测结果;通过roc_curve函数绘制受试者工作特征曲线(roc),通过auc函数计算受试者工作特征曲线下面积(auc),评估随机森林模型的预测性能。
49、在一种可行的实施方式中,所述最优参数组合包括:
50、n_estimators(估计器的数量)=22;
51、random_state(随机数种子)=90;
52、max_depth(遍历搜索的最大深度)=5;
53、max_features(最大的特征数量)=3;
54、min_samples_split(最小分割样本数)=2;
55、基于上述最优参数组合,随机森林模型的交叉验证准确率为0.88,受试者工作特征曲线下面积为90.56%,完全满足使用要求。
56、第二方面,基于相同的发明构思,本技术还提供了一种风寒风热证型基因特征判定装置,包括处理器、存储器及总线,所述存储器存储可由处理器读取的指令及数据,所述处理器用于调用所述存储器中的指令及数据,以实现如上所述的风寒风热证型基因特征判定系统,所述总线连接各功能部件之间用于传送信息。
57、采用上述技术方案,本发明具有如下有益效果:
58、本发明提供的一种风寒风热证型基因特征判定系统及装置,通过采集风寒证及风热证患者的外周血样本rna,经转录组分析鉴定差异基因,再筛选各证型中表达水平发生特异性改变的差异基因作为标志基因,构建判定模型。基于所述判定模型,便可以准确、快速地对被测rna符合风寒证基因特征或风热证基因特征进行判定。
本文地址:https://www.jishuxx.com/zhuanli/20240911/292501.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。