信息处理程序、信息处理装置以及信息处理方法与流程
- 国知局
- 2024-09-19 14:25:53
本发明涉及信息处理程序等。
背景技术:
1、近年,进行了通过提取具有相关关系的条件,高效地缩小应该进行因果搜索的条件的数目的研究。图8是表示用于统计因果搜索的条件提取的参考图。如图8所示,在这样的技术中,从用于使ai学习的过去的数据提取全部具有相关关系的数据的条件候补。而且,在该技术中,从提取出的数据的条件候补提取全部具有因果关系的数据的条件。然而,在该技术中,有对全部的数据的条件候补搜索因果关系但从计算量的观点来看是不现实的这样的问题。
2、因此,公开有通过将条件的搜索对象从因果关系缓和为相关关系,从而高效地缩小应该进行因果搜索的条件的数目的技术(例如,非专利文献)。图9是表示发现各个特征性的因果关系的技术的参考图。如图9所示,在这样的技术中,首先,使用显露模式发现技术,从过去的样本集网罗性地求出在特定的条件下与目标变量具有较强的相关性的重要因素候补与此时的条件的组。此外,在基于阈值进行了二值化后使用过去的样本集。
3、其后,分别对求出的条件,使用因果搜索技术判定该条件下的重要因素候补是否是正确的重要因素。例如,假设有“x1∧x3∧x4→y”(若x1=x3=x4=1则y=1)的情况。在这样的情况下,将从左边选择的一个变量作为“重要因素的候补”,将剩余变量作为“条件”。这里,假设x4表示“重要因素的候补”,剩余的“x1∧x3”表示“条件”。在这样的技术中,若在满足“条件”的过去的样本集中“重要因素的候补”与右边的y具有较高的相关性,则采用该“条件”。这样求出的条件和重要因素保持于db(database:数据库)。而且,在应用时,对想要明确因果关系的样本,从db选择该样本满足的条件,并提示对应的重要因素。
4、非专利文献1:小柳祐介,其他四名,“发现各个特征性的因果关系的技术的开发与向营销数据的应用”,人工智能学会第18次商务信息学研究会,2021年3月,<url:http://sig-bi.jp/doc/18thsig-bi2021/18thsig-bi2021 paper13.pdf>
5、然而,在过去的样本集所包含的特征量为数值数据时,有根据二值化的阈值设定,既有能够检测在“条件”下显现较高的相关性的特征量的对的情况,也有不能够检测这样的特征量的对的情况这样的问题。即,若二值化的阈值设定改变,则“条件”下的特征量的对的相关关系改变。这里,参照图10a以及图10b对若二值化的阈值设定改变,则“条件”下的特征量的对的相关关系改变的问题进行说明。图10a以及图10b是说明根据二值化的阈值设定而特征量的对的相关关系改变的问题的图。
6、如图10a以及图10b所示,在左图示出关注于特征量a和特征量b绘制满足“条件”的样本和不满足“条件”的样本的图表。白圆是满足“条件”的样本,黑圆是不满足“条件”的样本。
7、在这样的状况下,在图10a中,使对特征量a的样本进行二值化时的阈值为3.5,使对特征量b的样本进行二值化时的阈值为6.3。右图的表数据是利用这些阈值对各样本进行二值化后的表。在从二值化提取满足“条件”的样本的情况下,由于特征量a与特征量b的相关性较高,所以检测到在“条件”下显现较高的相关性的特征量a与特征量b的对。其结果,采用该“条件”作为显现相关性的条件。
8、与此相对,在图10b中,使对特征量a的样本进行二值化时的阈值为5,并使对特征量b的样本进行二值化时的阈值为4。右图的表数据是利用这些阈值对各样本进行二值化后的表。在从二值化提取满足“条件”的样本的情况下,看起来特征量a与特征量b的相关性较低,所以检测不到在“条件”下显现较高的相关性的特征量a与特征量b的对。其结果,不采用该“条件”作为显现相关性的条件。
9、这样,在过去的样本集所包含的特征量为数值数据时,根据二值化的阈值设定,既有能够检测到在“条件”下显现较高的相关性的特征量的对的情况,也有检测不到这样的特征量的对的情况。
技术实现思路
1、在一个方面,本发明的目的在于精度良好地选择显现相关性的条件。
2、在一个方式中,信息处理程序使计算机执行如下处理:根据第一数据生成第二数据,其中,上述第一数据是按照每个样本积蓄了各样本具有的多个属性的值的数据,上述第二数据是按照每个样本基于预先设定的属性条件将各样本具有的多个属性的值二值化后的数据;使用上述第二数据,列举样本集全部表示真值的属性条件的集合;按照每个属性条件的集合,计算与各属性条件的集合建立了对应关系的样本集中的上述第一数据中的多个属性间的相关性;以及将判定为有相关性的属性条件的集合选择为应该进行因果搜索的条件。
3、根据一实施方式,能够精度良好地选择显现相关性的条件。
技术特征:1.一种信息处理程序,其特征在于,使计算机执行如下处理:
2.根据权利要求1所述的信息处理程序,其特征在于,
3.根据权利要求2所述的信息处理程序,其特征在于,
4.根据权利要求1所述的信息处理程序,其特征在于,
5.根据权利要求4所述的信息处理程序,其特征在于,
6.一种信息处理装置,其特征在于,具有:
7.一种信息处理方法,其特征在于,计算机执行如下处理:
技术总结信息处理装置(1)根据按照每个样本积蓄了各样本具有的多个特征量的值的特征量数据(21),生成按照每个样本基于预先设定的项目将各样本具有的多个特征量的值二值化后的二进制特征量数据(22),使用二进制特征量数据(22),列举样本集全部表示真值的项目集,按照每个项目集,计算与各项目集建立了对应关系的样本集中的特征量数据(21)中的多个特征量间的相关性,并将判定为有相关性的项目集选择为应该进行因果搜索的条件。由此,能够精度良好地选择显现相关性的条件。技术研发人员:岩下洋哲,浅井达哉,上村健人,小柳佑介受保护的技术使用者:富士通株式会社技术研发日:技术公布日:2024/9/17本文地址:https://www.jishuxx.com/zhuanli/20240919/298048.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。