作业帮 > 数学 > 作业

简述一种关联规则挖掘算法基本过程.《数据挖掘》作业题追分100

来源:学生作业帮 编辑:拍题作业网作业帮 分类:数学作业 时间:2024/04/30 05:12:38
简述一种关联规则挖掘算法基本过程.《数据挖掘》作业题追分100
如题.
Apriori算法是一种发现频繁项集的基本算法.算法使用频繁项集性质的先验知识.Apriori算法使用一种称为逐层搜索的迭代方法,其中K项集用于探索(k+1)项集.首先,通过扫描数据库,累计每个项的计数,并收集满足最小支持度的项,找出频繁1项集的集合.该集合记为L1.然后,使用L1找出频繁2项集的集合L2,使用L2找到L3,如此下去,直到不能再找到频繁k项集.
Apriori算法的主要步骤如下:
(1)扫描事务数据库中的每个事务,产生候选1.项集的集合Cl;
(2)根据最小支持度min_sup,由候选l-项集的集合Cl产生频繁1一项集的集合Ll;
(3)对k=l;
(4)由Lk执行连接和剪枝操作,产生候选(k+1).项集的集合Ck+l-
(5)根据最小支持度min_sup,由候选(k+1)一项集的集合Ck+l产生频繁(k+1)-项
集的集合Lk+1.
(6)若L⋯≠①,则k.k+1,跳往步骤(4);否则,跳往步骤(7);
(7)根据最小置信度min_conf,由频繁项集产生强关联规则,结束.