数据仓库作业五:第8章 关联规则挖掘

目录

    • 第8章 关联规则挖掘
      • 作业题


第8章 关联规则挖掘

作业题

1、设4-项集 X = { a , b , c , d } X=\{a,b,c,d\} X={a,b,c,d},试求出由 X X X 导出的所有关联规则。

解:

首先生成项集的所有非空真子集。这包括:
{ a } , { b } , { c } , { d } \{a\},\{b\},\{c\},\{d\} {a},{b},{c},{d}
{ a , b } , { a , c } , { a , d } , { b , c } , { b , d } , { c , d } \{a,b\},\{a,c\},\{a,d\},\{b,c\},\{b,d\},\{c,d\} {a,b},{a,c},{a,d},{b,c},{b,d},{c,d}
{ a , b , c } , { a , b , d } , { a , c , d } , { b , c , d } \{a,b,c\},\{a,b,d\},\{a,c,d\},\{b,c,d\} {a,b,c},{a,b,d},{a,c,d},{b,c,d}

对于每个非真空子集,生成相应的关联规则。一般地,对于子集 { A } \{A\} {A},关联规则的形式是 { X } ⇒ { X − A } \{X\}\Rightarrow\{X-A\} {X}{XA},其中 X − A X-A XA 表示项集 X X X 中不包含在 A A A 中的项。

下面是所有可能的关联规则:

{ a } ⇒ { b , c , d } , { b } ⇒ { a , c , d } , { c } ⇒ { a , b , d } , { d } ⇒ { a , b , c } , \{a\}\Rightarrow\{b,c,d\},\{b\}\Rightarrow\{a,c,d\},\{c\}\Rightarrow\{a,b,d\},\{d\}\Rightarrow\{a,b,c\}, {a}{b,c,d},{b}{a,c,d},{c}{a,b,d},{d}{a,b,c},

{ a , b } ⇒ { c , d } , { a , c } ⇒ { b , d } , { a , d } ⇒ { b , c } , { b , c } ⇒ { a , d } , { b , d } ⇒ { a , c } , { c , d } ⇒ { a , b } , \{a,b\}\Rightarrow\{c,d\},\{a,c\}\Rightarrow\{b,d\},\{a,d\}\Rightarrow\{b,c\},\{b,c\}\Rightarrow\{a,d\},\{b,d\}\Rightarrow\{a,c\},\{c,d\}\Rightarrow\{a,b\}, {a,b}{c,d},{a,c}{b,d},{a,d}{b,c},{b,c}{a,d},{b,d}{a,c},{c,d}{a,b},

{ a , b , c } ⇒ { d } , { a , b , d } ⇒ { c } , { a , c , d } ⇒ { b } , { b , c , d } ⇒ { a } \{a,b,c\}\Rightarrow\{d\},\{a,b,d\}\Rightarrow\{c\},\{a,c,d\}\Rightarrow\{b\},\{b,c,d\}\Rightarrow\{a\} {a,b,c}{d},{a,b,d}{c},{a,c,d}{b},{b,c,d}{a}

这些规则代表了项集导出的所有可能的关联规则。

2、设有交易数据库如下表1所示,令MinS=0.3,试用Apriori算法求出其所有的频繁项集。

T i d T_{id} Tid顾客id购买商品购买日期
t 1 t_1 t1 c 01 c_{01} c01 { a , b } \{a,b\} {a,b}2015.03.01
t 2 t_2 t2 c 02 c_{02} c02 { c , b , d } \{c,b,d\} {c,b,d}2015.03.01
t 3 t_3 t3 c 01 c_{01} c01 { c } \{c\} {c}2015.03.03
t 4 t_4 t4 c 02 c_{02} c02 { b , d } \{b,d\} {b,d}2015.03.03

解:

因为最小支持度 M i n S = 0.3 MinS=0.3 MinS=0.3,事务数据库有4条记录, M i n S p t N = 0.3 × 4 = 1.2 MinSptN=0.3\times4=1.2 MinSptN=0.3×4=1.2,所以最小支持数 M i n S p t N = 2 MinSptN=2 MinSptN=2

如下表,候选频繁1-项集 C 1 C_1 C1和频繁1-项集 L 1 L_1 L1

在这里插入图片描述
如下表,候选频繁2-项集 C 2 C_2 C2和频繁2-项集 L 2 L_2 L2

在这里插入图片描述
得所有的频繁项集为 L = L 2 = { { b , d } } L=L_2=\{\{b,d\}\} L=L2={{b,d}}

3、对如表1所示的交易数据库,令MinC=0.6,试在习题2所得频繁项集的基础上,求出所有的强关联规则。

解:

由题可知,最小置信度 M i n C = 0.6 MinC=0.6 MinC=0.6
C o n f i d e n c e ( { b } ⇒ { d } ) = S u p p o r t ( { b , d } ) S u p p o r t ( { b } = 2 3 ≈ 0.67 > 0.6 Confidence(\{b\}\Rightarrow\{d\})=\frac{Support(\{b,d\})}{Support(\{b\}}=\frac{2}{3}\approx0.67>0.6 Confidence({b}{d})=Support({b}Support({b,d})=320.67>0.6 C o n f i d e n c e ( { d } ⇒ { b } ) = S u p p o r t ( { b , d } ) S u p p o r t ( { d } = 2 2 = 1 > 0.6 Confidence(\{d\}\Rightarrow\{b\})=\frac{Support(\{b,d\})}{Support(\{d\}}=\frac{2}{2}=1>0.6 Confidence({d}{b})=Support({d}Support({b,d})=22=1>0.6

所以 { b } ⇒ { d } \{b\}\Rightarrow\{d\} {b}{d} { d } ⇒ { b } \{d\}\Rightarrow\{b\} {d}{b} 都是强关联规则。

4、设有交易数据库如表2所示,令MinS=0.3,试用Apriori算法求出其所有的频繁项集。

T i d T_{id} Tid顾客id购买商品购买日期
t 1 t_1 t1 c 01 c_{01} c01 { a , b , e } \{a,b,e\} {a,b,e}2015.03.01
t 2 t_2 t2 c 02 c_{02} c02 { b , d } \{b,d\} {b,d}2015.03.01
t 3 t_3 t3 c 03 c_{03} c03 { b , c } \{b,c\} {b,c}2015.03.01
t 4 t_4 t4 c 01 c_{01} c01 { a , b , d } \{a,b,d\} {a,b,d}2015.03.03
t 5 t_5 t5 c 02 c_{02} c02 { a , c } \{a,c\} {a,c}2015.03.03
t 6 t_6 t6 c 03 c_{03} c03 { b , c } \{b,c\} {b,c}2015.03.03
t 7 t_7 t7 c 01 c_{01} c01 { a , c } \{a,c\} {a,c}2015.03.05
t 8 t_8 t8 c 03 c_{03} c03 { a , b , c , e } \{a,b,c,e\} {a,b,c,e}2015.03.05
t 9 t_9 t9 c 03 c_{03} c03 { a , b , c } \{a,b,c\} {a,b,c}2015.03.06

解:

因为最小支持度 M i n S = 0.3 MinS=0.3 MinS=0.3,事务数据库有9条记录, M i n S p t N = 0.3 × 9 = 2.7 MinSptN=0.3\times9=2.7 MinSptN=0.3×9=2.7,所以最小支持数 M i n S p t N = 3 MinSptN=3 MinSptN=3

如下表,候选频繁1-项集 C 1 C_1 C1和频繁1-项集 L 1 L_1 L1

在这里插入图片描述
如下表,候选频繁2-项集 C 2 C_2 C2和频繁2-项集 L 2 L_2 L2

在这里插入图片描述
如下表,候选频繁3-项集 C 3 C_3 C3

在这里插入图片描述

得所有的频繁项集为 L = L 2 = { { a , b } , { a , c } , { b , c } } L=L_2=\{\{a,b\},\{a,c\},\{b,c\}\} L=L2={{a,b},{a,c},{b,c}}

5、对如表2所示的交易数据库,令MinC=0.6,试在习题4所得频繁项集的基础上,求出所有的强关联规则。

解:

由题可知,最小置信度 M i n C = 0.6 MinC=0.6 MinC=0.6
C o n f i d e n c e ( { a } ⇒ { b } ) = S u p p o r t ( { a , b } ) S u p p o r t ( { a } = 4 6 ≈ 0.67 > 0.6 Confidence(\{a\}\Rightarrow\{b\})=\frac{Support(\{a,b\})}{Support(\{a\}}=\frac{4}{6}\approx0.67>0.6 Confidence({a}{b})=Support({a}Support({a,b})=640.67>0.6 C o n f i d e n c e ( { b } ⇒ { a } ) = S u p p o r t ( { a , b } ) S u p p o r t ( { b } = 4 7 ≈ 0.57 < 0.6 Confidence(\{b\}\Rightarrow\{a\})=\frac{Support(\{a,b\})}{Support(\{b\}}=\frac{4}{7}\approx0.57<0.6 Confidence({b}{a})=Support({b}Support({a,b})=740.57<0.6 C o n f i d e n c e ( { a } ⇒ { c } ) = S u p p o r t ( { a , c } ) S u p p o r t ( { a } = 4 6 ≈ 0.67 > 0.6 Confidence(\{a\}\Rightarrow\{c\})=\frac{Support(\{a,c\})}{Support(\{a\}}=\frac{4}{6}\approx0.67>0.6 Confidence({a}{c})=Support({a}Support({a,c})=640.67>0.6 C o n f i d e n c e ( { c } ⇒ { a } ) = S u p p o r t ( { a , c } ) S u p p o r t ( { c } = 4 6 ≈ 0.67 > 0.6 Confidence(\{c\}\Rightarrow\{a\})=\frac{Support(\{a,c\})}{Support(\{c\}}=\frac{4}{6}\approx0.67>0.6 Confidence({c}{a})=Support({c}Support({a,c})=640.67>0.6 C o n f i d e n c e ( { b } ⇒ { c } ) = S u p p o r t ( { b , c } ) S u p p o r t ( { b } = 4 7 ≈ 0.57 < 0.6 Confidence(\{b\}\Rightarrow\{c\})=\frac{Support(\{b,c\})}{Support(\{b\}}=\frac{4}{7}\approx0.57<0.6 Confidence({b}{c})=Support({b}Support({b,c})=740.57<0.6 C o n f i d e n c e ( { c } ⇒ { b } ) = S u p p o r t ( { b , c } ) S u p p o r t ( { c } = 4 6 ≈ 0.67 > 0.6 Confidence(\{c\}\Rightarrow\{b\})=\frac{Support(\{b,c\})}{Support(\{c\}}=\frac{4}{6}\approx0.67>0.6 Confidence({c}{b})=Support({c}Support({b,c})=640.67>0.6

所以 { a } ⇒ { b } \{a\}\Rightarrow\{b\} {a}{b} { a } ⇒ { c } \{a\}\Rightarrow\{c\} {a}{c} { c } ⇒ { a } \{c\}\Rightarrow\{a\} {c}{a} { c } ⇒ { b } \{c\}\Rightarrow\{b\} {c}{b} 是强关联规则。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/560106.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

ansible执行mysql脚本

目录 概述实践环境要求ansible yml脚本命令离线包 概述 ansible执行mysql脚本 实践 官网文档 环境要求 环境需要安装以下内容: 1.mysql客户端(安装了mysql即会有)2.安装MySQL-python (Python 2.X) 详细插件安装链接 ansible yml脚本 关键代码如下&#xff1a; # 剧本…

ROS2学习笔记(一) 基本概念

1. Node 节点 节点: 完成具体功能的模块 相关命令 #运行命令 ros2 run <package_name> <executable_name>#当前节点查询查询 ros2 node list#重映射 Remapping ros2 run <package_name> <executable_name> --ros-args --remap __node:<node_na…

KaiwuDB CTO 魏可伟:AIoT,用行业定义数据库

4月12日&#xff0c;由中国 DBA 联盟&#xff08;ACDU&#xff09;与墨天轮社区联合主办的第十三届数据技术嘉年华&#xff08;DTC 2024&#xff09;于北京盛大召开。KaiwuDB CTO 魏可伟受邀发表《智创当下&#xff0c;KaiwuDB 从多模到 AI 的探索实践》主题演讲&#xff0c;向…

Axure如何实现限制选择项数量的交互

大家经常会看到这样的功能设计&#xff1a;可以多选&#xff0c;但是限制多选。比如某招聘网站城市的选择只能选择5个。再选择第6个的时候会提示最多只能选择5项。 这个效果是我们经常会遇到的&#xff0c;在工作中也经常会遇到需要制作这样的效果。今天我们一起来看看&#xf…

Mac M3 安装Ollama和llama3,本地部署LobeChat和刘皇叔聊三国!

OllamaLobeChat&#xff0c;本地部署聊天助手 Ollama安装下载OllamaOllama常用指令和链接运行OllamaAPI 交互Ollama基于Llama 3角色扮演 LobeChat安装首先安装docker安装LobeChat的docker 镜像和运行 Ollama安装 下载Ollama 网址&#xff1a;https://ollama.com/ 支持macOS、…

产废端实时音视频监控系统在运输车辆驾驶室中的应用

实时音视频监控系统可通过在运输车辆驾驶室安装音视频摄录设备&#xff0c;实现将运输车辆内部及周围环境音视频数据通过移动网络实时回传指挥中心的功能。 前端摄录设备主要负责采集车内外的视音频信息&#xff0c;为了保障车辆及运输人员 的安全&#xff0c;应合理选择摄录设…

LeetCode 349.两个数组的交集(HashSet的使用)

给定两个数组 nums1 和 nums2 &#xff0c;返回 它们的 交集 。输出结果中的每个元素一定是 唯一 的。我们可以 不考虑输出结果的顺序 。 示例 1&#xff1a; 输入&#xff1a;nums1 [1,2,2,1], nums2 [2,2] 输出&#xff1a;[2]示例 2&#xff1a; 输入&#xff1a;nums1 …

电商技术揭秘三十:知识产权保护浅析

电商技术揭秘相关系列文章&#xff08;上&#xff09; 相关系列文章&#xff08;中&#xff09; 电商技术揭秘二十&#xff1a;能化供应链管理 电商技术揭秘二十一:智能仓储与物流优化(上) 电商技术揭秘二十二:智能仓储与物流优化(下) 电商技术揭秘二十三&#xff1a;智能…

学习大数据的第一天

今天学习如何安装hapood安装 1.安装hapood安装 2.需要的资料 3.开始安装 1.创建目录 mkdir -p /export/server 2.进入目录下 cd /export/server/ 3.安装 安装需要的依赖 yum install gcc gcc-c make autoconf automake libtool curl lzo-devel zlib-devel openssl opens…

安装SSL证书之后还会有不安全提示怎么办?

安装SSL证书过程中如果遇到错误&#xff0c;不要慌&#xff0c;按照以下步骤进行排查和解决&#xff1a; 1. 仔细阅读错误信息&#xff1a; - 错误消息通常会明确指出问题所在&#xff0c;如证书过期、证书链不完整、域名不匹配等。记下或截图保存具体的错误代码和描述&#xf…

解锁ApplicationContext vs BeanFactory: 谁更具选择性?

目录 一、聚焦源码回顾 &#xff08;一&#xff09;源码分析和理解 &#xff08;二&#xff09;简短的回顾对比建议 二、ApplicationContext vs BeanFactory特性对比 &#xff08;一&#xff09;主要特性总结 &#xff08;二&#xff09;直接建议 三、案例简单说明 &am…

SCADA系统通过巨控GRM模块实现OPC协议远程监控PLC

SCADA系统和PLC不在同一个地方&#xff0c;需要远程监控和控制PLC&#xff0c;可以通过巨控GRM模块来实现&#xff0c;通过OPC协议转巨控服务器远程读写PLC寄存器&#xff0c;从而完成远程监控PLC。 要实现SCAKDA系统远程监控PLC&#xff0c;关键是要实现SKADA能通过互联网访问…

G1垃圾回收器

G1垃圾回收器 概述 1.Young Collection(年轻代垃圾回收) 说明&#xff1a;下图中 e代表eden区(伊甸园)&#xff0c;s代表幸存者区&#xff0c;o代表老年代 初始时&#xff0c;所有区域都处于空闲状态 创建了一些对象&#xff0c;挑出一些空闲区域作为伊甸园区存储这些对象 G1…

数据结构学习--环形链表

环形链表 我们在判断一个链表是否是环形的&#xff0c;即首尾相连&#xff0c;我们可以以使用快慢指针&#xff0c;如果快指针能再次追上慢指针&#xff0c;就说明该链表是环形的&#xff0c;这边可以举个操场跑步的例子&#xff0c;当操场是环形的&#xff0c;跑的快的&#…

Docker Compose 的安装和使用详解

Docker Compose 是 Docker 官方开源的容器编排(Orchestration)项目之一,用于快速部署分布式应用。本文将介绍 Docker Compose 的基本概念、安装流程及使用方法。 简介 Compose 项目是 Docker 官方的开源项目,负责实现对 Docker 容器集群的快速编排。从功能上看,Docker C…

交换基础配置--单臂路由

1、创建vlan 创建vlan10 创建vlan10和vlan20 创建vlan1到vlan9 vlan1可以不用创建&#xff0c;因为交换机的所有接口默认为vlan1 本实验只需要vlan10和vlan20&#xff0c;以上只是介绍创建vlan的方法。 查看创建的vlan&#xff1a; sw2同理。接着将需要划分vlan的接口划入…

【java】29:IO流

文件&#xff1a; 1 什么是文件&#xff1a; 文件&#xff0c;对我们并不陌生&#xff0c;文件是保存数据的地方&#xff0c;比如大家经常使用的word文档,txt文件&#xff0c;excel文件.….都是文件。它既可以保存一张图片&#xff0c;也可以保持视频&#xff0c;声音.. .2 文…

开源Windows12网页版HTML源码

源码介绍 开源Windows12网页版HTML源码&#xff0c;无需安装就能用的Win12网页版来了Windows12概念版&#xff08;PoweredbyPowerPoint&#xff09;后深受启发&#xff0c;于是通过使用HTML、CSS、js等技术做了这样一个模拟板的Windows12系统&#xff0c;并已发布至github进行…

jvm-接口调用排查

问题描述 线上碰到个问题&#xff0c;某个接口调用时间特别长&#xff0c;线上调用接口直接报gateway time out 分析处理 1、先关闭该功能 &#xff08;该功能是非核心功能&#xff09; 2、本地起服务连环境排查&#xff0c;发现本地正常。并且线上其他接口正常&#xff0c;…

回归预测 | Matlab实现SA-BP模拟退火算法优化BP神经网络多变量回归预测

回归预测 | Matlab实现SA-BP模拟退火算法优化BP神经网络多变量回归预测 目录 回归预测 | Matlab实现SA-BP模拟退火算法优化BP神经网络多变量回归预测预测效果基本描述程序设计参考资料 预测效果 基本描述 1.Matlab实现SA-BP模拟退火算法优化BP神经网络多变量回归预测&#xff0…
最新文章