基于机器学习的家用物联网设备DDoS检测教学文档

1. 研究背景与意义

1.1 物联网安全现状

物联网设备数量从2017年80亿增长到2020年200亿
流行的物联网设备平均存在25个漏洞，包括开放的telnet端口、过时的Linux固件和未加密的敏感数据传输
典型案例：2016年Mirai僵尸网络利用约10万台IoT设备(主要是闭路电视摄像机)对Dyn DNS基础设施进行DDoS攻击

1.2 研究意义

传统基于阈值的检测方法容易误报且无法适应快速演变的攻击方式
物联网设备流量具有独特特征(有限服务器通信、固定时间间隔等)，适合机器学习检测
家庭路由器或ISP交换机等网络中间件需要轻量级、协议兼容和低内存的检测方案

2. 威胁模型

2.1 假设条件

家庭网关路由器可以观察、检查、存储、修改和阻止所有通过其路径的网络通信
任何连接到中间件的设备都可能同时发送正常和攻击流量
设备可能串行进行不同类型的DoS攻击，持续时间约1.5分钟(常见避开检测的持续时间)

2.2 攻击类型

TCP SYN Flood
UDP Flood
HTTP GET Flood

3. 异常检测流程

3.1 整体流程

流量捕获
基于设备和时间的数据包分组
特征提取
二分类

3.2 实验环境搭建

使用Raspberry Pi v3作为WiFi接入点(中间件)
连接的真实IoT设备：
- YI Home Camera
- Belkin WeMo Smart Switch
- Withings血压监测器(通过蓝牙连接Android手机)
攻击模拟：
- Kali Linux虚拟机作为DoS源
- Raspberry Pi 2运行Apache作为受害者
- 使用Goldeneye工具模拟HTTP GET Flood
- 使用hping3模拟TCP SYN Flood和UDP Flood

4. 特征工程

4.1 无状态特征

数据包大小
- 攻击数据包: 90%在100字节以内
- 正常数据包: 100-1,200字节之间变化
数据包间隔(ΔT)
- 正常流量: 突发性有限，固定时间间隔
- 攻击流量: ΔT接近零，一阶和二阶导数高
通信协议
- 正常流量: UDP比TCP高出近三倍
- 攻击流量: TCP和UDP数量几乎相同
- 使用one-hot编码: IS_TCP, IS_UDP, IS_HTTP, IS_OTHER

4.2 有状态特征

带宽
- 在10秒时间跨度内计算平均带宽
- 正常和攻击流量间差异较小但仍可利用
目标IP地址数目和差异性
- 正常流量: 与有限服务器通信(如WeMo智能交换机仅与4个远程主机通信)
- 攻击流量: 与更多IP通信
- 计算10秒内不同目标IP地址数量及其变化

5. 机器学习模型与实验结果

5.1 测试算法

K近邻算法(KN)
线性核的支持向量机(LSVM)
基于基尼不纯度的决策树(DT)
基于基尼不纯度的随机森林(RF)
全连接神经网络(NN)

5.2 实验结果

算法	准确率
基线(全恶意)	0.93
LSVM	0.91
DT	0.99
KN	0.99
RF	0.99
NN	0.99

5.3 特征重要性

无状态特征重要性显著高于有状态特征
结合有状态特征可提高F1分数0.01-0.05

6. 部署考虑

6.1 网络中间件要求

轻量级特性：依赖网络流统计而非深度包检查
协议兼容特性：处理各种协议(TCP/UDP/HTTP等)的共有分组特性
低内存实现：无状态或仅需短时间存储流信息

6.2 实际部署挑战

设备隔离可能影响基本功能(如血糖监测器或家用水泵)
用户通知机制的有效性(普通用户可能缺乏维护知识)

7. 未来研究方向

在更真实的网络环境下评估性能
- 使用实际DDoS攻击记录
- 与ISP合作获取NetFlow记录
更大数据集研究
- 不同IoT设备类型对检测精度的影响
- 设备正常流量的规律性差异
算法优化
- 尝试更复杂特征
- 深度学习检测复杂攻击
干预机制研究
- 在不影响基本功能情况下的隔离方案
- 更有效的用户通知和维护指导

8. 参考文献

[1] McKinsey & Company. (2016). Unlocking the potential of the internet of things.
[2] Hewlett Packard Enterprise. (2015). Internet of things research study.
[3] BITAG. (2016). Internet of things (iot) security and privacy recommendations.
[4] Hilton, S. (2016). Dyn analysis summary of friday october 21 attack.
[5] Akamai. (2016). Threat advisory: Mirai botnet.
[6] Chandola, V., Banerjee, A., & Kumar, V. (2009). Anomaly detection: A survey.
[7] Apthorpe, N., Reisman, D., & Feamster, N. (2016). A smart home is no castle: Privacy vulnerabilities of encrypted iot traffic.
... [完整参考文献列表见原文]

基于机器学习的家用物联网设备DDoS检测教学文档 1. 研究背景与意义 1.1 物联网安全现状物联网设备数量从2017年80亿增长到2020年200亿流行的物联网设备平均存在25个漏洞，包括开放的telnet端口、过时的Linux固件和未加密的敏感数据传输典型案例：2016年Mirai僵尸网络利用约10万台IoT设备(主要是闭路电视摄像机)对Dyn DNS基础设施进行DDoS攻击 1.2 研究意义传统基于阈值的检测方法容易误报且无法适应快速演变的攻击方式物联网设备流量具有独特特征(有限服务器通信、固定时间间隔等)，适合机器学习检测家庭路由器或ISP交换机等网络中间件需要轻量级、协议兼容和低内存的检测方案 2. 威胁模型 2.1 假设条件家庭网关路由器可以观察、检查、存储、修改和阻止所有通过其路径的网络通信任何连接到中间件的设备都可能同时发送正常和攻击流量设备可能串行进行不同类型的DoS攻击，持续时间约1.5分钟(常见避开检测的持续时间) 2.2 攻击类型 TCP SYN Flood UDP Flood HTTP GET Flood 3. 异常检测流程 3.1 整体流程流量捕获基于设备和时间的数据包分组特征提取二分类 3.2 实验环境搭建使用Raspberry Pi v3作为WiFi接入点(中间件) 连接的真实IoT设备： YI Home Camera Belkin WeMo Smart Switch Withings血压监测器(通过蓝牙连接Android手机) 攻击模拟： Kali Linux虚拟机作为DoS源 Raspberry Pi 2运行Apache作为受害者使用Goldeneye工具模拟HTTP GET Flood 使用hping3模拟TCP SYN Flood和UDP Flood 4. 特征工程 4.1 无状态特征数据包大小攻击数据包: 90%在100字节以内正常数据包: 100-1,200字节之间变化数据包间隔(ΔT) 正常流量: 突发性有限，固定时间间隔攻击流量: ΔT接近零，一阶和二阶导数高通信协议正常流量: UDP比TCP高出近三倍攻击流量: TCP和UDP数量几乎相同使用one-hot编码: IS_ TCP, IS_ UDP, IS_ HTTP, IS_ OTHER 4.2 有状态特征带宽在10秒时间跨度内计算平均带宽正常和攻击流量间差异较小但仍可利用目标IP地址数目和差异性正常流量: 与有限服务器通信(如WeMo智能交换机仅与4个远程主机通信) 攻击流量: 与更多IP通信计算10秒内不同目标IP地址数量及其变化 5. 机器学习模型与实验结果 5.1 测试算法 K近邻算法(KN) 线性核的支持向量机(LSVM) 基于基尼不纯度的决策树(DT) 基于基尼不纯度的随机森林(RF) 全连接神经网络(NN) 5.2 实验结果 | 算法 | 准确率 | |------|--------| | 基线(全恶意) | 0.93 | | LSVM | 0.91 | | DT | 0.99 | | KN | 0.99 | | RF | 0.99 | | NN | 0.99 | 5.3 特征重要性无状态特征重要性显著高于有状态特征结合有状态特征可提高F1分数0.01-0.05 6. 部署考虑 6.1 网络中间件要求轻量级特性：依赖网络流统计而非深度包检查协议兼容特性：处理各种协议(TCP/UDP/HTTP等)的共有分组特性低内存实现：无状态或仅需短时间存储流信息 6.2 实际部署挑战设备隔离可能影响基本功能(如血糖监测器或家用水泵) 用户通知机制的有效性(普通用户可能缺乏维护知识) 7. 未来研究方向在更真实的网络环境下评估性能使用实际DDoS攻击记录与ISP合作获取NetFlow记录更大数据集研究不同IoT设备类型对检测精度的影响设备正常流量的规律性差异算法优化尝试更复杂特征深度学习检测复杂攻击干预机制研究在不影响基本功能情况下的隔离方案更有效的用户通知和维护指导 8. 参考文献 [ 1 ] McKinsey & Company. (2016). Unlocking the potential of the internet of things. [ 2 ] Hewlett Packard Enterprise. (2015). Internet of things research study. [ 3 ] BITAG. (2016). Internet of things (iot) security and privacy recommendations. [ 4 ] Hilton, S. (2016). Dyn analysis summary of friday october 21 attack. [ 5 ] Akamai. (2016). Threat advisory: Mirai botnet. [ 6 ] Chandola, V., Banerjee, A., & Kumar, V. (2009). Anomaly detection: A survey. [ 7 ] Apthorpe, N., Reisman, D., & Feamster, N. (2016). A smart home is no castle: Privacy vulnerabilities of encrypted iot traffic. ... [ 完整参考文献列表见原文 ]