数据集是构建机器学习模型关键,为提升机器学习透明性并使模型更易于评估,提供真实操作系统和TLS加密流量数据集。

数据集使用许可

数据集遵循知识共享许可协议Creative Commons Attribution Non-Commercial No Derivatives License CC-BY-NC-ND-3.0数据集仅供研究使用,不得用于商业或其它目的,当使用数据集时,必须引用该数据集名,以及数据集下载链接或相关论文。

资产数据集(ecsl-dataset-asset1)

该数据集包含Windows、Linux、安卓、MacOS等操作系统产生的真实网络流量pcap文件,其中TCP flow约43000条,TLS flow约22260条,获取该数据集请发送邮件至zhi[dot]liu[at]swpu.edu.cn。

操作系统版本
WindowsWindows7、Windows8、Windows8.1、Windows10
LinuxCentOS6、CentOS7、Ubuntu16.04、Ubuntu18.04、Ubuntu20.04、RedHat6、RedHat7
AndroidAndorid6、Andorid7
Mac OSXMacOS10.10、MacOS10.13、MacOS10.14、MacOS10.15

TLS加密流量数据集(ecsl-dataset-tls1)

该数据集包含正常TLS流量与恶意流量,用于机器学习模型构建与验证,预计下半年发布。