使用迁移学习的自动驾驶汽车信息物理系统安全策略

信息物理系统 (CPS) 是一种新兴系统，它通过信息通信基础设施，实现控制系统、传感器、执行器和周围环境等物理组件之间有效的实时通信与协作 (C&C)。自动驾驶汽车 (AV) 是大量采用 CPS 方法的领域之一，旨在通过降低能源消耗和空气污染来改善智慧城市中的人们生活。因此，自动驾驶汽车-信息物理系统 (AV-CPS) 吸引了众多大型企业的巨额投资，预计将得到广泛应用。然而，由于包括云计算在内的信息技术 (IT) 与通信过程的深度融合，AV-CPS 容易受到网络和物理威胁载体的攻击。云计算在提供 AV-CPS 实时数据处理、存储和分析所需的可扩展基础设施方面至关重要，使这些系统能够在智慧城市中无缝运行。通过网络基础设施，诸如传感器和控制系统等 CPS 组件尤其容易受到攻击者利用通信系统进行的网络攻击。本文提出了一种用于 AV-CPS 的智能入侵检测系统 (IIDS)，该系统使用迁移学习来识别通过网络基础设施针对 AV 连接的物理组件发起的网络攻击。首先，通过实现控制器局域网 (CAN) 并将其集成到 AV 仿真模型中来开发 AV-CPS。其次，从 AV-CPS 生成数据集。然后对收集到的数据集进行预处理，通过预先训练的 CNN 进行训练和测试。第三，实现了八个预训练网络，分别是 InceptionV3、ResNet-50、ShuffleNet、MobileNetV2、GoogLeNet、ResNet-18、SqueezeNet 和 AlexNet。对实现的模型的性能进行了评估。根据实验评估结果，GoogLeNet 优于所有其他预训练网络，F1 分数达到 99.47%。

介绍

自动驾驶汽车 (AV) 近年来发展迅速，一些智能汽车或无人驾驶汽车已可在公共道路上行驶 [ 1 ]。此外，随着人们开始认识到这项技术的无限优势，AV 已成为学术界和商界的热门话题 [ 2 ]。AV 可以执行车道偏离警告、交通标志识别和避免碰撞等复杂任务，同时还可以减轻人类驾驶员的工作量 [ 3 ]。此外，AV 的运行还能降低能耗和减少空气污染，对环境产生积极影响 [ 4 ]。AV 通常具有基于异构架构设计的复杂计算、传感和执行系统。然而，网络和通信技术存在许多固有困难，包括安全性、隐私、数据传输、实时数据分析和带宽限制 [ 5 ]。为了响应智能交通系统的技术进步，AV 可以通过各种通信协议传输数据。信息物理系统 (CPS) 是一种利用现代传感器、计算和网络技术将信息和物理组件无缝融合的系统 [ 6 ]。当与电子和物理设备集成时，AV 提供了 CPS 的完美拟合模型 [ 7 ]。多种车辆网络系统（如传感器、执行器和电子控制单元 (ECU)）可以连接 AV 组件。最流行的网络系统是控制器局域网 (CAN)、时间触发 CAN (TTCAN)、本地互连网络 (LIN) 和 FlexRay [ 8 ]。CAN 协议由博世的研究人员于 1985 年发明，用于取代汽车系统中的电线，因为电线数量开始增加导致可靠性下降 [ 9 ]。CAN 是一种标准通信协议，可用于车辆控制传感器数据 [ 10 ]。但是，CAN 只能处理少量的实时传感器数据 [ 10 ]。

此外，来自众多汽车核心控制系统（包括发动机、传动系统、车身系统和其他电气设备）的数据流都通过 CAN 总线收集，每一比特信息都会广播到 CAN 总线。每个节点都可以永久访问网络，这意味着有害的内部或外部信息可能攻击车辆中的任何 CAN 网络节点 [ 11 ]。不难理解，自动驾驶汽车必须配备更多的传感和通信设备才能独立运行。图 1显示了基本的 AV 组件。然而，随着自主程度的提高，安全隐患也会增加 [ 12 ]。攻击源通常是负面的内部组件或外部事件，旨在破坏 AV 预期的自主性 [ [11 ]。如 13 ]中所述，AV 的攻击面可以是安全气囊 ECU、USB、蓝牙、车辆访问系统 ECU 等。

图 1

自动驾驶汽车架构

全尺寸图像

在智慧城市的背景下，自动驾驶汽车是 CPS 原理的一个重要应用，它通过降低能耗和减少空气污染来帮助改善城市生活。在 AV-CPS 中集成信息技术 (IT) 和通信流程（包括云计算）对于提供 AV-CPS 中实时数据处理、存储和分析所需的可扩展基础设施至关重要，从而使这些系统能够在智慧城市中无缝运行。此外，自动驾驶汽车容易受到网络攻击，例如密钥卡克隆攻击、雷达攻击、远程信息处理服务攻击、传感器欺骗攻击、超声波传感器攻击、激光雷达传感器攻击、摄像头传感器攻击等，还有勒索软件和车辆盗窃等新风险 [ 14 ]。因此，本文提出了一种基于预训练卷积神经网络 (CNN) 的方法，该方法有助于检测通过 CAN 通信协议针对 AV 所连接的物理组件进行的网络攻击。借助迁移学习的强大功能，可以将预训练模型用于不同类型的系统。因此，迁移是深度学习中的一个重要概念，它源于数据不足和从头开始训练的情况。迁移学习将学习从预训练模型转化为新的相关模型。因此，它是一个使用来自不同领域的数据进行训练的学习器，因为有时使用传统的机器学习技术来训练数据既困难又昂贵，因为传统的机器学习技术假设训练数据属于同一领域[ 15 ]。

我们的贡献

以下是本文贡献的总结：

[我们使用 Simulink 16 ]中的 CAN 通信工具箱实现了 CAN 通信协议，并将其集成到 MathWorks 公司开发的自动驾驶汽车仿真模型中 [ 17 ]。这使得连接的物理设备（例如传感器、自适应巡航控制 (ACC) 系统和执行器）能够进行交互和协作，这被称为自动驾驶汽车信息物理系统 (AV-CPS)。
我们从 AV-CPS 生成数据集，并通过将信号转换为图像来对其进行预处理，然后将其输入到预先训练的 CNN 中。
我们利用八个预训练网络实现了智能入侵检测系统 (IIDS)，并对每个网络进行了性能分析。实验发现，GoogLeNet 的表现最佳，其 F1 得分参数达到了 99.47%。

论文结构

本文其余部分的结构如下：第2部分包含文献综述，讨论了自动驾驶汽车安全性方面的最新研究成果和研究空白。第3部分介绍了研究方法，包括自动驾驶汽车信息物理系统（AV-CPS）的实施，并讨论了数据集的收集和预处理过程。第4部分介绍了研究结果并进行了讨论。最后，第5部分给出了结论和评论。

相关研究

人工智能、通信和遥感技术的持续进步显著缩短了智慧城市及其应用和服务的开发周期。近年来，多项智能服务应运而生并实现产业化，以提高智慧城市的生活水平，涵盖通信、网络安全、智能电网、医疗保健和交通系统等多个领域 18，19，20 []。大部分努力都致力于开发智能出行和智能交通系统，例如自动驾驶汽车[ 21 ]。几年内，将有超过 2.5 亿辆汽车连接到路边单元[ 22 ] 。尽管自动驾驶汽车行业发展迅猛，但它们仍容易受到各种网络攻击，其影响范围从轻微的控制命令到威胁个人生命和福祉的严格控制。因此，已提出各种研究和系统来检查、识别和缓解针对自动驾驶汽车系统的网络攻击和威胁。大多数已进行的研究都是通过将不同的机器学习 (ML) 方法与网络安全实践相结合来构建安全和防御系统而开展的。

在 [ 23 ] 中，提出并开发了一种用于保护自动驾驶汽车外部通信的智能入侵检测机制。该检测机制基于混合智能入侵系统，该系统将多层感知器 (MLP) 与重叠比例得分 (POS) 技术 [ 24 ] 和模糊集相结合，以识别联网通信的自动驾驶汽车的行为。具体来说，他们的混合 IDS 利用反向传播神经网络来识别拒绝服务 (DoS) 攻击。他们的实验评估表明，他们提出的检测方法对自动驾驶汽车中的 DoS 攻击具有很高的检测率。然而，他们的模型具有很高的推理开销，因为计算处理要经过不同的子系统，例如预处理子系统、带有 POS 模块的特征勒索子系统、模糊化子系统 [ 25 ]（用于减少数据特征）、MLP 训练子系统，以及最后的检测子系统（将流量识别为正常或异常）。

在 [ 26 ] 中，作者提出并实现了一种自动驾驶汽车中虚假数据注入的检测方法。他们的系统由三个子系统组成。首先，虚假数据注入 (FDI) [ 27 ] 子系统，他们将模拟攻击注入自动驾驶汽车。其次，网络攻击数据集收集 (CDC) 子系统在两种操作模式（正常模式和攻击模式）下从模拟模型生成和收集数据集。第三，入侵检测机制 (IDM) 子系统采用长短期记忆 (LSTM) 深度网络 [ 28 ] 来检测网络攻击，即针对自动驾驶汽车控制系统的 FDI 攻击。他们的 IDS 系统将数据样本分为正常和异常。他们的调查评估证明了其模型的优越性，其高检测率优于其他最先进的模型。然而，他们提出的系统仅使用了模拟数据集，而没有实现自动驾驶汽车的控制通信系统。

在 [ 29 ] 中，作者描述了一种基于机器学习的入侵检测系统 (ML-IDS)，其主要目的是最大限度地降低由网络攻击引发的交通扰乱和碰撞风险。他们提出的 IDS 可以识别两种通常针对联网自动驾驶汽车的网络攻击：欺骗攻击和干扰攻击。该 IDS 机制采用四种不同的学习技术开发，包括随机森林 (RF)、k 最近邻 (k-NN)、单类支持向量机 (OCSVM) 和跨层方法的数据融合 (DF)。他们的实验评估表明，基于 DF 技术获得了最佳性能因子，使用已知和未知攻击的训练数据集获得了 90% 以上的准确率。然而，作者获得的检测准确率需要更高，因为它已经被其他几个智能模型克服，例如 [ 30 ]。在同样的背景下， [ 31,32 ]的作者提出了另一种 ML-IDS 来检测 CAN 总线网络中的恶意流量。他们提出的ML-IDS系统采用朴素贝叶斯算法和随机决策树来检测三种类型的网络攻击：模拟攻击、DoS攻击和模糊攻击。根据实验评估，作者得出结论，他们提出的ML-IDS具有可扩展性，能够适应各种针对自动驾驶汽车的新型攻击。然而，他们的模型使用了数据集中类别不平衡的情况，这可能会影响性能评估指标的结果。

在 [ 33 ] 中，另一个基于机器学习的自动驾驶汽车通信入侵检测系统 (ML-IDS) 建立在名为 ToN-IoT 数据集 [ 34 ] 的真实网络数据集上。为了减少特征数量，使用卡方 (Chi2) 方法进行特征选择 [ 35 ]。此外，为了避免高值特征超过低值特征，数据归一化会将数据集中的所有数值数据记录归一化。此外，由于 ToN-IoT 数据集不平衡，因此使用合成少数过采样技术 (SMOTE) [ 36 ] 进行类平衡。此外，该模型已配置为提供二分类（正常与异常）和多分类（正常、密码攻击、扫描、分布式拒绝服务 (DDoS)、数据注入、后门、跨站点脚本 (XSS)、拒绝服务 (DoS)、中间人 (MITM) 和勒索软件）。为此，贡献者们对八种监督机器学习技术的性能进行了描述：朴素贝叶斯 (NB)、决策树 (DT)、逻辑回归 (LR)、支持向量机 (SVM)、k 最近邻 (kNN)、随机森林 (RF)、AdaBoost 和 XGBoost 技术。根据模拟结果，XGBoost 方法的表现优于其他机器学习方法。然而，他们的最佳模型在稀疏和非结构化数据（例如异常值）上的表现可能更佳。

在 [ 37 ] 中，开发了一种基于云的自动化入侵检测框架，该框架可为自动驾驶汽车提供持续的服务可用性，并建议根据用户的服务质量 (QoS) 和体验质量 (QoE) 要求提供防御服务。所提出的技术是通过将自动驾驶汽车聚类到特定于服务的集群中而开发的，每个集群都有一个集群头与可信第三方 (TTP) 进行通信。这在请求者和提供者之间充当中介服务。此外，所提出的 IDS 包含三个模块，包括流量分析、减少和分类（识别好请求和坏请求）。具体而言，他们的检测模型采用深度信念网络 (DPN) 来减少流量，并采用决策树技术进行分类。他们的验证过程证明了他们的 IDS 的实用性，获得了高阳性率（约 99%）和低误检率（小于 1.6%）。

在 [ 38 ] 中，提出了一种经济高效、轻量级的入侵检测方案，用于识别自动驾驶汽车系统中的异常情况。该模型设计旨在降低针对车联网 (IoV) [ 39 ] 的网络攻击风险，这些攻击可能会导致车辆控制系统（如制动控制、转向控制、空调控制和锁定控制元件）出现致命错误。为此，他们提出了一个基于三层神经网络的模型，该模型带有一个 Softmax 分类器，可以对输入数据记录进行二分类检测，将数据记录分为正常或异常，或者进行多分类，将数据记录分为正常、侦察攻击、拒绝服务 (DoS) 攻击和模糊测试攻击。他们在最初由控制局域网 (CAN) 生成的模拟车载网络 (IVN) 数据集上评估了他们的 IDS 模型。他们报告了几种评估结果，包括检测准确率、召回率、准确率和 F-1 分数。基于比较分析，他们得出结论，他们提出的方案优于其他分类方案。然而，它们的浅层模型必须对通过对以前开发的攻击进行微小变异而开发出来的大规模攻击媒介提供准确的检测和分类 [ 40 ]。

在 [ 41 ] 中，作者专注于识别针对构成自动驾驶汽车系统并通过车载网络（控制器局域网 – CAN）连接的电子控制单元 (ECU) 的恶意网络攻击。为此，他们提出了一种基于混合异常的入侵检测系统 (HAIDS)，该系统使用基于规则和监督学习的方法。他们的模型旨在以最小的计算复杂度获得高识别率。他们的实验设置包括从四辆不同的模拟车辆收集的 CAN 流量。该模型的规则部分是使用三个主要规则开发的，包括有效车辆 ID、CAN 中消息通信的时间间隔和有效数据长度代码（以字节为单位指定消息的长度）。该模型的机器学习部分实现为一个三层神经网络。因此，他们得出结论，他们的混合 IDS 在检测 CAN 通信中的异常方面有效且高效。

[类似地， 42 ]提出了另一种基于异常的混合入侵检测系统 (HAIDS)，该系统采用基于规则的入侵检测系统 (IDS) 和机器学习入侵检测系统 (IDS) 。除了基于规则的模型外，该系统还表征了监督学习方法（例如决策树、随机森林和 XGboost）的性能。据报告，该系统可以检测恶意 CAN 流量，准确率超过 90%。然而，这些提出的系统无法检测到利用 CAN 消息周期性丢弃非周期性消息的攻击，这仍然是一个悬而未决的研究问题。

最近出现的另一个值得注意的研究方向是利用区块链技术检测针对物联网 (IoT) 的多种网络攻击和物理攻击 [ 43 ]，尤其是针对自动驾驶汽车的攻击 [ 44 , 45 ]。例如，[ 44 ] 中的研究人员专注于分析自动交通系统 (ATS) 中的隐私和信任问题。他们主要调查了针对自动驾驶汽车采用的几种通信技术的网络攻击，例如 WLAN (无线局域网)、WPAN (无线个人局域网)、WSN (无线传感器网络) 和 RFID (射频识别)。因此，他们提出了一种基于区块链技术的新型 IDS 系统 (PChain)。PChain IDS 保护物联网和 ATS / 车辆边缘计算（主要是自动驾驶汽车）。结果，模型评估显示，检测准确率随数据大小而变化，在 10,000 个数据大小和 40 个训练周期内达到 95.5% 的峰值。精确度和召回率也呈现出类似的趋势，分别为 94% 和 95%，在数据规模为 10,000 种、训练周期为 40 次时达到峰值。然而，这项研究的研究人员已经在 KDDCup99 数据集 [ 46 ] 上评估了他们的模型的性能，该数据集包含在当前时代可能已经过时的旧式常见网络攻击。在同样的背景下，[ 45 ] 中的作者提出了一种用于自主车辆网络的合作式 IDS 系统，以适应常见网络攻击日益增加的攻击面。所提出的 IDS 系统使用一种基于联邦的去中心化方法，通过将训练负载分配到分布式边缘设备中来降低主服务器的资源利用开销。为了保证积累机制的安全性，采用区块链来存储和共享训练负载。然而，区块链技术容易受到网络攻击，例如勒索软件攻击 [ 47 ]。

[此外， 61 ]中的作者研究了如何使用来自物联网 (IoT) 设备（如手机）的大量用户签到数据来预测和调整基于位置的社交网络中用户的兴趣和偏好。增强物联网智能 (IoT) 的一个重要组成部分是连续兴趣点 (POI) 的推荐，本文对其进行了研究。文章强调并研究了现有方法的局限性，包括基于循环神经网络的方法和基于图神经网络的方法。摘要提出了一种用于连续 POI 建议的交互增强和时间感知图卷积网络 (ITGCN)，以克服这些缺点。ITGCN 集成了一个自注意力聚合器，将高阶连接嵌入到节点表示中，并集成了一个增强型图卷积网络进行动态表示学习。该系统旨在帮助企业管理层预测用户偏好，以便进行更好的开发和规划。根据他们的实验结果，ITGCN 在建议准确性方面的表现优于现有方法。总而言之，下表（表 1）对相关文献中的要点进行了非常简短的总结。

表 1 相关著作要点的简要总结

全尺寸表格

在 [ 62 ] 中，作者探讨了日益增多的网联和自动驾驶汽车 (CAV) 如何使车联网 (IoV) 环境面临网络攻击。该研究提出了一种智能入侵检测系统 (IIDS)，该系统使用经过超参数调整的改进卷积神经网络 (CNN) 来解决这一问题。在 5G 车联网 (V2X) 环境中，IIDS 可有效识别和分类恶意自动驾驶汽车 (AV)，协助交通安全监控和防撞。实验结果表明，攻击检测准确率可达 98%。在同一背景下，[ 63 ] 的作者研究了由于电子设备集成到现代汽车中而导致的车载网络遭受网络攻击风险的增加，本摘要对此进行了介绍。控制器局域网 (CAN) 是汽车中常见的部件，由于缺乏关键的安全措施，很容易受到攻击。该研究提出了一种基于深度卷积神经网络 (DCNN) 的入侵检测系统 (IDS)，专为 CAN 总线设计。DCNN 无需人工特征设计，即可学习网络流量模式，从而简化架构并优化以实现卓越的检测性能。基于真实汽车数据集的实验结果表明，该 IDS 的性能优于传统的机器学习技术，误报率和错误率显著降低。

在另一项引人注目的研究中，[ 64 ]，研究人员强调了高效入侵检测系统 (IDS) 的必要性，并强调了汽车控制器局域网 (CAN) 总线由于缺乏安全措施而存在的漏洞。已知攻击特征有限的车载网络可能不太适合传统的基于互联网的入侵检测系统。建议的补救措施是建立一种称为 GIDS（基于 GAN 的入侵检测系统）的新型入侵检测系统 (IDS) 模型，该模型使用生成对抗网络（一种深度学习模型）。仅使用常规数据，GIDS 就可以学习和识别未知攻击。实验结果证明了 GIDS 对四种未知攻击的出色检测准确性，从而解决了保障车载网络安全的问题。在 [ 65 ] 中，作者讨论了循环神经网络 (RNN) 在开发高效车载网络入侵检测系统中的局限性，本文将对此进行讨论。这些限制源于 RNN 复杂的结构和高昂的处理成本。此外，研究还提到，卷积神经网络（CNN）难以捕捉时间连接，重要区域的特征表示不足。针对这些问题，该研究提出了一种名为TCAN-IDS（具有全局注意力机制的时间卷积网络）的新型模型。TCAN-IDS将数据字段和仲裁位的19位特征编码成消息矩阵，从而实现实时监控。通过聚焦重要区域，全局注意力机制增强了特征提取。实验结果表明，TCAN-IDS在已知存在的攻击数据集上表现出强大的检测性能。这意味着它可以用于实时监控，并在信息安全和防止未经授权的入侵之间保持微妙的平衡。

此外，在 [ 66 ] 中，作者强调了各种攻击技术带来的困难，同时强调了入侵检测对于车辆通信安全的重要性。作者批判了以前的方法的局限性，这些方法考虑局部特征或对多特征映射不佳。所提出的模型 STC-IDS（时空相关入侵检测系统）的编码-检测架构同时对空间和时间相互作用进行编码。基于注意力机制的卷积网络和注意力-长短期记忆网络为异常分类提供了强大的时空注意力特征。单帧和多帧架构各有各的优势。对现实世界车辆攻击数据集的实证研究表明，STC-IDS 优于基于贝叶斯优化的自动超参数选择的基线方法，在保持效率的同时降低了误报率。

虽然上述系统已经建立并专注于开发攻击感知系统 [ 48 ]，这些系统利用不同的计算智能方案，如模糊推理系统 (FIS)、神经网络系统 (NNS) 和机器学习系统 (MLS)，基于预定义的累积数据集，这些数据集使用最常规的属性组成，用于对付物联网、信息物理系统 (CPS) 和其他通信网络的常见网络攻击，然而，这些系统不支持识别针对自主车辆-信息物理系统的控制器局域网 (CAN) 通信系统的新型实时网络攻击。在本研究中，我们利用非传统的机器学习技术开发了一种高性能智能入侵检测系统 (IIDS)，从而提高了自主车辆控制的安全性。

具体来说，我们首先通过实现控制器局域网 (CAN) 通信协议来开发我们的自动驾驶汽车信息物理系统 (AV-CPS)，然后将其集成到自动驾驶汽车仿真模型中。这反过来又使其他连接的物理设备（例如传感器和执行器）能够成功通信和协作 (C&C)。其次，我们通过在正常和攻击模式下启动 AV-CPS 来生成和收集我们的新数据集。生成的数据集包含从 AV-CPS 的正常运行模式中积累的正常数据样本和攻击者注入的虚假数据样本，然后经过连续的预处理操作，最终将所有样本转换为深度神经网络可以处理的单元化图像。最后，我们使用预先训练的深度卷积网络 (DCNN) 的迁移学习过程实现了智能入侵检测系统 (IIDS)。具体来说，我们表征了八个深度卷积神经网络 (DCNN) 的性能，包括 InceptionV3 CNN、ResNet-50 CNN、ShuffleNet CNN、MobileNetV2 CNN、GoogLeNet CNN、ResNet-18 CNN、SqueezeNet CNN 和 AlexNet CNN。在与其他已实现的深度卷积神经网络 (DCNN) 和同一研究领域中的现有模型进行验证后，我们的仿真结果证明了基于 IIDS 的 GoogLeNet 模型具有出色的检测性能。

方法论

本节阐述了本研究中使用的自动驾驶汽车仿真方案。此外，它还展示了将信息物理系统 (CPS) 概念与所选自动驾驶汽车仿真结合使用的过程。具体方法是在自动驾驶汽车仿真中实现并集成通信网络节点，我们将新模型命名为自动驾驶汽车信息物理系统 (AV-CPS)。此外，本节还解释了从 AV-CPS 仿真模型生成数据集的过程。最后，它展示了迁移学习的应用过程。

AV模拟方案

仿真是一种基于软件的模型，可用于在模型进入生产阶段之前研究和评估其性能[ 49 ]。与实际模型相比，使用仿真模型有几个好处，例如成本效益较低，实施、测试和维护简单[ 50 ]。本研究中使用的仿真模型是一个自动驾驶汽车系统，由一辆前车和一辆自车（自动驾驶汽车）组成。在理想情况下，自车应使用自适应巡航控制（ACC）与前车保持距离。因此，自车应该跟踪前车的位置。本研究的重点是自车，它由三个基本部件组成：ACC、位置传感器和速度传感器，如图 2所示。位置传感器感应前车的位置和自车的位置。此外，速度传感器记录前车和自车的速度。传感器测量值被发送到ACC，以便在跟随前车时调整自车的速度。

图2

AV模拟方案

全尺寸图像

CAN通信网络

MathWorks AV 仿真不包含通信系统组件；因此，为了应用 CPS 概念，我们使用基于 Simulink 构建的车辆网络工具箱实现并集成了一个基于 CAN 协议的通信系统 [ 16 ]。车辆网络工具箱包含用于设计、分析、架构、仿真和验证通信系统的技术和工具。该工具箱包含几个组件：CAN 通信、CAN 灵活数据 (FD) 通信、J1939 通信和通用测量与校准协议 (XCP) 通信。本研究集中于使用 CAN 通信组件构建 AV-CPS 的通信系统。表2列出了所使用的 CAN 模块，图 3显示了 CAN 通信子系统的发送和接收消息。首先，使用 CAN 包将信号打包到 CAN 消息标准器；然后，使用 CAN 发送组件将 CAN 消息传输到指定的 CAN 设备。CAN 配置配置了特定 CAN 设备用于发送和接收 CAN 消息的参数。最后，从特定的CAN设备接收CAN消息，并使用CAN解包将CAN消息解包为信号。

表2 CAN通信组件

全尺寸表格

图3

可以发送和接收消息

全尺寸图像

自动驾驶汽车信息物理系统

本研究中实施的 AV-CPS 架构包括以下子系统：传感器、两个 CAN 通信节点、一个控制器和执行器。节点 A 和 B 在 AV 子系统之间接收和发送信号，如图 4所示。节点 A 和 B 集成在一起，用于模拟 AV-CPS 内 CAN 通信的活动。因此，节点 A 的功能是接收和发送以下信号：

自我车辆的实际位置（来自传感器）。
领头车辆的实际位置（来自传感器）。
自身车辆的实际速度（来自传感器）。
领头车辆的实际速度（来自传感器）。
时间差距（恒定值）。
所需速度（恒定值）。

图4

自动驾驶汽车信息物理系统（AV-CPS）

全尺寸图像

自车的实际位置以米为单位，速度以米/秒为单位。前车与自车之间的时间间隔为1.4秒。目标速度为30米/秒。信号传输至ACC后，ACC负责根据目标速度和前车位置生成控制信号，调整自车速度。最后，节点B接收ACC输出并将其发送至执行器。执行器将信号转换为机械运动，以加速或减速。我们展示了一个闭环仿真操作，这些步骤重复进行直至结束，整个过程持续81秒。

生成数据集

如图 5所示，假设威胁行为者破坏了节点 A。因此，威胁行为者通过节点 A 向自车的位置传感器插入了不准确的数据。因此，ACC 接收到了关于自车位置的错误数据，并因此产生了不完美的控制信号。图 4和图 5代表两种不同的场景。图 4显示了没有网络攻击时的正常状态，而图 5显示了存在网络攻击时的异常状态。我们在之前的研究中提供了更多关于网络攻击实施的信息 [ 26 ]。原始数据集是一维的，其大小为 80,000。数据集是平衡的；因此，40,000 为正常数据，其余为攻击数据。数据集包含四个特征：（1）实际位置，（2）自车的实际速度，（3）实际位置，以及（4）前车的实际速度。表3列出了原始数据集及其单位。

图5

网络攻击与自动驾驶汽车 CPS 模型

全尺寸图像

表3 一维数据集

全尺寸表格

为了准备预训练的神经网络输入，我们必须将一维数值数据转换为二维数据（图像）。图 6说明了将信号转换为图像的步骤。在步骤 1 中，运行 AV-CPS 模拟。步骤 2 将前面提到的特征响应记录为矩阵中的一维数值数据。然后，步骤 3 将存储的数据从一维矩阵重塑为二维矩阵。步骤 4 将二维矩阵保存为图像；每幅图像的大小为 4 × 81。由于我们有四个特征，因此图像的大小为 4 × 81，每次模拟运行 81 秒。最后，步骤 5 将生成的正常图像和异常图像存储在不同的文件夹中。

图6

转换成图像步骤

全尺寸图像

算法 1 说明了如何将一维数据转换为二维数据（图像）。首先，“im_counter”设置为 0，用于命名图像。“start_row”和“last_row”变量用作计数器，因为我们的目标是合并所有四个数据集行。随后，加载正常数据和攻击数据以供使用。“normal”目录包含包含正常数据的图像，并创建“attack”目录来保存攻击数据。while 循环从 1 开始，一直持续到数据源（正常或攻击）的长度。因此，将创建 2 万张图像：1 万张标记为正常，1 万张标记为攻击，每张图像都将以 jpg 格式创建。

算法 1 将一维数据转换为二维图像

图 7重点介绍了为本研究中使用的每个预训练神经网络模型准备图像的过程。首先，将图像导入 MATLAB。图像的原始尺寸为 4 × 81，但为了确保与每个模型兼容，每幅图像都会调整大小以匹配特定模型的输入尺寸。此调整操作由 MATLAB 使用 augmentedImageDatastore 函数执行。

图7

图像调整大小过程

全尺寸图像

图 8展示了所提出的 IIDS 的流程。从 CAN 协议接收数据后，数据将被发送到 IIDS 进行流量扫描。一维数据被转换为图像，并传输到预先训练好的 CNN 模型。CNN 负责检测是否存在攻击。

图8

IIDS 程序

全尺寸图像

迁移学习

迁移学习是深度学习中的一个重要概念，它源于数据不足和从头开始训练 [ 15 ]。本文利用预先训练的模型进行迁移学习，以增强 AV-CPS 的 IIDS 性能。迁移学习涉及使用从解决一个问题（在本例中是在大规模数据集上训练的预训练模型）中获得的知识来提高另一个相关问题的性能，即检测 AV-CPS 上的网络攻击，如图 9和图10所示，它们展示了本研究中使用的预训练模型的架构，这些模型名为 inceptionV3、resNet-50、shuffleNet、mobileNetV2、GoogLeNet、ResNet-18、squeezeNet 和 alexNet。Relu 层激活以忽略图像中的任何负值并将其替换为零。池化层用作过滤器以减小输入图像的大小。因此，Relu 层和池化层降低了计算成本。除了 squeezeNet（使用二维卷积层）外，所有预训练模型都使用了全连接层，这有助于正确地对图像进行分类 [ 51 ]。表4总结了按层数排序的各个模型 [ 52 ]。每个模型的最后一层都根据我们的目的进行了修改。例如，在 inceptionV3 中，我们替换了全连接层和分类层，使其仅产生两个输出（正常和异常）。

图9

CNN预训练模型

全尺寸图像

图10

SqueezeNet 层架构

全尺寸图像

表4 本研究中使用的预训练CNN模型汇总

全尺寸表格

本研究使用了八个预先训练的 CNN；因此，生成的数据集使用每个网络进行了训练、测试和验证。

结果与讨论

本节讨论实验装置，例如用于进行本研究实验的软件和硬件。此外，还分析了研究结果并进行了讨论。

实验

实验使用 MATLAB 和 Simulink 进行。MATLAB 是一种高级编程语言平台，Simulink 是基于 MATLAB 模型的设计平台 [ 53 ]。自动驾驶汽车仿真模型由 MathWorks 使用 MATLAB 和 Simulink 开发。然而，本研究使用 Simulink 网络工具箱实现了 CAN 组件协议，然后将其集成到自动驾驶汽车仿真中。我们使用 MATLAB 实现并测试了预先训练的 CNN。我们使用带有图形处理单元 (GPU) 的计算机系统进行了训练和测试，以减少计算时间并提高实验性能。表5总结了本研究中使用的软件和硬件。

表 5 实验所用组件的总结

全尺寸表格

图 11总结了我们在本研究中使用的实验的总体步骤。首先，将数据集导入 MATLAB 命名空间，并且如上所述，数据集存储在两个文件夹中：正常和异常。然后，对数据集进行预处理。因此，所有图像的大小都经过调整，以适合每个预训练网络的适当输入大小。每个预训练模型都预期两种类别结果：异常和正常。数据集被分成两部分：70% 的图像用于训练，30% 用于测试和验证。数据大小为 20,000 张图像；10,000 张为正常，10,000 张为异常。我们使用五重交叉验证技术来确保训练过程的有效性。最后，每个模型的预期输出要么是正常，要么是异常。正常表示没有攻击，异常表示存在攻击。

图11

实验总体步骤

全尺寸图像

结果与评估

本研究中使用的 8 个预训练模型的检测结果根据精度、召回率、f1 分数和准确率分类进行分析，如下所示 [ 26 ]：

磷rec我秒我哦n=T磷/(T磷+F磷)x100

（1）

Rec一个升升=T磷/(T磷+F北)x100

（2）

F秒c哦re=2∗(磷rec我秒我哦n×Rec一个升升)/((磷rec我秒我哦n+Rec一个升升))x100

（3）

一个cc你一个rcy=(T磷+T北)/(T磷+T北+F磷+F北)x100

（4）

TP 表示真正例，计算正确分类的正常图像的数量。FP 表示错误分类的正常图像的数量。FN 表示错误分类的异常图像的数量。最后，TN 表示正确分类的异常图像的数量。[ 54 ] 表6表示基于四个准确度分析指标的预训练模型的计算准确度。虽然所有预训练模型的性能结果大致相当，但 GoogLeNet 的性能优于其他预训练模型。精度参数具有相同的值，为 100.00%，因为每个预训练模型都可以将每个“正常图像”归类为正常。然而，由于多张“异常图像”被归类为正常，召回率参数的值在 98.94% 到 98.59% 之间。F1 分数取决于参数精度和召回率，如公式 3所示，分类准确度使用公式4计算。

表 6 准确度性能结果

全尺寸表格

为了验证我们的工作，我们将本研究的性能结果与目前用于自动驾驶汽车系统的入侵检测系统 (IDS) 方法进行了比较。总体而言，预训练的 CNN（例如研究 1、6 和 7）的得分优于其他方法（例如 ANN 和贝叶斯网络），如表 7所示。

表 7 近期现有 AV 系统使用方法的性能

全尺寸表格

结论和评论

综上所述，本研究提出了一种智能入侵检测系统 (IIDS)，用于通过控制器局域网 (CAN) 检测针对 AV 物理部件的网络攻击。首先，实现 CAN 并将其集成到 MathWorks 开发的 AV 仿真中，以应用 CPS 概念。因此，新系统被称为自动驾驶汽车信息物理系统 (AV-CPS)。其次，从 AV-CPS 生成数据集，并通过将信号转换为图像进行预处理，然后输入到预先训练的 CNN 中。第三，实现了八个预先训练的网络：InceptionV3、ResNet-50、ShuffleNet、MobileNetV2、GoogLeNet、ResNet-18、SqueezeNet 和 AlexNet，并讨论了每个网络的性能分析。我们的实验发现 GoogLeNet 表现最佳，因为它基于 F1 分数参数记录了 99.47%。本研究提出的弹性安全理念适用于任何 CPS 框架，因为系统 (AV-CPS) 的每个组件都是基于块架构构建的。因此，每个子系统（即控制器、传感器、执行器和通信节点）都是独立的，并且可能出现故障。对于功能性工作，我们建议将系统 (AV-CPS) 的架构应用于不同的 CPS 领域，例如智能电网和无人机。

限制

我们的工作主要侧重于开发基于迁移学习方法的IIDS，具体来说，它使用了预训练的神经网络。本研究开发的IIDS预计将与ACC合作，旨在检测来自可能被攻击者入侵的传感器的本地（自动驾驶汽车内部）网络流量。因此，IIDS旨在扫描由CAN模型传输并进入ACC模型的网络流量。IIDS执行的异常检测技术仅限于传感器读取的数据；然而，网络攻击可能通过各种其他组件实施，这是一个值得未来研究的课题。此外，研究人员可以考虑设计一个智能入侵防御系统（IIPS）来减轻网络攻击的影响。

文章版权归作者所有，未经允许请勿转载。如内容涉嫌侵权，请在本页底部进入<联系我们>进行举报投诉!

THE END