让物联网边缘自行管理

当今的物联网客户期望以边缘计算的成本和延迟目标,实现集中式云架构的冗余性、灵活性和可扩展性。如果远程解决方案需要较高的可靠性,那么它应该具有很高的应变能力。如果某个端点失去连接,它应能继续运行,直至重新建立连接;断电不应意味着数据丢失。

但是,物联网边缘节点会带来单点故障,因为连接丢失、电源不稳定或硬件故障可以在任何给定时间导致端点停机。与云数据中心不同,物联网边缘节点的分布式特性意味着如果发生故障,IT 人员可能无法在数天或几周内做出响应。

随着企业的期望值继续与边缘的现实情况相结合,物联网系统架构师正在通过超融合基础设施 (HCI) 找到一个中间地带。

云和边缘计算的最大优点

HCI 是一种物联网架构,可将类似数据中心的资源推向边缘(图 1)。通过让类似数据中心的计算、网络和存储资源更靠近边缘应用程序,或将这些资源直接移到边缘节点,HCI 可以在分布式端点中实现云的性能。

超融合基础设施填补了边缘节点和数据中心平台之间的技术空白。(来源:NodeWeaver)
图 1。超融合基础设施填补了边缘节点和数据中心平台之间的技术空白。(来源:NodeWeaver

HCI 硬件的示例包括基于英特尔® 酷睿 或英特尔凌动® 处理器的高性能边缘网关;移动边缘计算基站将在 5G 网络中占主导地位;采用英特尔® 至强® 处理器的 uCPE 服务器已经部署在本地物联网用例中。请阅读 SD-WAN 和 uCPE:简介,了解更多信息。

这些平台由于支持多核处理器、高容量存储和虚拟化技术,在远程物联网部署中越来越受欢迎。它们的优点:

  • 通过在虚拟机 (VM) 中托管冗余工作负载来防止硬件故障
  • 能够在边缘执行分析,因此即使云连接丢失,也能继续正常操作
  • 未来有机会用新的应用程序和服务更新边缘部署

当然,大多数 HCI 平台不支持开箱即用的 OT 要求。例如,远程物联网边缘部署通常需要:

  • 如果存在系统故障、增补或变动,能够自动重新配置或自我修复
  • 即使整个物理节点出现故障,也能继续操作
  • 裸机性能与本机硬件媲美,即使对于在虚拟机中运行的应用程序亦是如此

实现这些可靠性和性能功能需要智能软件。NodeWeaver 边缘集群执行平台是能将这些功能带到在边缘运行的 HCI 系统的解决方案之一。

让节点自行管理

NodeWeaver 是一个编排和管理解决方案,它将多个端点“编织”成一个大型的、虚拟化的边缘计算基础设施。这意味着工作负载可以部署在完全独立的物理节点上的虚拟机中,因此,如果一个端点出现故障,其应用程序可以继续在基础设施中的其他地方运行。

除在 x86 目标上裸机运行的操作系统外,每一个节点还集成了分布式文件系统、软件定义网络 (SDN) 和虚拟化组件(图 2)。整个堆栈只消耗 4 GB 的内存,因此适用于大多数 HCI 系统。

NodeWeaver 建立了一个冗余的、虚拟化的边缘计算基础设施,提高了可靠性。(来源:NodeWeaver)
图 2。NodeWeaver 建立了一个冗余的、虚拟化的边缘计算基础设施,提高了可靠性。(来源:NodeWeaver

虚拟网络用于将这些节点连接成集群,每个集群可由 2 到 25个节点组成。然后,分布式文件系统从一个节点复制应用程序数据(或“区块”),并将其传输到其他节点上的虚拟机中,在此过程中,文件系统会随机将区块分配给性能最佳且可用存储空间最大的节点。

为了确保区块始终可用,NodeWeaver 会运行一个进程来检查整个集群。如果该进程发现区块丢失或损坏,它会指示文件系统编排程序在集群的其他位置复制一个新的区块。因此,假设存储驱动器出现故障,NodeWeaver 可以通过在另一个正常运行的资源上实例化新区块来“修复”系统。无需用户干预。

通过这一进程,NodeWeaver 还可以发现已添加的新资源或管理员是否对现有资源做出了更改。

自动实时虚拟化

如前所述,NodeWeaver 可以跨物理和地理分布的节点创建完全虚拟化的环境。因此,需要注意的是,应用程序并不会将节点视为单独的资源。相反,它们把整个基础设施视为一个资源池。

但是,这并不意味着每个节点上都有无限的资源可用。

NodeWeaver 使用自主负载平衡程序,确保工作负载在此环境中得到有效执行。负载均衡程序采用了一种称为动态适应的功能,该功能会持续对集群中运行的各种工作负载进行基准测试。然后,根据服务质量 (QoS) 要求,将工作负载安排在最高效的可用硬件上。此硬件可以包括基于 x86 的 CPU、GPU、FPGA,甚至是英特尔® Movidius 加速器。

此外,底层 NodeWeaver 操作系统提供软实时保证,允许以近乎裸机的性能执行工作负载。同样,无需人工干预。

人工智能能否进一步实现边缘的自动化?

为了满足物联网客户对冗余性、灵活性和可扩展性的期望,物联网系统架构师必须在设计端点时考虑到云功能。这不仅可以消除单点故障,还能实现即使在没有本地 IT 支持的情况下也能无限运行的自主边缘环境。

但是,如果加入人工智能,这些自主边缘环境还能实现什么呢?平台可以监视硬件一段时间的性能,并预测驱动器或软件何时出现故障,使维护技术人员能够相应地优化其服务安排。像 NodeWeaver 这样的平台已经开始集成能实现这一点的概率引擎。

让边缘自行管理。

面向 5G 网络的零接触调配

5G 网络的一个物理变化是基站需要彼此更加靠近,两个基站之间往往只隔几百米远。这是因为与前代相比,5G 使用更短但功率更高的波长。

基站的增加以及网络节点的相应增多意味着潜在的安全漏洞数量和攻击面会显著增大(图 1)。

5G 网络呈现更大的攻击面。(资料来源:SDXCentral)
图 1. 5G 网络呈现更大的攻击面。(资料来源:SDXCentral

身份验证可以防范潜在的安全问题

在 5G 网络中,提高安全的一种方法是使用功能更强大的设备身份验证。这项技术并不是新技术,但是在 5G 网络中,它需要一些变化。

所有身份验证都涉及网络基础架构的三个部分:

  • 请求信息的设备
  • 传送请求的网络
  • 接收请求的端点

公钥交换等程序使用这些网络元素来验明通信的每个参与方的真身。5G 网络也一样,只不过网络元素是:

  • 请求信息的设备
  • 传送请求的网络
  • 接收请求的端点网络(或本地网络)

这里的区别在于,请求信息必须先向通过边缘网络身份验证,然后才能到达终点(图 2)。这种方法称为“主要身份验证”,可以降低风险,防范坏蛋分子窜到网络上作乱。例如,它可以防范侧信道攻击,保护数十台设备免遭毒手。

5G 网络需要主要身份验证。(资料来源:5G Americas)
图 2. 5G 网络需要主要身份验证。(资料来源:5G Americas

为实现这个目标,在来源网络和目的地网络之间运作的一项安全功能允许执行身份验证的网络拒绝任何身份验证请求。端点网络本身具有决定是通过传入请求的身份验证还是拒绝它的最终决定权。对于所有 5G 网络,身份验证是强制性的。

因此,在执行主要身份验证的过程中,通常会与端点网络上存储密钥的身份验证服务器共享加密密钥。随后,通过网络来回发送请求,以确保使用这些共享的密钥保持安全,就如标准 PKI 一样。

保护网络节点

当然,所有身份验证都基于信任网络上设备的身份的能力。这意味着必须保护每一个端点的安全;而保护每一个端点的安全是物联网和其它连接的设备 OEM 的责任。

保持这些设备身份的诚信需要硬件安全和完善的设备管理相结合。

例如,采用 Telit OneEdge。这个物联网设备管理平台即服务 (paas) 可以与公司支持 5G 的蜂窝模块结合使用。在制造时,会用唯一的 ID、设备凭据和 SIM 功能预先调配支持的模块,并将这些信息锁定在硬件的一个受信任区域中。

每个模块的相应凭据存储在一个安全的云环境中,从而使设备能够在加入网络时向 OneEdge 平台验证身份。此过程称为零接触调配,可确保设备身份在设备尝试注册时即可得到信任(图 3)。

零接触调配会在连接的设备加入网络时即刻验证它们的身份。(资料来源:Semantic Scholar)
图 3. 零接触调配会在连接的设备加入网络时即刻验证它们的身份。(资料来源:Semantic Scholar

连接后,OneEdge 用户可以从基于云的仪表板无缝地监控设备。此仪表板可支持自动化的操作、警报和报警,可用于识别和阻止可疑的网络活动(图 4)。此外,它还集成了设备管理和通过 Telit AppCenter 无线更新功能,使设备 OEM 可以快速封堵漏洞。

Telit OneEdge 包括一个监控仪表板,其具有自动警报和远程设备管理功能。(资料来源:Telit)
图 4. Telit OneEdge 包括一个监控仪表板,其具有自动警报和远程设备管理功能。(资料来源:Telit

Telit OneEdge 与许多运营商网络兼容,其中包括 Verizon、AT&T、Vodafone、T-Mobile 和 Telefonica。云连接器还提供与其它企业物联网平台的安全集成,例如 AWS、Google 云、Microsoft Azure、IBM Watson、SAP、MindSphere 和 Oracle 云。

5G 题外话

主要身份验证为 5G 网络提供了一个新的保护层。但是,主要身份验证不是万能神药。预防嗅探、中间人、拒绝服务 (DoS)、侧信道和其他网络攻击须在每一个网络端点中实施,从可信任的身份开始。

随着 NB-IoT 和 LTE Cat-M 等 5G 技术让越来越多的物联网设备联网,保护我们的网络需要移动网络运营商 (MNO)、网络设备提供商 (NEP) 和连接的设备的制造商协同工作。

主要身份验证、零接触调配和可信硬件为 5G 物联网网络提供了纵深防御安全战略。为了保护数据、设备和品牌声誉,每个人都必须发挥应有的作用。

系统集成商如何应对物联网的严峻挑战

整体往往比各部分相叠加的效果要好。但对于系统集成商 (Sl) 来说,找到这些部分不是件容易的事。

系统集成商所面临的解决方案需求不断增加,而且这些解决方案将 IT 领域的各个元素与新兴的物联网技术结合在了一起。例如,制造商想利用预测性维护来使设备保持最佳状态。农业学家想实现对植物健康状况的自动监控。房地产公司需要带面部识别功能的视频系统。

找到所有适用于这些复杂系统的技术可能会很困难,而找到集成所有技术的方法就更加困难了。这就是为什么有越来越多的系统集成商希望从分销商处获得更多帮助的原因。

作为回应,分销商逐渐扮演了新角色:聚合商。“聚合商将 IT 与物联网供应商联系在了一起,” Synnex Metrodata Indonesia (SMI) 公司总监 Lie Heng 称。

“常规 IT 分销商只会推广产品,但并不知道解决方案已远远不够用了。你们要具备集成不同类型的解决方案,与众多不同合作伙伴合作,以及为客户制定最佳解决方案的能力。” Heng 说。

建立合作伙伴关系

SMI 最近与英特尔® 建立了合作伙伴关系,成为印度尼西亚的物联网解决方案聚合商。从农业到制造业再到安全和医疗保健领域,该公司使用企业孵化器框架与 B2B 初创公司展开合作。

SMI 吸引了拥有独立解决方案的独立软件供应商和解决方案提供商,尤其是在计算机视觉、云分析、人工智能和深度学习等新兴领域。供应商和解决方案提供商专注于创新,而 SMI 专注于扩展和分发其解决方案(图 1)。

聚合商结合了许多不同来源的技术
图 1。聚合商结合了许多不同来源的技术。

“通过与英特尔合作,我们可以验证这些流程是否是市场就绪解决方案,” Heng 说。“我们不但乐于,而且希望将更多市场就绪解决方案引入印度尼西亚。”

计算机视觉技术推动了创新性解决方案的产生

新想法往往来自个人。为了鼓励并支持推出更多解决方案,SMI 每年利用支持计算机视觉的英特尔® OpenVINO 工具包在印度尼西亚举办四场黑客马拉松。Heng 说,大约有 450 位开发人员参与了 SMI 的黑客马拉松赛事,他们不但创造了新产品,而且在这些公司之间建立了新的伙伴关系。

黑客马拉松中产生的想法和解决方案令人印象深刻。

例如,印度尼西亚是世界上最大的金枪鱼捕捞国,但偷猎却使该国的金枪鱼资源面临枯竭。印度尼西亚每年因非法捕鱼损失约 40 亿美元。在最近一次 OpenVINO 黑客马拉松上,开发人员创造了一种可以识别非法渔船并向当局发送警报和位置信息的无人机。

“印度尼西亚领土的 70% 都是水,” Heng 说。“以物理检查方式保护这些区域需要很长时间,而使用可以识别标记和确定偷猎者的无人机非常有创意,有助于我们解决非法捕鱼问题。”

印度尼西亚正在努力解决的另一个问题是其日益严重的垃圾问题。该国是仅次于中国的世界第二大海洋塑料排放国。政府采取的举措之一是提高废物回收率和收集率。一位黑客马拉松的开发人员解决了此问题。

“另一个非常有趣的解决方案是使用垃圾分类箱,” Heng 说。“利用计算机视觉可以检测出废物是有机的、塑料的还是纸质的。进行检测后,废物会被分拣到相应的废物回收箱中。”

长远观点

随着分销商和系统集成商的角色演变,Heng 希望性能基准测试和案例研究会推动业务发展,并帮助他们创建更广泛的解决方案。

“我们已经实现了从销售产品到提供实施服务,再到成为提供众多解决方案的供应商的转变。”他说道。“制定营销框架有点困难。最终目标是使封装解决方案在将来能够转售出去。”

但是,发现创意解决方案只是 SMI 相信黑卡马拉松的原因之一:“我们的战略定位会更长远一些,” Heng 称道。“我们正尝试在印度尼西亚市场推广人工智能技术。而且,我们正在尝试打造一个开发人员社区。

“我们的宏伟愿景是为印度尼西亚创造印度尼西亚市场乃至世界所需的解决方案。如果开发人员想出的某些解决方案确实很好,并且可以通过英特尔流程验证,那么就可以在该地区以外的市场销售,从而促进解决方案以及我们国家的发展。” Heng 说道。

系统集成商如何找到新的机会

编辑注:insight.tech 支持终止种族主义、不平等和社会不公正的行为。我们不容忍赞助商的产品被用于侵犯人权,包括但不限于政府滥用可视化技术。insight.tech 展示产品、技术和解决方案,并遵循以下前提:负责任和合乎道德地使用人工智能和计算机视觉工具、技术和方法。

 

选择一个满足特定需求而又没有不必要且昂贵功能的工业物联网解决方案并非易事。即使在单个领域内(例如,智能制造),对于一个最终客户来说,理想的解决方案也可能与另一个领域不同。

理所当然,智能零售、智能城市、智能制造等领域之间存在着差异,需要对工业物联网硬件、软件和功能采取不同的方法。更高的特异性水平增加了系统集成商 (SI) 面临的挑战。

聚合商可以帮助系统集成商选出适合最终客户需求的解决方案。在某些情况下,这可能意味着从多种解决方案中挑选要素,并形成适合最终客户需求和预算的定制解决方案。

世平集团亚太区物联网解决方案部副总裁 Dennis Niu 解释了他们如何利用对英特尔市场就绪解决方案和英特尔 RFP 就绪套件的深入了解来帮助系统集成商识别他们的选择,包括那些尚不明确的选择。

Niu 副总裁说:“我们帮助他们了解他们可以解构各种解决方案。他们可以与供应商(无论是 ODM、OEM 还是 ISV)合作,并采用模块化方法。”

对英特尔市场就绪解决方案社区的会员进行教育可提高社区的价值(图 1)。

世平集团帮助解决方案集成商和英特尔市场就绪解决方案公司更好地为最终客户提供服务
图 1. 世平集团帮助解决方案集成商和英特尔® 市场就绪解决方案公司更好地为最终客户提供服务,同时改善自身的业务。

只需工业物联网,不求更多

杰和 (Giada) 全称深圳市杰和科技发展有限公司,是世平集团的一家客户,也是一家英特尔市场就绪解决方案公司。该公司启用了一套人工智能 (AI) 解决方案,在其 Giada Digital Signage Management System(杰和数字标牌管理系统)中添加了人脸识别功能。

Niu 副总裁说:“我们考虑了多种可能性,并建议杰和科技与大猩猩科技合作。大猩猩科技也是一家英特尔市场就绪解决方案公司。可以考虑使用后者 Intelligent Video Analytics Recorder (IVAR) 解决方案的某些组件。”

IVAR 提供了许多功能,包括面部检测和识别、车辆检测和识别、行为分析以及商业智能。但世平集团建议的解决方案,即便经过修改,也只是包含能够识别性别和年龄的面部识别。

Niu 副总裁说:“杰和科技没有汽车检测或行为分析方面的需求。而且,客户公司通常会认为无法针对其需求量身定制现成的解决方案。但在与杰和科技和大行星科技合作的过程中,我们通过适用的解决方案帮助两家公司受益。”

作为其努力的一部分,世平集团确保大猩猩科技获得了杰和科技的 IPC 媒体播放器,而杰和科技则获得了大猩猩科技的软件。Niu 副总裁说:“这使两家公司能够彻底测试彼此的系统,而不是简单地给对方提供规格和功能要求,指望各自解决。”

在此示例中,与世平集团的许多其他活动一样,英特尔 OpenVINO 工具包发挥了很大作用。世平集团还与 OEM 和 ODM 合作,帮助他们更好地了解该工具包以及如何借力改进其解决方案。

随着越来越多的开放平台加入工业物联网应用,世平集团还帮助系统集成商将人工智能和软件即服务 (SaaS) 引入边缘进行分析和实时响应。Niu 副总裁说:“通过将功能分离并按需使用,我们可以扩大系统集成商客户群体的规模。我们正在帮助系统集成商探索更多选择,以便定制适合最终客户需求的解决方案。”

请参考《为什么系统集成商需要发展》,了解有关本主题的更多信息。下载。

系统集成商的重大改变

“要么适应,要么毁灭。”对于系统集成商 (SI) 而言,这远不止是一句名言那么简单。这是其业务的基本原则。

随着 SI 仅负责组装零件的日子一去不复返。当今的客户开始需要人工智能和机器视觉等需要高度专业技能的高级功能。

随着物联网将技术更深入应用于现场运营中,现在 SI 将需要了解其客户业务的详细信息。因此,与行业无关的方法根本无法解决任何问题。

简而言之,SI 的角色正在迅速演变。并且,客户也正在寻求可以成为合作伙伴而不仅仅是供应商的 SI。并希望 SI 能够帮助他们解决复杂的、特定应用程序的挑战。

WPI Group 亚太地区物联网解决方案部门的副总裁 Dennis Niu 说,“SI 需要有能够节省成本或增加收入的产品才能涉足零售业、制造业或智能城市”。为此,SI 提供的解决方案必须满足以下要求:

  • 高度集成,将客户的技术负担降到最小
  • 灵活开放,以便与现有基础设施配合使用

为了理解这些要求为何如此关键,让我们以海运业为例来加以说明。

案例研究:物流

航运物流业在过去五十年里几乎没有进步。但物联网的出现改变了一切。

现代集装箱船包含了一长列高科技系统。传感器密切监视着船只的推进系统,以确保其高效运行并预测着维修需求。高价值的货物包括的集装箱可以追踪温度和其他因素且还具有云连接。船载网络提供的先进功能可与在岸基础设施相匹敌。

且这还只是在船上实现的功能。当船舶靠近目的地时,此船舶会将其到达、货物和货物去向等通知港口。进港后,船舶可以与智能起重机通信,实现自动卸货。

此外,还可以就船上装有任何危险物品向港口主管发出警报。此预警则可以提高安全程度并缩短停工期。而港口则可以提前准备好应对此船舶,而不必将其放入隔离区,让其等待合格的团队进行检查之后再驶入合适的泊位。

从船员的娱乐设施到智能起重机,打造这些系统中的任何一项都属于重大任务。全球各地港口和船舶的协同工作只会让一切愈加复杂。

这些挑战的范围和规模解释了 SI 为何变得愈发专业。以及客户为何要求 SI 提供更多帮助。

分销商角色的变化

就像 SI 的角色正在变化一样,分销商的角色也在变化。对于分销商来说,仅仅提供零件目录已经远远不够。相反,他们正在承担 SI 先前完成的工作。

事实上,SI 的某些旧角色由分销商一路传承下来,并最终由技术合作伙伴所扮演。例如,技术合作伙伴现在为特定的应用程序提供英特尔® 市场就绪解决方案(英特尔® MRS)和英特尔® RFP 就绪套件(英特尔® RRK)等一系列预集成解决方案。

随着角色的这种转变,分销商可以将自己转变为整合者。在新角色中,整合者可以结合使用预集成解决方案和定制系统,为 SI 提供恰到好处的解决方案。

WPI 的 Niu 就其公司如何处理英特尔 MRS 和英特尔 RRK 解决方案进行了解释。

Niu 说,“此类旨在完成特定使用案例的特定任务的方案结合使用了硬件和软件,在许多情况下都能做的很好”。“但是整合者从多个供应商的解决方案中也看出了分离要素或解构要素的趋势”。(图 1

WPI 这样的整合者与 SI 携手合作打造了恰到好处的解决方案
图 1。WPI 这样的整合者与 SI 携手合作为特定使用案例打造了恰到好处的解决方案。

整合者可以在解构初始解决方案之后添加人工智能之类的功能。还可以优化组合解决方案,例如删除因合并解决方案而产生的任何冗余硬件。

该结果对于 SI 来说是一个恰到好处的起点,因为它提供了必要的技术,却无需额外的花销,也不会产生不需要的功能。

不断发展的人工智能和物联网市场

除了打造优化的解决方案、处理 SI 过去所做的更多非差异化工作之外,整合者还能以其他方式支持 SI。例如,WPI 针对英特尔® OpenVINO 工具包提供的培训可帮助 SI 跟上机器视觉的进展。

Niu 说,“如今的英特尔® 不再仅仅是一家 CPU 公司”。“而更像是一家数据公司。它参与了智能制造、智能零售和智能城市之类的各个行业,并累计了大量专业知识。我们帮助 SI 分享这些知识,以便他们可以更好地服务于最终客户”。

并且甚至还可以在意想不到的领域延伸这种知识分享。例如,随着 SI 的专业知识不断提升并吸引了特定领域的关注,它们在另一个领域可能需要获得支持。此外,许多 SI 要么集中精力处理 IT 问题,要么处理 OT 问题。

Niu 说,“大型 SI 可能拥有开发多种领域实践的资源,可为智慧城市、零售业或制造业提供解决方案。但是他们可能仍然需要与合作伙伴携手处理其专业知识之外的 IT 或 OT 问题”。

整合者可以联系两个互补的 SI 以合作处理特定项目。Niu 说,“这种兼容性会为 SI 带来更多工作,并使项目取得更大的成功”。


如需了解有关此主题的更多信息,请参阅“SI 为何需要改进”。下载。

软件定义的 WAN 为 5G 世界重塑边缘网络

5G 网络将为消费者用例提供增强型移动宽带 (eMBB) 连接,为工业部署提供超可靠的低延迟通信 (URLLC),为物联网提供大规模机对机通信 (mMTC)。

属于这把大伞范围内的应用程序似乎涵盖了一切:增强和虚拟现实、实时翻译服务、自动驾驶车辆网络、无处不在的环境感知(图 1)。

5G 用例
图 1. 5G 将支持企业、消费者和各行业领域的各种不同应用和用例。(资料来源:Ericsson)

边缘网络必须能够以最低的延迟和最高的吞吐量支持所有这些流量类型。在许多情况下,那些希望支持通过 5G 技术实现的新应用程序和服务的企业,还需要使用移动边缘计算 (MEC) 功能来改造其基础设施。

5G 对企业的影响

例如 Citrix 这样的公司展示了 5G 给现代企业带来的机遇和挑战。

一方面,该公司提供数字工作区解决方案,使其客户能够通过虚拟在线应用程序和桌面环境协同工作。另一方面,它为医疗、制造和金融服务等市场的客户提供智能交通管理、负载平衡和防火墙等网络基础设施服务(图 2)。

为 5G 做好准备
图 2。像 Citrix 这样的企业软件公司必须为 5G 做好准备。(资料来源:Citrix Systems, Inc.

随着 5G 网络的上线,用户不仅会对工作区解决方案中的延迟容忍度降低,而且还会期望在其在线协作环境中融合更多的高带宽功能。此外,网络服务产品必须不断发展,以支持众多受 5G 影响的行业、客户及其应用程序的可靠性和服务质量 (QoS) 要求。

提供这样的性能意味着在边缘需要更加智能。但是,要继续以可持续、可扩展的方式提供软件解决方案和服务,就不能为每个用例和部署场景利用专用的硬件设备,否则,这样的成本和复杂性是像 Citrix 这样的公司无法承担的。

相反,这类企业希望通过软件定义的基础设施(如 SD-WAN)来支持 5G 要求。(有关详细信息,请阅读 “SD-WAN 和 uCPE:简介”。)

SD-WAN 和 uPCE 提高了可扩展性

就像数据中心的软件定义网络 (SDN) 一样,软件定义广域网依赖于基于软件的控制器,而不是专门的硬件来传送网络上的流量。因此,工程师可以使用通用硬件和软件为不同的 5G 流量设置服务级别协议 (SLA)。

对于 5G 部署来说,同样重要的是 SD-WAN 可以利用标准硬件基础设施。这些通用平台称为通用客户终端设备 (uCPE),可根据需要提供多核网络处理器、充足的存储和内存、足够的网络端口以及硬件加速的安全机制。

但 uCPE 的秘密是使用英特尔® VT 等虚拟化技术,使得系统上的每个内核都能作为单独的网络设备发挥作用。例如,四核系统可以将两个内核分配给网络编排和管理,第三个分配给防火墙或负载平衡,然后将第四个留给客户应用程序。

其结果是一个高度集成的系统,只受可用内核数量的限制,从而降低了测试、管理和维护多个硬件设备的总拥有成本 (TCO)。

除了节省成本之外,对于 Citrix 这样的公司尤其重要的是,基础设施与已经部署在数据中心环境中的没有多大不同。

uCPE 系统是为在客户设施或小型分支机构本地使用而设计的,因此它本质上是智能向边缘的架构转移(图 3)。这意味着与此相关的 5G 网络、应用程序和服务可以获得更高的性能,从而确保最高的吞吐量和最低的延迟。

通过 5G 网络连接的 SD-WAN 架构
图 3。SD-WAN 架构允许企业通过5G 网络连接将云智能转移到小型办事处或分支机构。(来源:NETSCOUT

对于软件供应商,在 5G 这个从边缘到云的连续统一体中,一致的硬件基础设施也意味着有极大的可扩展性。

通往 5G 和移动边缘计算

虽然各组织开始围绕边缘网络的 uCPE 硬件进行标准化,但在性能、安全性和 I/O 方面仍然需要可扩展性。为了满足这些要求,英特尔®CASwell, Inc. 等合作伙伴提供了一系列 uCPE 设备解决方案。

例如,要求苛刻的企业部署可以利用基于英特尔® 至强® D2100 处理器的 CASwell CAR-3080 网络设备,该设备具有多达 16 个内核、40 千兆以太网支持和多达 40 个通过网络模块的以太网端口(图 4)。作为首批经过验证的英特尔® uCPE 精选解决方案之一,CAR-3080 的预认证结果是,可以为利用多个高吞吐量应用程序或服务的设施提供提供 100% 线速数据包处理性能和 100 Gbps 加密。

适用于 uCPE 的 CAR-3080
图 4. CAR-3080 是首批经过验证的英特尔® uCPE 精选解决方案之一。(来源:CASwell, Inc.)

只需进行极少的软件集成测试,利用英特尔 uCPE 精选解决方案(如 CAR-3080)的网络运营商和服务提供商就可以采用该技术。他们还得到保证,在扩展基础设施以满足未来的网络需求时,将有兼容的方案备选。

另一方面,基于多核英特尔凌动® C3000 服务器 SoC 的 uCPE 解决方案可提供适当的价格、功耗和无风扇性能组合,以满足小型办事处的大多数入门级需求。CASwell CAD-0263 就是这样一个白盒设备,它提供 4 到 16 个内核、英特尔® QuickAssist 技术 (Intel® QAT)、多个以太网端口以及对 LTE 和 Wi-Fi 模块的支持(图 5)。

CAD-0263 支持无风扇操作
图 5. 基于英特尔凌动® C3000 的 CAD-0263 支持无风扇操作。(来源:CASwell, Inc.)

面向当今企业的 5G 基础设施支持

虽然 5G 规范的首批 eMBB 元素刚刚得到 3GPP 的批准,但是它们在现有企业应用程序中的优势已经很明显。例如,1 Gbps 数据传输速率和对更高连接密度的支持等功能对视频会议、虚拟化环境等用例具有明显的影响。

但是,eMBB 的功能肯定会带来新的应用程序和服务,更不用说该标准后续将要带来的突破性发展和机对机通信了。越临近这些趋势得到认可,部署这类基础设施的竞争就越激烈。

现在,SD-WAN 和 uCPE 为实现这样的基础设施提供了一种方式,并能为软件供应商提供灵活性,为服务提供商提供经济性。等待有什么用?

新时代的网络需要在边缘位置部署 SD-WAN

根据思科的虚拟网络指数 (VNI),到 2022 年,全球 IP 流量将同比增长 26%,达到每月 396 EB(图 1)。智能手机、物联网设备以及其他传统上没有连接到互联网的平台推动了这种增长。

所有这些都需要带宽和专门的网络服务。这给现有的边缘网络基础设施和依赖它的企业带来了压力,特别是在我们向 5G 发展的时候。

例如,企业或互联网服务提供商可以使用深度数据包检查 (DPI) 来分析公共数据流量,以便检测病毒或简化通过其基础设施的网络流量。他们还可以使用虚拟专用网络 (VPN) 来支持具有不同服务质量 (QoS) 和安全要求的实时物联网流量。他们可能还会利用防火墙、会话边界控制器等。

根据思科视觉网络指数的全球 IP 流量
图 1. 思科 VNI 预计,到 2022年,全球 IP 流量将增长 26%

传统上,这些服务都需要专门的硬件设备来提供支持。这不仅维护成本高,管理难度大,而且不会随着数据流量的增长以及边缘网络现在必须支持的应用程序和服务类型的增长而扩展。

与其采用以硬件为中心的方法来实现边缘网络服务,还不如通过在通用硬件上运行的软件来提供这些功能。这样既最大限度地降低了特定于功能的设备的管理成本和复杂性,也能让网络架构面向未来,以满足将来更多、更多样化的流量需求。

网络设备提供商现在通过 SD-WAN 通用客户终端设备 (uCPE) 来支持此类软件定义的基础设施。请阅读 “SD-WAN 和 uCPE: 简介”。

面向未来的边缘网络

适用于 SD-WAN 的 uCPE 基于网络功能虚拟化 (NFV) 技术,该技术允许在多核网络处理器上将网络服务作为虚拟网络功能 (VNF) 进行交付。

因此,可以在提供商网络的边缘或企业设施的内部部署一个 uCPE 网络平台,以交付动态流量编排和管理、安全性、会话控制以及其他服务。

这样就能实现软件定义分支这样的用例,而在这些用例中,服务的数量和性能只会受到处理器内核可用性的限制(图 2)。

适用于 SD-WAN 的 uCPE
图 2. 通过适用于 SD-WAN 的 uCPE,可以将一系列服务以较低的成本部署到各个位置。(来源:IDC

由于此基础设施完全由软件定义,因此运营商可以在一个完全统一的硬件架构上,为不同的企业客户端提供不同的远程托管服务。

可以将服务部署和托管在靠近数据源的 uCPE 平台上,而不必将网络功能和关键企业应用程序托管在遥远的数据中心。这有助于降低网络传输成本,并提高实时 5G 应用程序的确定性。

加快新边缘网络的平台部署

通用网络硬件已经在数据中心中部署了一段时间,并不是什么新鲜事物。但是,许多网络运营商和服务提供商在测试这些平台的吞吐量和性能时遇到了困难。这可能非常耗时且成本很高,并会延迟 SD-WAN 基础设施的部署。

为了确保性能并减少与 uCPE 平台相关的测试,英特尔®Advantech 等合作伙伴合作开发了英特尔® uCPE 精选解决方案 (Intel® ISS for uCPE)。

这些平台提供基本或 Plus 配置,包括 4 至 16 核英特尔® 至强® 处理器,至少 16 GB 内存,至少 256 GB 存储以及 4 个 10 GbE 端口(图 3)。Plus 配置还支持英特尔® Quick Assist 技术 (Intel® QAT),以便从主处理器内核卸载加密过程。

英特尔 uCPE 精选解决方案
图 3. 英特尔® uCPE 精选解决方案为 SD-WAN 网络部署提供了一个参考平台,下面所示为 Plus 配置。(来源:Advantech)

可扩展的 ISS for uCPE 参考平台提供了一组为 SD-WAN 部署量身定制的基准技术。

在这些平台中,Advantech 这样的公司可以在白盒解决方案中提供额外的性能,比如 FWA-3050 系列的网络设备。但要成为 ISS for uCPE 平台的品牌,系统必须通过针对最低性能要求的基准测试(图 4)。其中包括 100% 线速数据包处理性能和高达 100 Gbps 的加密。

英特尔 uCPE 精选解决方案品牌产品的最低性能要求
图 4. 所有英特尔® uCPE 精选解决方案品牌的产品必须满足最低性能要求,无论制造商是谁。(来源:英特尔®

在软件方面,所有 ISS for uCPE 解决方案都利用了一个以开源为中心的堆栈,该堆栈由英特尔® 数据平面开发套件英特尔 (Intel® DPDK)、Ubuntu Linux 和 KVM/QEMU 虚拟机管理程序组成。

用户可以确信,他们不会被专有解决方案套牢,并且可以最大限度地降低与重新测试专用软件修补程序或堆栈新增内容相关的成本。他们还可以放心,任何 ISS for uCPE 产品都能为防火墙、加密、边界控制等服务提供标准性能。

例如,Advantech 通过 BIOS 优化使其 FWA-3050 ISS for uCPE 网络设备差异化,从而让软件堆栈能够在其硬件上更高效地运行(图 5)。该公司还集成了智能平台管理接口 (IPMI) 控制器,以简化远程系统管理、维护和升级。

Advantech 的 FWA-3050 网络设备
图 5. Advantech 的 FWA-3050 网络设备是经过验证的英特尔® uCPE 精选解决方案。  (来源:Advantech)

除了这些功能外,该公司还通过能效、附加 I/O 和对广泛软件合作伙伴生态系统的支持来使其 FWA-3050 产品差异化;这些软件合作伙伴的解决方案也针对 Advantech 硬件设备进行了调整。

面向 5G 进行具成本效益的扩展

随着企业开始利用 5G 网络提供的新服务,边缘基础设施将需要更新换代。这些高带宽、低延迟的应用程序需要边缘位置有更多的网络智能以及高度的灵活性,以便基础设施能够实时适应动态网络需求。

如果使用当前的网络架构,这是做不到的。管理和维护专用硬件设备不仅在成本方面令人望而却步,还需要专业的网络工程师和 IT 人员在设备出现故障时亲自做出响应。

另一方面,通过以软件为中心的方法,网络运营商和企业应用程序提供商可以远程诊断和响应故障,并最大限度地减少停机时间。

得益于通用 uCPE 和 SD-WAN 提供的灵活性,服务提供商还可以快速适应网络领域的新趋势。借助 ISS for uCPE,他们可以自信地部署此基础设施,因为他们知道自己的架构将提供所期望的性能。

SD-WAN 如何推动统一商务

要想在当今瞬息万变的零售环境中取得成功,商家必须满足客户的各种需求。这意味着他们要通过社交媒体、移动商务、短信、电子邮件和其他渠道(包括传统的实体购物)与消费者互动。

这也意味着零售商需要可靠的网络基础设施来支持店面、网站、应用程序、呼叫中心、生产设施和其他支持服务。如图 1 所示,在统一的商业环境中,这些不同的分支必须能够快速可靠地通信,才能确保运营有序进行。

图 1. 零售商必须为许多不同的物理和虚拟店面提供边缘网络支持。(资料来源:Perficient, Inc.

这些部门依赖于不同类型的连接。例如:

  • 办公室需要固定宽带
  • 工业设施需要 IP 封装现场总线协议
  • 某些零售 POS 系统或紧密连接的购物体验需要蓝牙、Wi-Fi 和联网

除了不同的网络拓扑、连接类型和服务质量 (QoS) 需求之外,这些渠道和服务部门还需要一系列网络服务。这些服务包括防火墙、深度包检测 (DPI)、广域网 (WAN) 优化、路由和许多其他功能。在传统的网络架构中,此类服务需要专门的专业硬件设备,这不但导致了沉重的成本负担,而且使网络变得更加复杂。

管理这些网络和服务是一项艰苦的工作,特别是在大型或快速增长的零售组织中,这会削弱公司销售商品这一核心使命。

软件定义的广域网 (SD-WAN) 可以减轻在内部管理这些复杂网络的负担,并降低网络服务的成本。当与通用客户驻地设备 (uCPE) 配套使用时,SD-WAN 还可以提高网络的灵活性和可靠性,保持客户通信线路畅通。

SD-WAN 确保紧密连接的购物体验

以前的文章讨论了 SD-WAN 提供的恢复能力。该技术使用基于软件的流量编排和管理控制器,使用通用 uCPE 硬件通过网络路由多种形式的有线和无线连接。

SD-WAN 支持的通信技术包括 MPLS、宽带、电缆、Wi-Fi 和 LTE 链路(图 2)。因此,语音和数据流量始终可以根据应用程序的 QoS 需求通过最合适、带宽最高的路径发送。

图 2. SD-WAN 技术支持在通用客户驻地设备 (uCPE) 上建立多种有线和无线网络连接。(资料来源:Cell Code

支持 SD-WAN 的硬件架构利用数据中心的软件定义网络 (SDN) 和网络功能虚拟化 (NFV)。在这里,uCPE 提供一个强大而灵活的通用网络平台,支持各种网络服务作为虚拟网络功能 (VNF)。因此,uCPE 代替了前面提到的昂贵、复杂的硬件设备(图 3)。

图 3. 通过支持这些服务作为虚拟网络功能 (VNF),通用客户驻地设备 (uCPE) 普遍代替了昂贵的网络设备。(资料来源:Techplayon

对于支持它们的商家和网络服务提供商而言,SD-WAN 可以满足专业要求,并且降低成本和复杂性,是各种网络的最佳解决方案。

因此,网络设备供应商 (NEP) 纷纷向市场推出可扩展的 uCPE 解决方案,帮助公司在整个零售业务中部署 SD-WAN。

通用平台促进零售创新

例如,英特尔®Lanner 公司等合作伙伴合作,推出面向 uCPE 的英特尔® Select 解决方案 (ISS),以加速 SD-WAN 的大规模部署(如呼叫中心、生产设施和零售中心)。面向 uCPE 的 ISS 平台基于多核英特尔® 至强® D 处理器,采用各种互补的网络技术,支持灵活扩展。

图 4 概述了面向 uCPE 的 ISS 解决方案的最低硬件要求,适用于基本配置和附加配置。

图 4. 面向 uCPE 的英特尔® Select 解决方案 (ISS) 将多核英特尔® 至强® 处理器的性能扩展到 SD-WAN 边缘环境。(资料来源:Intel®

如上表所示,任何面向 uCPE 的 ISS 都至少提供一个四核英特尔至强 D 处理器。这为数据包加速提供了足够的性能,同时确保内核可以提供主机 VNF 服务。例如,一个内核专门用于网络编排和管理,其他内核则支持防火墙、DPI 和 QoS 监视。

此外,面向 uCPE 的 ISS 系统封装了英特尔® 数据平面开发工具套件(英特尔® DPDK),该包处理软件套件可以优化网络通信。英特尔及其合作伙伴通过调整这些硬件和软件组件,实现了 100% 的线路速率包处理性能,现在,所有面向 uCPE 的 ISS 解决方案必须符合这项标准才能通过认证。

对于商家而言,这意味着关键数据可以在不同的零售中心、服务部门和运营中心之间实时传递,避免丢失销售数据,问题也能迅速得到解决。

此外,所有面向 uCPE 的 ISS 系统都集成了英特尔® QuickAssist 技术,这是一项硬件加速功能,可以减轻加密和压缩工作负载。这有助于确保数据在整个零售基础设施中保持安全。它还能确保主处理器内核专门执行 SD-WAN 编排和虚拟功能,使操作有序进行。

面向 uCPE 的 ISS 平台硬件和软件堆栈由英特尔进行测试、验证和认证,确保零售商的 SD-WAN 投资持续产生盈利,无论其来源如何。

现成的 uCPE 解决方案推动统一商务

Lanner NCA-4020 是首款面向 uCPE 的 ISS 解决方案之一,这是 1U 网络设备,具有四个 16 核英特尔至强处理器,支持基本配置和附加配置(图 5)。该解决方案为后续设备奠定了质量和性能基准,零售商如今可以利用 SD-WAN 功能,并通过持续扩展来满足未来的需求。

图 5. Lanner 的 NCA-4020 是首款面向通用客户驻地设备的英特尔® Select 解决方案 (ISS) 之一。(资料来源:Lanner 公司

希望逐步过渡到 uCPE 的店主可能会选择 Lanner 的入门级 LUNA D-125 白盒网络设备(图 6)。LUNA D-125 基于英特尔 Atom® C2000 双核处理器,可以在一个内核上执行网络管理或编排任务,同时保留另一个内核运行 VNF,如安全功能。

图 6. Lanner 公司的 LUNA D-125 白盒设备基于英特尔 Atom® C2000 系列双核处理器。(资料来源:Lanner 公司

就其本身而言,Lanner 应用自己的测试、认证和验证实践来确保 LUNA D-125 等系统的质量。

无论性能级别如何,操作人员和 IT 部门喜欢在整个 SD-WAN 基础设施中使用基于英特尔架构的系统。这种共性在统一商业部署的整个过程中提高了软件的重复利用率和管理性,同时加快面市速度。

像 LUNA D-125 这样的平台可以部署在小型办公室或店面,开始向灵活的网络过渡,为更强大、更多功能的面向 uCPE 的 ISS 解决方案(如 NCA-4020)搭建舞台。

面向 SD-WAN 的 uCPE:良好、更好、最佳的零售连接

零售商开始要求高吞吐量、可靠和安全的通信来支持诸如零售分析和增强现实等高级功能,基于英特尔的技术高度可扩展,为此提供了一条平稳的迁移路径。面向 uCPE 的 ISS 等解决方案提供软件定义和支持虚拟化的架构,这还意味着随着使用案例的变化或新使用案例的出现,可以随时修改工作负载。

零售市场已做好准备,利用 SD-WAN 降低成本和提高灵活性。现在就是时候,利用边缘设备实现零售创新。

SD-WAN 和 uCPE:简介

随着传统企业 WAN 在容量上的扩展和在距离上的延伸,它们常常利用多个运营商网络向分布式站点(如区域和本地办公室)交付应用程序和服务。这种跨网络的交接会对编排、管理和性能产生负面影响,同时还会增加资本支出和运营支出。

越来越多的企业 WAN 还必须支持需要很多带宽的应用,如流传输高清视频。使用 VoIP 呼叫和视频会议的延迟密集型服务也与日俱增。

作为对这些趋势的回应,通信服务提供商 (CSP) 和企业正转向使用软件定义的广域网 (SD-WAN) 和通用客户端设备 (uCPE)。这些新技术可大幅提升灵活性、性能并显著降低成本,对运营商和最终用户都有益。

软件定义的 WAN 和动态连接通道

SD-WAN 技术的最显著技术成果是一个逻辑 SD-WAN 可以同时支持多种连接类型。这包括混合 Wi-Fi、LTE、DSL、以太网,以及其他形式的高速通信。

图 1 所示,SD-WAN 由中央控制器管理,此控制器使用虚拟化技术与底层硬件基础架构分离。因此,SD-WAN 控制器可以设置策略,以便通过带宽最高的链路动态路由流量,确定流量流的优先级,以及确保符合服务水平协议 (SLA) 要求。

图 1. 软件定义的广域网 (SD-WAN) 利用数据中心网络概念来优化企业流量管理和性能。(资料来源:CSSTECH

此外,SD-WAN 通信以软件为中心的方法意味着,可以将专用设备更换为通用硬件。由于这种通用硬件可以向多家供应商采购,且其部署、管理和扩展更加轻松,SD-WAN 相比传统 WAN 架构大幅降低了总成本。

uCPE 将适用于企业通信的 SD-WAN 标准化

转为采用通用硬件还支持网络功能虚拟化 (NFV)。使用 NFV,可以将用于会话边界控制、负载平衡、网络地址转换、防火墙、深度数据包检测 (DPI) 和 WAN 加速等服务的专用网络设备,迁移到将这些服务作为虚拟网络功能 (VNF) 交付的现成平台。

VNF 可以托管在云端或数据中心,并且可以通过网络远程交付。但是,如果以本地方式将其托管在电信接入网络边缘,则有助于满足许多企业需求的增加带宽和降低延迟的服务要求。uCPE 是将在边缘 VNF 的平台。

通用边缘网络虚拟化

uCPE 定义一组现成硬件和开放软件技术,将数据中心云端和虚拟化功能带入电信接入网络。如图 2 所示,这些平台必须:

  • 足够灵活,以便在单个系统中支持第三方 VNF
  • 足够强大,以便满足网络性能要求
  • 足够紧凑,以便可在小型分支办公室部署

图 2. 通用客户端设备 (uCPE) 将现成硬件与开放软件架构完美结合,可在电信接入网络中支持虚拟化功能。(资料来源:CLADIRECT

对于企业而言,uCPE 意味着只需较少但通用性更强的网络设备即可在本地交付高带宽、低延迟服务。对于 CSP 而言,仍可以远程管理和升级通用 uCPE 平台,以便将维护成本降至最低。

由于 SD-WAN 控制器从底层基础架构抽象化,因此通用 uCPE 硬件可以提供 SD-WAN 部署所需的所有资源。

标准化 uCPE 以实现可靠性并降低成本

uCPE 硬件的通用性质已促进多供应商标准化工作。这将可利用尽可能低的成本快速部署和扩展 uCPE 技术。

英特尔®、Supermicro、Advantech、Lanner 等已针对 uCPE 参考设计开发出英特尔® Select 解决方案。这些设计采用英特尔® 至强® D 2100 系列处理器,可提供一组可扩展解决方案,从而帮助 CSP、电信设备制造商 (TEM)、互联网服务提供商 (ISV) 和企业起用 uCPE 和 SD-WAN(图 3)。

图 3. 适用于 uCPE 的英特尔® Select 解决方案提供可扩展平台参考设计,以便加速 SD-WAN 采用。(资料来源:英特尔® 公司

英特尔 Select 解决方案的硬件和软件堆栈经英特尔验证,这将确保 uCPE 参考设计的稳健性。参考设计有两种风格,为 CSP 和企业树立了根据小型办公室或较大设施需求调整计算、存储和网络资源的基准:

  • 适用于 uCPE 的英特尔 Select 解决方案基本配置 – 专为中小型企业设计;uCPE 基本配置至少集成一个四核英特尔至强 D 处理器、英特尔® QuickAssist 技术(英特尔® QAT)、2 个 10 GbE 以太网端口、充足的存储和内存,并且支持两台虚拟机 (VM)。
  • 适用于 uCPE 的英特尔 Select 解决方案增强配置 – uCPE 增强配置面向较大型的企业设施,使用一个 14 核英特尔至强 D 处理器、英特尔 QAT、4 个 10 GbE 以太网端口,以及多得多的内存和存储。

Super Micro Computer, Inc. 推出的 SuperServer 5019D-FN8TP 是前几款适用于 uCPE 的 Select 解决方案之一,提供一个 8 核、16 线程英特尔至强 D 处理器、内置英特尔 QAT 和广泛 I/O 用于 SD-WAN 服务,例如网络安全性和边缘计算,全都在 1U 外形中实现。

虽然适用于 uCPE 的 Select 解决方案可现成部署,但可以使用英特尔® 数据平面开发套件(英特尔® DPDK)等工具根据部署或特定 VNF 将其优化。图 4 显示 Super Micro 如何利用英特尔 DPDK 在 SuperServer 5019D 上实施 DPU 和 IPSec 服务,以及如何将其与 SD-WAN 集成。

图 4. 英特尔® 数据平面开发套件(英特尔® DPDK)可与适用于 uCPE 的英特尔® Select 解决方案配对,例如 Super Micro Computer SuperServer 5019D,以便加速安全性等虚拟网络功能 (VNF) 的实施。(资料来源:Super Micro Computer, Inc.)

可实现 SD-WAN 灵活性和节省的基于标准的解决方案

随着网络带宽和延迟需求的不断增加以及服务的发展,使用现成硬件和开放软件架构智能管理网络基础架构的能力已经成为一项业务需求。有鉴于此,SD-WAN 的性能、灵活性和成本节省简直难以忽视。

根据调查公司 IDC 发布的一份 2017 年 7 月报告,SD-WAN 采用正“显著增长”,在 2021 年前复合年增长率 (CAGR) 为 69.6%。刚开启 SD-WAN 评估流程的 CSP 和企业已经落后,但适用于 SD-WAN 的 uCPE 解决方案可快速缩小这种差距。

使用 FPGA 协处理器,更快速、更深入地学习

深度学习对很多行业来说是破坏性的技术,但该技术的计算要求可以超越标准 CPU。这一问题一直激励着开发人员考虑替代性的架构,但从类似的 CPU 迁移至更加深奥的设计是一项十分具有挑战性的工作。这样,组织不需要改造已有基础设施来支持深度学习,而是只需使用混合 CPU + FPGA 计算架构即可。

即使是从性能的角度考虑,用户也可以从使用混合 CPU 中获益。比如说,很多此类处理器可以高效地执行单独的深度学习推理工作负载,因为单独的推理是顺序操作。但是,如果推理操作包批或大量出现,则 CPU 速度很难跟上。

GPU 和其他大规模并行架构提供了串行处理的一种替代性方案。大量并行架构非常适合分批处理推理工作负载,和培训带有大量输入数据集的深度学习模式。

当然,对于顺序处理,并行计算机的速度通常难以跟上。对于需要快速按顺序推理的应用,如自主车辆计算机视觉和其他时间敏感型应用,GPU 可能不是十分适合。

要满足小量推理和大批量处理的需求,能够将 FPGA 与多核 CPU 集成的设备是不错的选择。由于 FPGA 在性质上是大量并行架构,因此能够执行大量深度学习批次。同时,CPU 也可以处理较少的顺序操作。或者,FPGA 与 CPU 之间可以共享工作负载,以优化神经网络的效率。

另外,由于此异构架构具有架构灵活性,因此无需改造已有计算基础设施,即可优化效率。

使用 FPGA 进行 AI 加速:串联和协同处理

为了更好地理解 FPGA 如何加速深度学习,我们首先来了解 FPGA 如何作为串联和协同处理计算要素与多核 CPU 一同工作。

作为串联处理器,FPGA 位置在 CPU 前面,它在传输输出数据进行进一步计算前执行预处理任务,如数据过滤。如图 1 所示,视觉系统可以使用 FPGA,在发送像素到 CPU 之前,进行串联过滤或阈值化。由于 CPU 仅处理 FPGA 确定的关注区域的像素,因此整个系统的吞吐量将增加。

图 1. 作为串联处理器,FPGA 可以在数据传输到 CPU 之前对其进行过滤,从而帮助提升整个系统的吞吐量。(信息来源:National Instruments

作为协处理器,FPGA 将与 CPU 共享计算工作负载。共享可以通过多种方式实现:在将输出数据发送回 CPU 前,由 FPGA 执行并行处理;也可以由 FPGA 执行所有处理工作,这样 CPU 可以重点处理通信和控制等工作。

我们来继续了解计算机视觉的示例,图 2 显示了 FPGA 与 CPU 之间如何通过直接内存访问 (DMA) 分布工作负载。

图 2.
FPGA 协处理器可以通过直接内存访问 (DMA) 与 CPU 共享工作负载,从而将 CPU 解放出来处理其他任务。(信息来源:National Instruments

总结来说,将 FPGA 与多核 CPU 配对可以满足进行小量推理和更大规模分批处理的同时增加系统吞吐量的需求。但是,开发人员必须能够保证在对已有基础设施影响最小的情况下,采纳这些解决方案。

新版 FPGA 交付极佳性能与集成灵活性

英特尔® Stratix® 10 FPGA 能够提高深度学习性能,同时简化与已部署系统的集成。这些 FPGA 最多可以集成 550 万个逻辑单元和一个四核 64 位 Arm Cortex-A53 CPU。FPGA 还可以提供允许 FPGA 轻松地与标准网络和计算技术连接的 I/O pin 码。

在性能方面,Intel Stratix 10 设备使用新款英特尔® HyperFlex™ FPGA 架构设计。该架构采纳了超级注册技术,将可由支线输送的注册放置到设备核心的各个路由段以及所有功能块输入(图 3)。

图 3. 超级注册将注册放置到各个路由段和所有功能块输入,以推动时钟频率翻倍。(资料来源:英特尔® 公司)

可由支线输送的注册可优化 FPGA 架构各处的数据流,可帮助芯片实现性能最大化。因此,与上一代 FPGA 相比,英特尔 Stratix 10 设备能够在耗电量减低 70% 的情况下,提供双倍的时钟速度。这一伟大的改进使得 FPGA 非常适合需要提高性能,但供电量有限的应用场景。

在平台集成方面,英特尔 Stratix 10 FPGA 设备支持串行和并行闪存接口。这些内存类型在网络平台上十分常见,非常适合用于深度学习,因为这些内存类型可让开发人员选择最适合其工作负载的配置。例如,Terasic, Inc.DE10-Pro Stratix 10 GX/SX PCIe Board 支持各种应用的多种类型的内存(图 4):

  • 适合用于高带宽、低延迟应用场合的 QDR-IV 内存模块
  • 适合用于狄艳池内存读写的 QDR-II+ 内存模块
  • 适合用于需要有最大内存容量的应用场景的 DDR4

图 4. Terasic, Inc. 的 DE10-Pro Stratix 10 GX/SX PCIe Board 支持为不同的深度学习用例使用多种内存类型。(资料来源:Terasic, Inc.

DE10-Pro 包含用于芯片间数据传输速度最快达 128 Gbps 的 x16 PCIe Gen 3 个通道,而四个 QSFP28 连接器都支持 100 千兆位以太网。这些接口可实现大量数据卸载,还可快速读写内存。在服务器或数据中心环境中,这意味着工作负载可以在计算库与内存资源之间共享,从而按需要调整深度学习性能。

最后,从软件角度看,DE10-Pro Stratix 10 GX/SX PCIe Board 支持英特尔® Open Visual Inference 和 Neural Network Optimization(英特尔® OpenVINO)工具套件。OpenVINO 是适合异构执行架构使用的开发套件,它基于能够将 FPGA 编程的复杂性抽象化的通用 API。

OpenVINO 包括 OpenCV 和 OpenVX 的很多功能、内核和优化调用,为计算机视觉和深度学习工作负载展示了性能的强化,最高可达 19x(图 5)。

图 5. Open Visual Inference 和 Neural Network Optimization (OpenVINO) 工具套件展示了性能的显著优化。(资料来源:英特尔® 公司

更快加速

一般而言,深度学习工作负载正推动该技术领域不断创新;特别是,它推动着数据处理市场的创新。该行业当前正在挖掘新的方法,以通过使用神经网络专用的处理器来计算深度学习工作负载。

拥有集成多核 CPU 的 FPGA 具有灵活性和高性能,能够在可获得最高吞吐量的地点、时间并以这种方式执行深度学习工作负载。这些 FPGA 还可提供未来需求的迁移路径,前提是这些需求涉及人工智能、下一代网络或任何可通过高性能计算 (HPC) 应对的细分市场。