“轮上银行”和边缘计算为农村社区提供服务

想想您上次从自动提款机提取资金、使用信用额度或存款时候的情况。我们大多数人认为这些基本金融服务是理所当然的。但全球数百万农村公民没有银行账户,即使有银行账户,也没有支行可供使用。

“银行在偏远地方开设新分支机构不符合成本效益。” 智能自助服务终端和数字标牌公司 Bits & Bytes 常务董事 Amit Jain 表示。“农村地区的银行通常面临基础设施问题,如断电和网络中断。”

人们无法前往银行,这就不仅仅是不方便这么简单。这也是一个公平的问题,公民无法完全参与更广泛的经济。但一种新型边缘解决方案以令人惊讶的方式解决了这个问题:为人们带来银行分支机构。

在边缘计算硬件和电信网络的支持下,Bits & Bytes 开发了 “车轮上的银行”,改善了印度偏远社区的金融服务,并准备进入全球其他市场。

农村分支银行实际运作

印度境内的 Bits & Bytes 移动分支机构部署是这些解决方案如何发挥作用的绝佳例子。马哈拉施特拉邦是印度人口最多、工业化程度最高的地区之一。但该邦半数以上人口居住在农村地区,许多公民无法获得城市居民享有的服务。

Bits & Bytes 与一家大型全国性银行合作开发了一种解决方案,可以执行传统分行的许多功能,并可根据需要从一个地点开到另一个地点。

该系统的核心是一个数字自助服务终端,在坚固耐用、边缘友好的计算硬件上运行,具有内置摄像头和指纹扫描仪,用于生物识别身份验证,以及用于用户交互的触摸板。自助服务终端安装在面包车中,可以开车前往不同的农村地区,按需停放。

该系统以两种方式与银行连接。该系统使用数据卡,通过标准蜂窝网络,与该机构的集中式服务器通信,银行员工与司机一起乘车,帮助新客户学习如何使用该技术并解答问题。

移动自助服务终端帮助客户开设新账户、开办借记卡、执行各种交易,例如取现、存款、贷款申请、账单支付和转账等。

部署之后,轮上银行在客户当中取得了巨大成功。“以前,有些人必须向专业代理商支付费用,才能亲自前往最近的分行并代他们执行交易。”Jain 表示。“他们很高兴第一次能够自己直接完成交易。”

确保边缘的合规和安全

金融系统具有严格的安全和合规要求,因国而异。灵活的设计和边缘功能有助于克服这些挑战,并可以在许多不同的市场部署该解决方案。

例如,Bits & Bytes 解决方案使用其安全网络连接和生物识别身份验证功能,符合印度严格的“了解您的客户”法律。移动银行自助服务终端执行基本的生物识别扫描,然后与银行服务器通信,而银行服务器又与中央政府数据库连接。经过身份验证后,会获取预填充的申请表,只需在触摸板上签名即可完成打开账户。

其精致的基本设计(通过蜂窝网络连接到中央服务器的边缘 IPC 和模块化硬件),意味着该系统可以立即成为银行现有网络的一部分。这也意味着不会在边缘存储个人用户数据。所有内容都在金融机构的网络中,其中包含所有数据隐私和网络安全预防措施。

此外,移动分支机构可以轻松适应具有不同数据隐私和监管要求的新地区。由于金融机构已经遵守这些国家的法规,因此不需要对自助服务终端软件执行广泛的定制。

Bits & Bytes 与英特尔的技术合作对该解决方案至关重要。“英特尔硬件为边缘计算提供了极好的平台。” Jain 表示。“英特尔在产品开发中也发挥着至关重要的作用,帮助我们调整现成的英特尔技术,以便将新产品推向市场。”

边缘计算助力数字化转型

能够解决农村银行短缺并增加客户数量的技术,必定会吸引银行数字化部门和金融行业集成商 (SIs) 的注意。

边缘计算的兴起不仅实现了Bits & Bytes 移动银行自助服务终端等系统,而且还有潜力解决多个行业的棘手问题。在未来,预计将在边缘部署更多创新解决方案,从农业中的自主移动机器人到用于采矿运营的私有 5G 网络。

轮上银行是当前边缘数字化转型浪潮的绝佳例子,在未来几年,AI 将开辟更多机会。

“我们生活在一个各行各业都处于技术快速进步的时代,因此我们公司为众多不同的垂直行业提供产品。” Jain 表示。“五年后,当 AI 和物联网无处不在,各种人员和组织将能够享受数字化转型的优势。”

 

由 insight.tech 主编 Georganne Benesch 编辑。

图像分割:探索分割任意东西 (Segment Anything) 的力量

技术创新是一件令人惊叹的事情,如今其发展速度似乎更胜从前。(虽然速度不够快,但我们总是会说:“如果我拥有这个工具,那么我会节省多少时间和精力!”)人工智能和计算机视觉尤其如此,它们改变了各行各业的运作方式,对于多种类型的企业都具有难以置信的价值。在整个 AI/计算机视觉难题中,图像分割是一个关键部分。

英特尔的 AI 传播者 Paula Ramos 与我们一起探索这个快速变化的主题。她讨论了过去、现在和未来的图像分割解决方案;深入探讨最近发布的 Meta AI 的 SAM(分割任意东西模型)(视频 1);并解释了英特尔 OpenVINO 工具套件提供的资源如何改善 SAM

视频 1. 英特尔的 AI 传播者 Paula Ramos 讨论了最近助力未来图像分割的发展动态。(资料来源:insight.tech

图像分割对计算机视觉具有什么重要意义?

计算机视觉任务有很多种,我认为图像分割是最重要的。它在对象检测、识别和分析中发挥着至关重要的作用。也许问题是:为什么它如此重要?答案很简单:图像分割有助于将单个对象与背景或其他对象隔离。我们可以利用图像分割来定位重要信息;我们可以围绕特定对象创建指标;还可以提取特征,有助于理解特定场景,这些这些都对计算机视觉非常重要。

过去开发人员在构建图像分割解决方案上面临哪些挑战?

当我在博士论文中研究图像分割时,我从事的是农业。我面临着很多挑战,因为有多种技术可以分割对象,例如阈值、边缘检测、区域增长,但没有通用的方法。根据所使用的技术,您需要仔细定义最佳方法。

我的工作是检测咖啡豆,而咖啡豆大体相似,混在一起!也许背景中也有红色,这是一个问题。因此,在我运行图像分割算法时,发生了过度分割——合并对象。或者是分割不足,缺少了一些结果。

这就是数据方面的挑战,特别是在图像分割方面,因为在光线不断变化的环境中,摄像头分辨率不同,所以很难发挥作用。基本上,您要移动摄像头,这样就会得到一些模糊的图像,或者图像中有一些噪声。检测边界也是一项挑战。传统图像分割的另一项挑战是可扩展性和效率。根据图像分辨率或数据集的大小,计算成本会更高,而这会限制实时应用。

在大多数情况下,需要人为干预才能使用这些传统方法。如果当时采用最新的图像分割技术,我就可以节省大量时间。

Meta AI 的分割任意东西模型 (SAM) 在应对这些挑战时具有什么价值?

我尤其希望七年前拥有分割任意东西模型!基本上,SAM 提高了复杂数据集的性能。因此,噪点、图像模糊、对比度低等问题都已成为 SAM 的过去式。

SAM 的另一个好处是多功能和基于提示的控制。传统方法需要针对不同的场景使用特定的技术,而 SAM 则不同,它具有多功能性,用户可以通过提示,指定他们想要分割的内容。提示可以是点、框,甚至自然语言描述。

以前,我希望能够说,“我希望看到成熟的咖啡豆”或“我希望看到未成熟的咖啡豆”,并拥有这种灵活性。这种灵活性还可以帮助开发人员处理各种分割任务。我前面还提到可扩展性和效率:使用 SAM 可以比传统方法更快处理信息。因此,这些实时应用可以更可持续,而且准确度也更高。

当然,有一些限制,因此我们需要平衡这些限制,但肯定的是,我们也在这些复杂情况中提高性能。

分割任意东西模型具有哪些商业机会?

在我们目前所知的各种不同图像分割过程中,分割任意东西模型提供了几个潜在的商业机会。例如,轻松创建内容或编辑内容,自动操纵电子邮件,或创建实时特效。增强现实或虚拟现实也受到 SAM 严重影响,实时对象检测有助于在交互体验中实现虚拟元素。

另一件事也许是零售业的产品分割。SAM 可以自动分割在线商店中的产品图像,从而提高产品销售效率。基于特定对象特征的分类是另一个有机会的领域。我还看到了机器人和自动化在各种任务中实现更精确目标识别和操纵的潜力。当然,还有自动驾驶汽车。SAM 还有潜力帮助医疗专业人员完成肿瘤分割或做出更准确诊断等任务,但我可以看到,对这种用途可能有很多保留意见。

我不想说这些业务将通过 SAM 来解决;但它是一种有潜力的应用。SAM 仍在开发中,我们仍在改进。

开发人员如何使用 OpenVINO 克服 SAM 的限制?

我认为,在所有这些人工智能趋势中,现在一个好事是,很多模型都是开源的,这也是我们在 SAM 上所具备的能力。OpenVINO 也是开源的,开发人员可以非常轻松访问此工具套件。每天,我们将多个 AI 趋势放入 OpenVINO Notebooks 存储库中,AI 领域会发生一些事情,两到三天后,那里就有我们的笔记本。对于开发人员来说,有一个好消息:我们已经在 OpenVINO 存储库中为 SAM 提供了优化管道。

我们现在有一系列四个笔记本。第一个是我们一直在讨论的分割任意东西模型;这是最常见的。您可以编译该模型,直接使用 OpenVINO,还可以使用神经网络压缩框架 (NNCF) 来优化该模型。

其次,我们有快速分割任意东西模型。原始 SAM 是一种需要大量计算资源的重型变换器模型。我们肯定可以通过量化来解决问题,但 FastSAM 使用 YOLOv8,将分割任意东西任务分成了两个顺序阶段。

然后,我们有 EfficientSAM,这是一种轻量级 SAM 模型,具有 SAM 的性能,而复杂性也大大降低。最近刚刚在 OpenVINO 存储库中发布的最后一个资源是 GroundingDINO plus Sam,称为 GroundedSAM。其理念是找到边界框,同时分割这些边界框中的所有东西。

真正的好处是,不需要特定的机器来运行这些笔记本;可以在笔记本电脑上运行它们,有了一些模型,就能看到图像分割。

随着 SAM 和 AI 的发展,OpenVINO 将如何继续发展?

我认为,OpenVINO 是降低构建深度学习应用复杂性的好工具。如果您拥有 AI 专业知识,那么这里是一个很好的地方,您可以详细了解 AI 趋势,以及了解 OpenVINO 如何改善您的日常工作。但如果您是新开发人员,或者如果您是开发人员,但并非 AI 专家,这也是一个很好的起点,因为您可以看到我们提供的示例,并且可以跟进 Jupyter Notebooks 中的每个单元格。

因此,我们肯定会继续创建更多示例和更多 OpenVINO 笔记本。我们有一批才华横溢的工程师从事这项工作。我们还在努力创建有意义的示例,即可以每天使用的概念证明。

另一件事是,去年 12 月,推出了 AI 电脑。我认为,这是一个很好的机会,可以了解我们每天都在增强的功能,即改进开发人员使用的硬件,这样他们无需特定硬件,便能运行最新 AI 趋势。可以在笔记本电脑上运行模型,还可以提高性能。

几年前,我自己也是一名初级开发人员,我认为对我来说,重要的是了解当时人工智能的发展情况、了解行业中的差距、领先一步、不断改进以及尝试创造新事物。

我认为人们应该了解的其他重要事项是,我们正在寻找您的需求:您希望做什么事?我们欢迎各方贡献力量。请查看 OpenVINO Notebooks 存储库,了解如何为其做出贡献。

相关内容

要详细了解图像分割,请收听使用分割任意东西,提高图像分割,并阅读 分割任意东西模型——本身具有多功能,而且有了 OpenVINO,速度更快。有关英特尔的最新创新,请在 X @IntelLinkedIn 上关注他们。

 

本文由文案编辑 Erin Noble 编辑

快速跟踪实时动态解决方案开发

在驾驶过程中,使用 GPS 作为导航工具带来的帮助和挫败感可谓不相上下。虽然实时导航是一项实用的功能,但卫星导航经常无法及时反映你在路上的实际位置。

位置映射不符充其量有点闹心,但当问题发生在需要更精准定位信息的应用(如自动驾驶)中时,却是不可接受的。这就是为什么实时动态技术 (RTK) 在需要高精度定位的应用中越来越受欢迎。

RTK 会将“校正数据”发送至移动中的接收器,从而提高常规全球导航卫星系统 (GNSS) 提供的定位精度。传统 GNSS 接收器大约每秒接收一次位置数据,而 RTK 的频率是前者的 200 倍。由此达到的效果是,即便在快速行驶的车辆中,定位精度也能保持在一或两厘米以上。

RTK “沙盒”支持隔离测试

电子元件和技术解决方案提供商儒卓力电子有限公司 (Rutronik Elektronische Bauelemente GmbH)全球创新管理主管 Stephan Menze 表示,虽然 RTK 面市已有一段时间,但直到最近才具备适合普及的经济性。

对一项技术进行“试驾”有时会走许多“弯路”。公司经常发现,仅仅为了确定解决方案是否值得推进,就需要建立特定基础设施,并动用一系列不同的硬件组件。采用隔离测试环境有助于消除这些路障,并更快给出答案。而这正是儒卓力开发 Rutronik 适配器板,RAB4 的原因所在——一款专门面向 RTK 开发项目设计的沙盒。RAB4 减少了实施这项技术的障碍,缩短了前期工程设计阶段和产品面市时间。

RAB4 是儒卓力系统解决方案 (Rutronik System Solutions) 于 2021 年推出的产品,目的是创造有助于推动销售,且可供客户对特定市场进行测试的工具。对于 RTK 而言,这些额外市场运行的可能是无人机、割草机,甚至自动驾驶,这些都是能够从高精度定位中获益的应用。 

RAB4 适配器板组件

RTK 需要 GPS 数据和发送校正数据的基站。Wi-Fi 或蓝牙连接适用于本地基站。但规模更大、覆盖面更广的项目(如智慧城市或智慧农业的实施)可能需要 LTE 无线技术。

RAB4 适配器板配备测试 RTK 技术所需的所有元件:来自和芯星通 (Unicore) 的高精度 RTK 定位模块;用于连接的 4G LTE 模块;必要的天线;以及一张预载入 100 MB 数据的 SIM 卡,可供公司下载结果,并对从 GNSS 接收器接收到的数据与从 RTK 接收器接收到的数据进行比较。(视频 1

视频 1。RAB4 具备在隔离测试环境中进行解决方案开发所需的一切。(来源:儒卓力系统解决方案

如果首选连接是蓝牙,RAB4 可以通过 Arduino 接口,与支持该连接的 RDK3 基板结合使用。RAB4 还可与文本转语音适配器板连接,该适配器板可中继有关电池状态、连接问题和其他信息的语音输出,支持多达 12 种语言。儒卓力还提供进行完整概念验证所需的软件。Menze 表示:“我们试图向客户展示系统的工作原理。我们的软硬件便利实用,必定会赢得客户的嘉许。”

通过“漫游装置”应用演示实时动态

为优化 RTK 的连接,儒卓力开发了一个“漫游装置”和相关应用,在 2024 年德国纽伦堡嵌入式应用展览会的儒卓力展位上对其进行了展示,供参观者自行控制该装置。漫游装置易于操作,而且可以通过应用以厘米级精度进行控制。

借助 Arduino 接口,RAB4 可以轻松与儒卓力系统解决方案的 RDK3 基板结合使用。RDK3 是一款可使用低功耗蓝牙进行无线连接的基板。参考站将测量到的 GNSS 位置以实时协议的形式通过蓝牙发送给漫游装置。这样,漫游装置就可以掌握自身与参考站的距离,并利用其与基站的相对位置以厘米精度进行导航,无需在地面铺设电线作为边界。

RAB4 未来的迭代正在规划中,包括采用英特尔实感摄像头在漫游装置上进行碰撞检测和其他应用的型号。Menze 表示,随着应用扩展到真实世界,RTK 技术将需要更强大的处理能力,届时,儒卓力也将采用英特尔技术。沙盒系统目前使用英飞凌微控制器,但儒卓力计划在未来的 RTK 迭代和其他概念验证解决方案中使用性能更强大的英特尔处理器。搭载英特尔处理器的新基板正处于开发阶段。

至于 RTK 本身,预计该技术的实施未来会随着智慧城市的日渐普及而不断增加。在智慧城市里,交通信号灯可以接收数据并调节交通,但要安全地做到这一点,RTK 提供的高精度定位不可或缺。Menze 表示,自动驾驶是一个令人兴奋的 RTK 用例,虽然真正的实施可能要花费数年的时间。使用自动导引车 (AGV) 和无人机进行最后一英里交付同样是一条潜力巨大的路径。

无论 RTK 技术的市场前景如何,儒卓力解决方案都可以在机器人实际“上路”之前,提供对其进行评估所需的必要组件。

 

本文由 insight.tech 的编辑主管 Georganne Benesch 编辑。

零售系统集成商轻松部署 AI 解决方案

如今的零售客户越来越期待个性化和自助服务选项,这给商店技术增加了新的多层复杂性。为了在竞争中保持领先,零售商需要语音识别、计算机视觉和基于 AI 的扫描仪等复杂系统。这些系统必须在彼此之间以及与现有机器和商品之间流畅地进行通信。

系统集成商 (SI) 与零售商一同协调最新技术,但仍须投入大量时间评估所有不同的硬件和软件选项,为每个客户构建定制解决方案。

现在有了一种更好的方法完成这项工作。经验丰富的解决方案聚合商不仅已测试并部署了当今零售市场上可用的许多前沿技术,还拥有将其集成到完整端到端解决方案的专业知识。通过与聚合商合作,SI 可以节省时间,更好地满足客户需求,并确保其提供的先进技术能够发挥预期功能。

开箱即用的零售 AI 解决方案

对于许多零售商来说,自动化和自助服务技术出现已经迫在眉睫。在员工短缺、客户要求苛刻以及利润空间受通胀挤压的压力下,他们转而向 SI 寻求提高效率的方法, BlueStar, Inc. 的业务 开发经理 David Lester(一家面向零售商、制造商、物流公司和其他行业提供技术解决方案的全球供应商)表示。

该公司开发各种专门技术,以提高零售行业效率并改善客户体验。BlueStar 与 SI 密切合作,为从快餐店到商场、酒店、杂货店和精品店的零售业务提供了 30 种独特的“盒式”(In-a-Box)解决方案。Lester 表示,这些即用型捆绑软件包含有 SI 部署所需的所有硬件、软件和配件,可最大限度减少决策,缩短设置时间。

“如果您是一家快餐店的系统集成商,您最不想做的事就是单独采购扫描、支付处理、库存管理以及销售终端系统所涉及的其他一切功能。使用 BlueStar In-a-Box 解决方案,您只需打开盒子,将其放在台面上,即可开始使用,” Lester 补充道。

利用 AI 自动化技术为系统集成商提供帮助

Lester 表示,一种零售技术越来越受欢迎——尤其是免下车 QSR——基于语音的 AI。对于此应用场景,BlueStar 与 数字订购互动语音技术提供商 Sodaclick 合作。“我们喜欢 Sodaclick 对话式语音 AI,因为它非常善于了解客户需求,” Lester 表示。

Sodaclick 对话式虚拟助手用于汽车快餐店和自助服务终端,使用英特尔® 实感 3D 摄像头识别走近的顾客,并可通过编程理解英语、西班牙语、中文普通话以及其他 100 多种语言和地区方言。该系统能以听起来自然的语言回应顾客,并能根据人口统计数据、时间或零售商选择的其他指标提供建议和促销活动。

语音识别与计算机视觉的结合在配备自助支付系统的商店中也非常有效,因为商品识别可能会很棘手。

总部位于佐治亚州费耶特维尔的 全自动化杂货店 Nourish + Bloom Market 就是这种情况。在商店的商品识别软件无法正确识别沙拉和其他熟食时,该公司向 SI UST Global Inc 寻求帮助。UST 与 BlueStar 合作,利用 Sodaclick 对话式语音 AI、UST 视觉结账系统和自动支付处理工具,以及自助服务终端、天平、电缆和其他相关硬件,升级商店的结账体验。

现在,顾客可以在没有人工服务的情况下购买店内的任何商品。UST Vision Checkout(UST 视觉结账系统)包括安装在天花板上的摄像头,可在商品从货架上取下并放入购物车时识别和记录包装商品的价格。对于必须称重的沙拉和其他熟食,顾客在将其放在天平上之前需向 Sodaclick 语音助手描述商品。语音系统与计算机视觉摄像头之间相互配合,可实现准确定价。在选好所有商品后,顾客只需告诉语音助手“立即付款”,然后用手机完成交易。“这是一个无接触的流程,会对顾客带来极大的便利,” Lester 表示。

构建未来的零售基础设施

随着边缘 AI 能力提升,BlueStar 正在扩大其解决方案的应用范围。例如,它目前正在开发与服装技术公司 FIT:MATCH 的集成,后者利用激光雷达和 AI 捕捉顾客体形的 3D 图像,并将其与数据库中的数字孪生相匹配。然后,该系统就可以针对产品和尺寸提出个性化建议。收听我们的播客: 个性化 AI 购物体验:在 insight.tech 上使用 FIT:MATCH

与英特尔合作,帮助 BlueStar 跟上此类创新应用的步伐。“英特尔在我们的工作中发挥着重要作用,特别是我们的盒式解决方案,” Lester 指出。“英特尔给予我们极大的帮助,让我们得以了解 AI 解决方案,并尽可能以经济高效的方式进行部署。”

虽然某些新的 AI 应用听起来可能极具未来感,Lester 相信它们将不断改进。“我每个月都能发现人工智能的进步。我认为语音 AI 和数字标牌将发展到更直观的状态,从而提高上下文理解,提供更加个性化的体验和更好的客户参与度。”

 

本文由 insight.tech 的编辑主管 Georganne Benesch 编辑。

安全且易于部署:专用 5G 盒式网络

在一段时间内,5G 曾是消费者的“刚需”。毕竟,支持 5G 的智能手机可以加快流媒体传输速度并提高整体性能,这几乎是每个人需要的。随着传感器驱动的数据分析兴起,5G 的吸引力已扩展到企业和公共部门。当每台设备都是传输数据的边缘节点时,以较低的延迟可靠地访问衍生信息就成为 B2B 行业的当务之急。

鉴于可靠和始终可用的数据关系重大,越来越多的公共部门和私营企业将利用专用 5G 网络来确保其业务流程,据 Yazz Krdzalic 指出,他目前 担任 弹性高性能计算解决方案提供商 Trenton Systems 营销副总裁

从 4G 升级到 5G 是为了“增加三个泳道:超可靠、低延迟的数据传输;安全控制和管理;以及容纳数十万个互联设备同时通信的能力。现在,你只需采用一种技术就能解决最大的痛点,” Krdzalic 表示。

专用 5G 网络提升数据安全性

尽管 5G 具备诸多优势,但也有一个缺点:依赖于公共基础设施。

在发生自然灾害时,包括信号塔在内的通信基础设施可能无法正常运行。当急救人员需要即时安全地传输地面信息时,卫星通信是一种不稳定后备选择。在这种情况下,依靠专用 5G 网络更为明智。

“只需架设好自己的天线和无线电设备,即可启动运行。你还能够在非连接模式下工作,这意味着你不会被母机束缚,” Krdzalic 表示。群组之间可以相互共享信息,当群组进入正常运行的蜂窝信号塔或卫星通信范围内时,就可以转发数据。

专用 5G 将公共部门和私营企业从公有云转移到专用的安全网络。Krdzalic 表示:“您可以利用 5G 的附加值,将其添加到自己的私人空间。”

随着数据传输节点数量的增加,发生网络入侵的可能性也随之增加,因此能够应用更多安全策略使专用 5G 对当今的企业运营特别有吸引力。“私人空间”可增强安全性,这是公共和私营部门的关键要素。

专用 5G 网络解决方案

由于意识到拟部署专用 5G 的组织可能希望避免自己组装组件,Trenton Systems 开发了 专用 5G 集成边缘解决方案 (IES.5G)。“盒式网络”将所有组件(加固的硬件、增强型处理器、软件和安全性)整合到一个设备中。Krdzalic 指出:“我们投入大量时间与伙伴合作研究如何为专用 5G 部署开发一个简单的按钮,而不是一百万个移动部件。”

英特尔、ZScaler 以及 RAN 和 5G 核心软件供应商等合作伙伴都为该产品带来了各自的优势。Trenton Systems 提供专为极端条件下工作而设计的边缘计算平台或坚固耐用的服务器。ZScaler 提供基于云的零信任网络安全平台,而各种 RAN 和 5G 核心供应商的软件则支持设备连接。

从 CPU 到加速器,再到系统上的适配器,底层架构均由英特尔提供技术支持。该产品可在英特尔® 至强® 可扩展处理器上运行。使用第三代英特尔® 至强® 可扩展处理器的企业可获得用于大容量 4G 和 5G vRAN 部署的英特尔® vRAN 加速器 ACC100 适配器,或英特尔® Quick Assist Technology(英特尔® QAT)适配器。该系统包含英特尔® FlexRAN,它可以控制底层 RAN 架构,是“RAN 和核心所在的优质基础部件”,Krdzalic 表示。“主板本身可能配备以太网适配器或英特尔 E810 NIC 网卡,这是我们纳入该解决方案的另一个设备,用于在实验室和现场部署环境中更轻松地测试 IES.5G,”他补充道。

计算效率和 5G 专用用例

Krdzalic 指出,可扩展性和根据需求切分带宽的能力是 IES.5G 的额外优势。IT 部门可以扩大或缩小盒式服务器的规模,如果需要,还可以增加计算能力。

IES.5G 解决方案还支持虚拟网络功能 (VNF) 和云网络功能 (CNF),即使用软件提供网络服务而不是完全依赖硬件的方式。这些功能使 IT 部门能够根据需求分割网络带宽并进行分配。“你可以清楚地阐明如何利用全部带宽;不必假设它只是一个开关,” Krdzalic 表示。例如,急救人员可以随时访问最佳可用带宽。由于并非每个人都需要最大容量,因此基础设施也不会一直以最大容量运行,而是只消耗绝对必要的能源。

除公共部门外,专用 5G 网络的用例也涵盖制造业和医疗领域。未来是无处不在、持续不断的连接,而这一切都将从专用 5G 开始。

毕竟,正如 Krdzalic 所说,“专用 5G 就像是在说‘我有自己的数据中心,我有自己的 ISP,也有自己的设备和所需的一切,以确保我和我的团队在需要的时间和地点拥有连接和计算能力。’”

 

本文由 insight.tech 的编辑主管 Georganne Benesch 编辑。

以患者为中心的 AI 重新定义连续护理

医疗保健专业人员的使命只有一个:为患者提供最好的医疗护理。但从入院到出院,以及中间的所有过程,他们都面临着无数的挑战。

人员持续短缺、资源有限和预算紧张只是其中少数几项挑战。最大的挑战是如何获取患者在整个住院过程中的病情基本信息,特别是患者监护的生物医学设备产生的逐秒时间序列波形数据。在以秒计时的时刻,医院如何利用这些数据,并使其医疗团队能够方便地获取这些数据?

时间序列数据为何重要

解决这一挑战的答案是建立持续收集、处理和统一不同数据的单一开放式平台,并实时提供给临床医生。以休斯顿八家医院组成的系统为例,该系统面临人员配备和医疗服务覆盖范围有限的问题,尤其是在夜间。医院被迫做出艰难的决定,例如雇用更多旅行护士和医生,或将患者拒之门外。当该组织部署 Sickbay® 临床平台后,一切都发生了变化。此平台是一个供应商中立、基于软件的监护和分析解决方案,来自 Medical Informatics Corp. (MIC)

Sickbay 是经 FDA 认证的基于软件的临床平台,可帮助医院实现患者监护标准化。平台支持灵活的护理模式,并在单一的互联架构上大规模开发和部署以患者为中心的 AI。Sickbay 重新定义了存储和访问 EMR 系统和 PACS 成像静态数据的传统方法。无论护理团队位于何处,基于 Web 的架构都能为他们提供近乎实时的数据流和标准化的回顾数据,从而以相同的集成支持各种工作流程。这包括在个人电脑和移动设备上嵌入 EMR 报告和监护数据。

“在床旁监护设备每小时为单个患者生成的约 80 万个数据点中,只有约二十几个数据点可临床使用,” 据 Craig Rusin,MIC 首席产品与创新官和联合创始人指出。鲜为人知的是,非联网设备(如病房外的呼吸机)发出的警报很难被护理人员听到或远程查看。同样,目前的患者监护也没有利用 AI 工具和现有数据为患者护理提供信息。

影响力评估

使用 Sickbay 的医院和医疗保健系统重新定义了患者监护,并通过展示以下能力建立了灵活的数据驱动型护理新标准:

  • 快速增加床位和护理人员,同时建立可超越传统的远程看护、入院和出院模式的灵活虚拟护理模式。
  • 为已在单位、服务或待命的医护人员提供更多近乎实时数据和回顾数据,以改进其工作流程和护理服务。
  • 建立虚拟护理站,一名护士可在单一用户界面上监护跨单位和/或机构的 50 多名患者。
  • 利用相同的基础设施创建虚拟指挥中心,对患者进行全程监护。

无论采用哪种部署方式,Sickbay 都将控制权交还给医疗保健团队,并为医院带来直接效益。所报告的效益包括人员、资金和年度维护费用降低,以及医护人员、患者和家属满意度提升。最重要的是,使用 Sickbay 的客户看到护理质量和疗效改善的直接影响,包括住院期间、蓝色代码事件、ICU 转移次数、通气时间、双重签名时间和治疗时间缩短。

这样的结果为其他医院提供了重新思考患者监护并实现近乎实时、以患者为中心的 AI 愿景的途径。医疗行业领先者已证明,通过增加虚拟人员来重返以团队为基础的护理工作,有助于扭转人员配备危机。“这并不是要将护士从患者身旁夺走,而是接受某些任务并集中进行处理,” Rusin 表示。“在可预见的未来,护士、医生和呼吸治疗师的数量永远无法满足所有需求。我们需要让床旁团队回归床旁护理。灵活的虚拟护理支持使这一点成为现实。”

改变护理经济学

Sickbay 能够改变患者监护的经济效益,并直接影响到质量和疗效改善。

与不同设备(无论何种功能或品牌)集成的能力是关键所在。“我们营造出的环境允许医护人员获取以前从未有过的数据,并在此基础上以经济上可行的方式构建内容,” Rusin 指出。

对于医疗保健服务提供者而言,拥有可用数据可以改变游戏规则, MIC 战略市场参与执行副总裁 Heather Hitchcock 表示。一位医生指出:“一分钟内,我必须处理 300 个数据点。任何机器都无法替我做出决定,但 Sickbay 可以帮助我更快地处理数据,从而做出正确的决定,拯救更多生命。”

从可扩展患者监护到预测分析

Sickbay 的价值不仅在于对患者进行近乎实时的监护和虚拟护理,还在于改善长期治疗效果。Sickbay 支持利用相同数据来开发和部署预测分析,以帮助提前应对恶化和风险。

客户目前在 Sickbay 上持续开发分析功能。例如,某客户将 32 个近乎实时的多模态风险评分集成到其虚拟护理工作流程中。另一个客户创建了一种可通过分析两个单独监护设备生成的数据来确定患者理想血压水平的 Sickbay 算法。“这种特殊的分析方法需要床旁监护仪的血压波形和另一个监护仪的脑血密度测量值,” Ruin 指出。

利用数据拯救生命

现在对连续护理患者进行治疗,将使未来的护理工作得到改善。要做到这一点,可靠、具体的数据是起点。如果没有该数据,临床医生只能凭自己的判断来解决身体最紧迫的护理需求,而得不到他们所需的数据驱动决策支持。这样做速度慢、成本高并且对护理人员不公平,最终也无法为患者带来最佳效益。

要真正实现治疗与其服务对象同样具体和个性化的未来,医疗保健必须以最有影响力的方式利用患者数据,即具体、准确、接近实时、与供应商无关、可转换和可立即访问。利用时间序列数据的力量,医疗保健服务提供者能够比以往更有效地帮助更多的人。毕竟,拯救生命是医疗保健的首要任务。

 

由 insight.tech 主编 Georganne Benesch 编辑。

利用实时分析技术改造工厂车间

制造商面临着巨大的压力,必须利用所有可用的智能功能,如机器视觉和 AI 驱动的视频分析等技术。这些都是实现从缺陷检测和预防到工人安全等一切事项的关键工具。但很少有制造商是 AI 领域的专家,要掌握的东西很多,要处理的事情也很多,更不用说要为未来的重大技术投资做好准备。这些新技术需要具有适应性和互操作性。

参与有关需求讨论的人员包括 Jonathan Weiss,工业 机器 视觉提供商 Eigen Innovations 的首席营收官;以及 Aji Anirudhan,人工 智能 视频分析公司 AllGoVision Technologies 的首席销售和营销官。他们讨论了实施工业 4.0 的挑战,制造商如何利用数据驱动的工厂,以及 AI 如何继续改变工厂车间(视频 1)

视频 1。来自 AllGoVision 和 Eigen Innovations 的行业专家讨论 AI 在制造业领域的变革性影响。(资料来源:insight.tech

机器视觉和 AI 如何应对工业 4.0 挑战?

Jonathan Weiss: 我们所做的只是用于质量检验的机器视觉,我们专注于工业制造。传统视觉系统非常适合检测生产足迹问题,通常情况下,它们会告诉您产品是好是坏。但如何帮助人们预防缺陷,而不仅仅是告诉他们已产生缺陷?

这正是我们软件的独特之处。我们不仅利用视觉系统、摄像头和不同类型的传感器,还直接与过程数据记录器、OPC UA 服务器连接,甚至在控制网络层面直接连接 PLC。我们提供深入了解制造零件的实际变量和指标,以及流程中出现的问题和导致缺陷的变异类型。我们的很多工作都是基于 AI 和 ML。

视频分析如何解决当前工业环境中的工人风险问题?

Aji Anirudhan: 这个行业的首要问题是如何加强自动化,如何引进更多机器。但人不会从工厂车间消失,这基本上意味着人与机器之间会有更多的互动。

联合国的一些数据表明,全球企业每年在工作场所人身伤害和财务损害方面花费 26800 亿美元。这一成本是每个制造商都非常关心的主要问题。传统上,他们所做的是关注发生事故的不同场景,并制定政策以确保不再发生此类事故。

但这并不足以降低成本。发生事故的原因可能多种多样;本来未预料到的场景仍然可能造成潜在事故。因此,必须建立一个实时机制,以确保事故从一开始就不会发生。

这意味着,如果车间员工应该佩戴安全帽而没有戴,就会被识别出来,以便一线经理可以立即处理,即使事故还没有发生。最重要的是:减少事故意味着降低保险成本,从而提高公司的盈利能力。

在工业制造领域,它是人的不同行为模式、人与机器或人与车辆之间不同互动的组合。我们认为,不同客户的工人安全要求也不尽相同:石油和天然气公司对设备、防护装备和安全计划的要求与制药公司不同。

例如,我们曾与印度一家公司合作,该公司的生产线上有液态金属,有时会发生金属溢出的情况。从人员安全和工厂安全的角度来看,这是非常危险的。公司希望对其进行持续监控,并在发生任何情况时立即报告。 

目前,制造商是否已准备好迎接数据驱动型工厂的挑战?

Jonathan Weiss: 制造商作为一个整体,普遍认同数字化和自动化的必要性。我认为进行大规模部署的正确道路上仍需大量的指导——从哪里开始;如何确保计划的效率和成功;以及如何将规模扩展到工厂以外。

我所在的领域,它正在帮助工业企业克服摄像头系统各自为政、无法与其他企业系统通信的难题。此外,还无法跨生产线、工厂甚至跨机器扩展这些 AI 模型。这正是传统摄像系统的失灵之处。在 Eigen,我们已经破解了这一难题。

但 Aji 和我破解的只是一个更大谜题中的一小块,这个谜题的一个共同点就是数据。我们为所有生产数据创建单一信息源,以此方式来推动可行的洞察或自动化。简而言之,它是放置所有数据的单一位置,包括质量数据、流程数据、安全数据、现场服务类型数据、客户数据、保修信息等。然后开始与各种企业级应用程序建立双向连接,这样 ERP 就能了解质量的着眼点,反之亦然。

拥有单一信息源,然后采用正确的策略和架构,将各种类型的软件部署到整个工业企业的单一信息源中。

制造商如何将机器视觉应用于工厂运营?

Jonathan Weiss: 首先了解要解决的问题是什么。您希望减少的最频繁发生的最高价值缺陷是什么?

在焊接领域,有些东西是人眼通常无法看到的,因此视觉系统变得非常重要。例如,复杂的装配工艺流程需要红外摄像机,由于人眼无法轻易看到零件的整个几何形状,因此无法了解某个地方是否存在缺陷,或者要找到缺陷非常困难。

找到一个能提供最大价值的用例,然后再从该用例回溯。然后是选择技术。我一直鼓励人们寻找适应性和可扩展性强的技术,因为如果一切顺利,它可能不会成为工厂范围内部署的唯一一个视觉系统。

Aji Anirudhan: 目前,大多数工厂都安装了闭路电视摄像头,以满足合规和其他需求,我们在 AllGoVision 的要求可以轻松与来自摄像头的输入/输出匹配。摄像头的位置或照明状况可能有所不同。或许非常特定的用例需要不同的摄像头,也许是热成像摄像头。但在 80% 的情况下,我们可以重新利用现有的基础设施,在视频信号的基础上进行传输。

与英特尔等合作伙伴合作有多重要?

Aji Anirudhan: 我们是首批采用英特尔开放式窗口架构的视频分析提供商之一。我们一直在使用英特尔处理器,从早期版本一直到现在的 Gen4 和 Gen5,性能实现了显著提升。英特尔在提供适合运行基于深度学习的模型的平台方面所做的工作对我们来说非常有用。

运行深度学习算法的一些新的增强功能,如集成 GPU 或新的 锐炫 GPU,我们非常开心能够利用这些设备提高运行算法的效率。英特尔是我们当前和未来战略的重要合作伙伴。

随着 AI 领域不断发展,还有哪些机遇?

Jonathan Weiss: 在 Eigen,我们进行各种类型的检查。例如,检查在纸张上涂抹特殊涂料的机器。机器的一个部件会在纸张通过时对其进行分级,你只有 8 秒的时间来收集机器上两毫米半的涂层累积情况,否则将会造成价值约 15 万美元的损失。而这种情况在一年中可能会发生很多很多次。在整个换班过程中,甚至也会发生多次。

在思考未来的情况时,我们有 8 秒钟的时间来检测累积情况并自动采取行动防止设备故障。我们现在只需一秒钟就能完成这项工作,但想想我们未来在三分之二秒或半秒内就能完成这项工作,真是令人兴奋。

因此,我认为未来的技术将变得更加强大,而我们使用技术的方式也将变得更加多样。我看到许多这类复杂工具的民主化越来越受欢迎。在 Eigen,我们从头开始构建软件,旨在让生产领域的任何经验水平的任何人都能构建视觉系统。这对我们来说非常重要,对我们的客户也非常重要。

虽然在我们的领域,我们一直对产品质量保持特别关注,但正如 Aji 刚才提到的,人不会消失。我认为这恰恰说明了人们对 AI 的一个普遍误解,即 AI 会取代人类,夺走工作岗位。我们在产品质量方面看到的情况实际上恰恰相反:通过将视觉系统和软件工具引入工厂,我们使工厂能够更快地检验零件。现在,他们能够生产更多的产品,这意味着公司能够雇佣更多的员工来生产更多的零件。

我的很多客户都表示,他们工厂中人员流动率最高的是目视检验员。这可能是一份让人不舒服的工作,连续 12 小时站在原地盯着从身边经过的零件,头都要转晕了。因此,这种需求可以维生素和止痛药来类比。对这些企业来说,它可能是一种止痛药,而不再是维生素。我们正在帮助缓解组织痛点,这并不是什么可有可无的东西。

Aji Anirudhan: 有趣的是的是所有生成式 AI,以及我们如何利用这些技术。视觉大模型基本上着眼于解释复杂的视觉或复杂的场景。例如:有一种环境,车辆可以通行,但人却不能通行。客户说:“是的,如果工人推着手推车,他也可以沿着同样的路径前进。”但如何界定一个是否有手推车?

因此,我们正在研究类似于 LVM 的新增强技术,以推出新的用例。未来几年,生成式 AI 技术将帮助我们以更好的方式解决工厂中的这些用例。但我们还有很多事情要做。因此,我们对技术感到兴奋;我们对正在进行的实施感到兴奋。我们期待着与世界各地的客户开展更大规模的业务。

相关内容

要了解 AI 驱动型制造业的详情,请收听 AI 驱动型制造业:创建数据驱动的工厂,并阅读 机器视觉解决方案:检测和预防缺陷。如需了解 AllGoVision 和 Eigen Innovations 最新创新情况,请关注他们的 Twitter/X 账号 @AllGoVision 和 @EigenInnovation,以及 LinkedIn 账号 AllGoVision 和 Eigen Innovations Inc.

 

本文编辑人员为 文字编辑 Erin Noble.

利用下一代处理器和 COM Express 对 AI 工作负载进行扩展

X 射线、超声波和内窥镜检查机会产生大量数据,有时数据太多以至于无法理解。作为响应,医疗设备 OEM 将 AI 直接集成到医疗成像和诊断机器中,使临床医生和患者都能更高效、更有效地使用筛查程序。

支持启用 AI 的医疗成像和诊断需要具有显卡和计算性能的高端硬件来实时执行智能成像工作负载。直到最近,实现这些功能的最简单方法还是通过独立加速器——就前期硬件成本和功耗而言,这种方法成本很高,但效率很低。

但迄今为止,成本最高的设计决策是错误的系统架构。AI 正在迅速发展,因此如果没有灵活、适应性强和可升级的系统硬件,设备可能在被充分破坏之前就过时了。

“AI 工作负载发展如此之快,当你开始谈论硬件时,就有点危险了,” 嵌入式解决方案的全球领导者 congatec AG 公司的基础设施细分市场经理 Zeljko Loncaric 说。“这是医疗设备设计人员面临的最重大挑战之一。他们还面临着在长生命周期系统中实现新功能的障碍。”

基于英特尔® 酷睿 超移动处理器的 COM Express 模块可应对这些挑战。由于集成了 GPU 和 NPU,它们在 AI 工作负载处理方面提供了卓越的性能和效率。其具有固有的模块化设计,可以简化初始设计过程,并且能够在处理器的不同世代之间实现轻松升级。

平衡边缘 AI 在嵌入式计算中的寿命和创新

由于医疗成像设备必须经过全面的认证流程才能使用,因此它们的生命周期平均为十年或更长时间。与此同时,AI 技术是医疗成像的一个有意义的进步,具有显著提高超声波、移动超声波、内窥镜机、X 射线等诊断效率和准确性的潜力。

但是,面对重新设计和重新认证医疗设备的时间和成本,原始设备制造商在没有极具引人注目的商业案例的情况下,对过渡到支持 AI 的下一代平台犹豫不决。如果无法回答一个系统设计将保持多久的相关性,那么这个商业案例就变得不那么引人注目了。

英特尔新推出的酷睿超移动处理器,是第一个集成 NPU 的 x86 处理器,也是当今市场上能效最高的 SoC 产品家族之一。集成的 NPU 支持高级 AI 工作负载,而不会增加独立加速器的成本和复杂性。结合 SoC 领先的每瓦特性能,医疗设备设计人员可以在资源有限的边缘 AI 部署中更好地管理功耗和热效率。

Congatec 的产品线经理 Maximilian Gerstl 指出:“在移动超声设备和其他电池供电系统中,处理器的每瓦性能也非常有趣。”“英特尔对架构所做的工作令人印象深刻。这些数字从性能来看非常出色,不仅在 CPU 方面,而且在显卡方面也是如此。新处理器还为客户提供了前所未有的灵活性,允许他们在保持相同外形的情况下跨多代升级系统。”

如果没有一项伟大的新技术出现,组织将在同一个模块上停留 10 年或更长时间,这样他们就不必重新认证,”他继续说。“英特尔酷睿超移动处理器是一个巨大的进步。医疗保健组织必须考虑更改它。”

开放式标准模块加快通道系统升级

最新的 congatec conga-TC700 COM Express 紧凑型模块将英特尔酷睿超移动处理器的处理性能和应用就绪的 AI 功能集成在即插即用的外形中。医疗设备设计人员可以利用该模块作为构建高效的边缘 AI 系统的捷径,同时显著缩短上市时间并降低总拥有成本 (TCO)。由于 COM Express 是由全球技术联盟 PICMG 管理的开放式硬件标准,TC700 提供了与供应商无关的系统升级路径,通过该路径,可以简单地将遗留模块替换为具有相同接口的性能更高的模块。

“快速交换硬件的能力意味着组织可以让其应用程序运行很长时间,” Gerstl 解释道。“尽管他们必须重新认证新的硬件组件,但他们可以从以前的应用程序中引入许多软件和硬件设计。”

由边缘 AI 解决方案提供支持的智能医疗保健

Conga-TC700 由 congatec 专注于 OEM 解决方案的生态系统提供支持,该生态系统具有高效的主动和被动热管理解决方案、长期支持和随时可用的评估载板。该公司还在探索开源英特尔® OpenVINO 工具套件如何为其客户开发和部署 AI 视觉系统提供支持。据 Gerstl 称,该公司正在利用特定用例进行早期基准测试,以帮助客户更快地启动和运行应用程序。

对于 congatec 来说,英特尔酷睿超移动处理器的可用性代表着下一代边缘 AI 设备在价格、性能和功耗方面取得了相当大的进步。对于医疗设备 OEM 而言,这些处理器提供了通往支持 AI 的新成像和诊断设备的引人注目的路径。

“我们将继续启用 AI 加速、硬件和软件,并将其引入我们的产品,” Gerstl 说。“我们希望实现这一新趋势。”

 

本文由 insight.tech 的编辑主管 Georganne Benesch 编辑。

利用实时视频将 AI 用于加强工作场所安全

工作场所安全是各行各业都面临的现实问题。近期发布的一份报告指出,每年有高达 3.74 亿人遭受工伤事故。这是一个可怕的数字,但幸运的是,企业可以采取行动降低风险。

例如,许多企业已经在基础设施中安装闭路电视摄像头 (CCTV) 系统用于日常安全和资产管理。这些设备还可用于识别潜在危险等其他用途,以减少工伤事故。

这种视频分析技术应用的前提是,偶然一两次发生可能构成小事故,但频繁的重复则可能预示着更广泛、令人担忧的模式。就员工健康和安全而言,这些负面模式可能代价高昂,但可以通过研究视频监控录像并采取相应措施加以预防。

资产密集型行业的安全分析

视频分析软件解决方案提供商 AllGoVision 最初涉足闭路电视领域时,重点关注的是安全和资产管理,但很快意识到该技术超越安全领域的潜力。据 AllGoVision 首席销售和营销官 Aji Anirudhan指出,该产品在各行各业中保护员工健康的作用越来越明显。

制造业、能源和公用事业等资产密集型行业尤其能从视频分析中获益,从而改善员工的工作条件。在这些行业中,工人安全可能会在两个基本方面受到影响:第一,当现场情况发生急剧变化时。当高温金属处理不当或暴露于石油或天然气泄漏产生的有毒烟雾时,会发生烧伤等事故。此外,工人也可能因不严格遵守安全规程危及自身健康。例如,在高风险工作条件下不穿戴适当的个人防护装备 (PPE) 会增加受伤的风险。

Anirudhan 解释道,传统的工人安全方法相当被动。员工健康安全团队对各种可能发生的有害情况进行风险评估,并相应制定培训方案。“每当发生事故,他们都会进行调查并努力更新政策,以尽量减少事故的发生,”他指出。虽然全公司范围的政策可减少工伤事故的数量,但问题依然严重。Anirudhan 补充道,这就是为何“任何能够深入了解不安全行为模式的解决方案都有助于防止事故的发生”。

AllGoVision 致力于成为这样的解决方案。特别是石油和天然气领域的能源和公用事业公司,因违规造成的安全问题比比皆是。Anirudhan 认为,无论是油田钻井设备,还是燃料的运输和存储,每一步出错的可能性都很大。

AI 工作场所安全机制

为了不影响工人的安全, AllGoVision 利用 AI 实时分析现场情况。闭路电视系统可直播视频数据,AI 安全分析软件可对其进行评估。该系统能够实时发现违规行为或问题区域,并提醒一线管理人员主动应对这些挑战。它提供的仪表盘可帮助了解安全规程遵守现状,并根据改进计划监控进展情况。Anirudhan 说,员工们也希望成为解决方案的一部分,这种分析可在没有采用“老大哥”监视方式的情况下讨论工作场所数据。

AllGoVision 特别重视数据隐私协议,仅保留元数据,而不保存单个工人的录像。该公司还致力于确保其模型无偏见,并聘请顾问确保遵守国际数据隐私法规。

经验丰富的安全分析提供商

AllGoVision 尤为突出的一点是,该公司利用其在视频分析方面的丰富经验来评估特定客户情况,并推荐能够实现预期结果的全面解决方案。该软件的即插即用格式意味着它可以与现有基础设施集成,添加数据层来获取信息。该公司与系统集成商合作,将解决方案集成到他们可能向客户提供的更大的视频管理包中。

在多个行业中执行工作场所安全规程的经历至关重要。“由于 AI 的民主化,几乎任何人都可以访问开源算法并创建视频分析。但将其推广到摄像头不同、照明度不同、期望值也不同的生产环境中,这是最具挑战性的部分,” Anirudhan 指出。“这正是我们的优势所在,我们能够解决不同垂直行业的安全和员工工作效率问题,尤其是在石油天然气、公用事业和制造业。”

Anirudhan 说,多年来,多年来,AllGoVision 随着英特尔® 平台的更新换代而不断发展。该公司也是 OpenVINO 的早期采用者之一,并使用英特尔® 至强® 处理器。“运行算法的成本已经显著下降,可为我们的客户节省成本。我们认为这是与英特尔合作带来的巨大优势,” Anirudhan 指出。

AI 工作场所安全的演变

Anirudhan 非常开心 AllGoVision AI 拥有工作场所安全的众多用例,包括建筑物和基础设施火灾烟雾检测或人群控管。AI 在工作场所安全领域的应用仍处于初级阶段,这为 AI 驱动的解决方案提供了巨大的机会,从而产生重大影响。

以政策为导向并不断重复实施的时代已经一去不复返。Anirudhan指出:“客户已发现转向实时主动方法的明显价值。”预计未来会监控更多参数,包括工人的疲劳程度。他补充道:“工作场所将增加更多可穿戴设备、传感器和物联网设备,它们都将添加到机器和人员管理的不同用例中。”

此外,Anirudhan 认为生成式人工智能在解决更复杂的用例,尤其是涉及人机交互的用例方面具有巨大潜力。

AllGoVision 正在努力解决令人担忧的工作场所安全统计问题。Anirudhan 说:“如果 AI 能够真正解决其中一些挑战,我们就能产生巨大的社会影响。”

 

本文由 insight.tech 的编务总监 Christina Cardoza 编辑。

利用基于音频的生成式 AI,协调创新

人工智能是许多不同技术的总称。生成式 AI 是我们经常听到的一个话题,尤其是 ChatGPT。ChatGPT 得到了广泛报道,但绝不是生成式 AI 行列中唯一一员。英特尔的 AI 软件架构师兼生成式 AI 推广者 Ria Cheruvu 最近一直感兴趣的一个问题是音频领域生成式 AI(视频 1)

视频 1。英特尔生成式 AI 传播者 Ria Cheruvu 探索基于音频的生成式 AI 的商业和发展机遇。(来源:insight.tech

但无论何种类型的生成式 AI 都令人震惊,开发人员并非始终确切知道从哪里开始,或者开始之后,如何优化模型。与英特尔合作,可以真正简化流程。例如,初学者开发人员可以使用英特尔® OpenVINO 笔记本电脑,利用教程和代码示例,帮助他们开始使用 GenAI 。然后,当他们准备好提升到一个新水平或准备扩展时,英特尔将随时帮助他们。

Ria Cheruvu 与我们讨论 OpenVINO 笔记本电脑存储库,以及生成式 AI 用于音频的现实应用,以及适用于呼叫中心的方面与适用于音乐家方面之间的差异。

生成式 AI 的不同领域有哪些?

就生成式人工智能的类型而言,这一领域无疑正在不断发展。ChatGPT 并非唯一!当然,文本生成是一种非常重要的生成式 AI,但也有图像生成,例如,使用 Stable Diffusion 等模型来生成艺术、原型以及不同类型的图像。还有音频领域,您可以开始制作音乐,或者制作合成化身的音频,以及许多其他类型的用例。

在音频领域,快速运行时尤为重要,这是常见的痛点之一。您希望模型超级强大,能够快速生成高质量输出的结果,那就需要大量计算。因此,我想说,优化生成式 AI 模型的技术堆栈绝对至关重要,这也是我在英特尔日常工作中研究的东西。

音频生成式 AI 的具体商机是什么?

使用语音人工智能或对话式人工智能来读取和处理音频,这确实非常有趣,这就是您使用语音代理(例如手机上的语音助手)所做的事情。将其与音频生成式 AI 比较,您实际上是在创建内容,例如,能够生成合成化身或声音,以便打电话和交谈。首先想到的商业应用肯定是呼叫中心,或者是具有使用这种所创建音频的模拟环境的元宇宙应用。

但创意领域、内容创作领域也有一些非传统商业用例,我们开始看到一些应用与音乐生成式 AI 相关。对我来说,这非常令人兴奋。英特尔开始研究生成式 AI 如何补充艺术家的工作流程:例如,创建作品,使用生成式 AI 来采样节奏。音乐家和音乐制作人如何利用生成式人工智能,将其纳入内容创作工作流程之中,这也有一个非常有趣的文化元素。

虽然它不是一个传统的商业用例,比如呼叫中心或使用音频进行零售的交互式自助服务终端,但我认为,音乐生成式 AI 在内容创作方面有着巨大的应用。最终,它还可以进入需要生成声音的其他类型领域,例如,创建用于 AI 系统训练的合成数据。

音频生成式 AI 的开发流程是什么?

生成式 AI 领域目前正在采用几种不同的方式。其中一种肯定是改造已有的模型架构,以用于其他类型的生成式 AI 模型。例如,Riffusion 基于图像生成模型 Stable Diffusion 的架构;它只是生成波形,而不是图像。

我最近与从事音乐领域研究的人交谈,我们讨论的一件事是,您可以为这些音频领域模型提供的输入数据多种多样。可以是音符,也许是钢琴作曲的一部分,一直到波形或特定类型的输入,专门用于 MIDI 格式等的用例。有多种多样的数据。

训练和部署这些模型需要哪些技术?

我们一直在调查许多有趣的生成式 AI 工作负载,这些工作负载是英特尔 OpenVINO 工具套件和 OpenVINO Notebook 存储库的一部分。我们将许多音频生成的关键示例当作非常有用的用例,用于提示和测试生成式 AI 功能。我们曾经与英特尔的其他团队合作,使用 Riffusion 模型,创作 Taylor Swift 类型的流行节奏,一直到更高级的模型,生成与某人说话的内容相匹配的音频。

我看到 OpenVINO 的一件事是,能够优化所有这些模型,特别是在内存和模型大小方面,而且能够在边缘、云和客户端之间实现灵活性。

OpenVINO 实际上针对该优化部分。有一个基本概念,即生成式 AI 模型的大小和内存占用面积很大;而所有这些模型的基础,无论是音频、图像还是文本生成,其中某些元素非常大。我们使用压缩和量化相关技术,将模型占用面积减半,不仅能够大幅减少模型尺寸,而且确保性能相差无几。

所有这些都源于一个非常有趣的本地开发概念。音乐创作者或音频创作者希望在创作内容时使用电脑,在从事密集型工作时,在云端工作,例如收集音频数据、录音、注释,以及与不同专家合作创建数据集。然后他们可以在电脑上执行其他工作负载,然后说:“好吧,现在让我在系统上本地生成一些有趣的流行节奏,然后在房间里制作原型。”

开发人员开始使用生成式 AI 有哪些示例?

我真正喜欢讨论的一个例子是,您如何正确地使用我们在笔记本存储库中展示的 OpenVINO 教程和工作负载,然后投入实际运用。在英特尔,我们与 Audacity 合作,后者是一个基本上实现开源音频相关编辑创作的工具。它是一种用于音频编辑的一站式 Photoshop 类型的工具。我们所做的一件事是通过我们提供的插件,将 OpenVINO 与其集成在一起。我们的工程团队从 Python 获取 OpenVINO Notebook 存储库中的代码,将其转换为 C++,然后将其部署到 Audacity 之中。

这样就能实现我之前提到的性能和内存改进,但它也直接集成到相同的工作流程中,许多编辑和操作音频的人也在利用此工作流程。您只需挑选一段声音,然后说 “生成”,OpenVINO 就会生成其余部分。

这是一个工作流程集成的例子,可用于艺术家工作流程;用于电影行业为语音制作生成合成音频;或用于零售行业中的交互式自助服务终端;或用于医疗保健领域的患者与医疗人员对话。工作流程的无缝集成是英特尔非常期待推动和帮助协作的下一步。

生成式 AI 还有哪些,特别是音频生成式 AI?

说到音频生成式人工智能,我认为在这个领域的任何一个特定时刻都是 “眨眼即失”。看到添加了如此众多工作负载,真是太神奇了。但是,展望不久的将来,也许是今年年底或明年,我能看到的一些发展肯定是围绕我之前提到的那些工作流程,以及确定您到底想在哪里运行,是在本地系统上,还是在云上,还是在两者的混合体上?这绝对是我真正感兴趣的事情。

我们正在尝试采用英特尔® 酷睿 Ultra 和类似类型的平台,在 AI 电脑上生成音频,当您坐在房间里与一群音乐家一起制作原型并玩音乐时,理想情况下,您不必访问云端。相反,您可以在本地这样做,将其导出到云端,然后在本地和云端之间往返移动您的工作负载。关键在于,我们如何将利益相关者纳入该流程,即我们如何准确创建生成式 AI 解决方案,将其实例化,然后随时维护?

最后,您能给我们留下一点关于生成式人工智能的启示吗?

现在,生成式人工智能这个领域光鲜亮丽,但几乎人人都能看到当中的价值,而前提是有一个面向未来的战略。英特尔对这个行业的价值主张,是能够携手开发人员,向他们展示他们能够利用这项技术做什么,以及在他们实现目标的每一步上给予帮助。

用于音频的生成式 AI (通用生成式 AI)的发展如此之快。因此,请密切关注工作负载、评估、测试和原型设计;在我们迈进音频生成、合成生成等众多领域的新时代之际,这些都绝对是关键。

相关内容

要详细了解生成式 AI ,请阅读生成式 AI 解决方案:从炒作到现实,并收听生成式 AI 在音频创作中构成新机遇。有关英特尔的最新创新,请在 X @IntelAILinkedIn 上关注他们。

 

本文由文案编辑 Erin Noble 编辑