「行動銀行(Bank on Wheels)」與邊緣運算服務農村

回想您之前在 ATM 領錢、利用信貸或存款。我們大多認為這些基本金融服務很正常,但全球數百萬農村居民沒有銀行帳戶,抑或即使有帳戶,仍無法便利享用銀行分行的服務。

「在偏遠地區開設新分行,不符合銀行的成本效益。」智慧自助服務機和數位看板專家、Bits & Bytes 總經理 Amit Jain 說,「因為農村地區的銀行常面臨停電、網路中斷等基礎設施問題。」

如果民眾無法利用銀行,可不只是不方便。事關公民無法參與整體經濟的公平問題。但新型態的邊緣解決方案以出人意表的方式解決這個問題:拉近銀行分行與民眾。

多虧邊緣運算硬體與電信網路支援,Bits & Bytes 開發「行動銀行」已改善印度偏遠社區的金融服務,並準備投入全球其他市場。

農村銀行分行實際案例

Bits & Bytes 印度行動分行部署,是解決方案實用的典範。馬哈拉斯特拉州是印度人口最多、工業發達的地區,但農村地區的人口占比就超過 50%,所以很多公民無法享有都市應有的服務。

Bits & Bytes 與大型國家銀行合作開發解決方案,實現傳統分行的眾多功能,而且可以視需要移動據點。

系統的核心是數位服務機,可執行堅固、邊緣適用的運算硬體,並內建攝影機、生物識別驗證指紋掃描器,及使用者互動用的觸控板。安裝在貨車的服務機可以前往各個農村地區,並隨時停靠。

系統採用兩種方式與銀行連線。數據卡透過標準蜂巢式網路,提供系統與銀行的集中式伺服器通訊,而銀行員工可以隨行,協助新客戶瞭解如何使用這項技術並回答問題。

行動服務機協助客戶開戶、取得金融卡,或進行提領現金、存款、申請貸款、支付帳單、轉帳等交易。

部署後,客戶對行動銀行讚不絕口。「客戶之前得付費請專人前往附近分行代為執行交易。」Jain 說,「他們很高興能有自行完成交易的初體驗。」

確保邊緣合規性與安全性

金融系統需嚴守各國不同的安全性與合規性規範。靈活設計與邊緣功能有助於克服這些難題,並實現在不同市場部署解決方案。

例如,Bits & Bytes 解決方案利用自家安全的網路連線和生物識別驗證功能,遵循印度嚴格的「瞭解客戶(know-your-customer)」法。行動銀行服務機執行基本的生物識別掃描後,與連線中央政府資料庫的銀行伺服器通訊。驗證後,服務機會預先填寫申請表,所以您只要在觸控板簽名,就能開立帳戶。

簡潔的基本設計(透過蜂巢式網路連線,邊緣 IPC 和模組化硬體與中央伺服器連線)讓系統立即化為銀行現有的網路。同時顯示邊緣不儲存個人使用者資料。資料皆保存在金融機構的網路,彰顯系統的資料隱私權和網路安全防護。

而且,行動分行可以輕易配合新地區不同的資料隱私權和法規。鑑於金融機構已符合國家/地區的規範,服務機軟體不必大幅量身修改。

Bits & Bytes 與 Intel 技術合作對解決方案的影響甚鉅。「Intel 硬體提供絕佳的邊緣運算平台。」Jain 說,「在產品開發方面,Intel 也是關鍵角色,協助我們調整現成的 Intel 技術推出新產品。」

邊緣運算推動數位轉型

解決農村銀行不足、增加客戶數量的能力可能吸引銀行數位部門和金融業整合商(SI)關注。

邊緣運算的興起不只支援如 Bits & Bytes 行動銀行服務機的系統,也可能解決多個產業的難題。我們可以想見未來幾年會看到更多邊緣部署的創新解決方案,舉凡農業自主移動機器人或 5G 專網。

行動銀行是目前數位轉型浪潮的典範,而 AI 會在近幾年開創更多機會。

「我們活在各領域技術快速進展世代,所以作為公司,我們要提供各種垂直產品。」Jain 說,「五年後,AI 和物聯網會普及,眾人和組織都能享受數位轉型帶來的好處。」

 

本文編輯 insight.tech 編輯總監 Georganne Benesch

影像分割:探索 Segment Anything 的威力

技術創新十分神奇,現在更是日新月異。(但更新不至於快到我們不再提起:「如果當初有這個工具,我可以省下多少時間和精力啊!)這話套在 AI 和電腦視覺尤其適用,兩者改變各行各業的營運方式,而且對眾多企業而言堪稱是至寶。而在完整的 AI/電腦視覺版圖中,影像分割是關鍵的一環。

Intel 的 AI 技術傳教士 Paula Ramos 與我們共同探討這個瞬息萬變的主題。她提到影像分割過去、現在和未來的解決方案、深入討論 Meta AI 最近推出的 Segment Anything 模型(SAM)(影片 1),並說明 Intel OpenVINO 工具組提供的資源可讓 SAM 的效能更佳

影片 1。Intel 的 AI 技術傳教士 Paula Ramos 論述支援日後影像分割的近期進展。(資料來源:insight.tech

影像分割對電腦視覺的影響是什麼?

電腦視覺工作分為很多類型,我想其中就屬影像分割最為重要。影像分割在物件偵測、辨識、分析發揮決定性的作用。或許我們該問:影像分割為什麼如此重要?答案很簡單:影像分割可區分背景與個別物件,或個別物件與其他物件。我們可以透過影像分割定位重要資訊、建立特定物件的計量指標、擷取一些功能,協助瞭解特定情境……這些對電腦視覺再重要不過。

過去組建影像分割解決方案時,開發者會面臨哪些挑戰?

我的博士論文研究農業的影像分割,並面臨許多挑戰,因為分割物件的技術有很多(閾值、邊緣偵測、區域增長),但沒有一體適用的方法。您甚至必須根據使用的技術,仔細定義最佳方法。

我的研究是偵測咖啡豆,可是咖啡豆都大同小異,十分相像!或許紅色底色也是問題,導致執行影像分割演算時出現過度分割(合併物件),再不然就是分割不足,部分果實消失不見。

涉及影像分割時,環境的光線持續變化,各種攝影機解析度不同,資料更難獲取,是一大挑戰。而且攝影機原則會移動,導致影像模糊,或出現雜訊。偵測邊界也是難題。除此之外,傳統影像分割還面臨縮放和效率的挑戰。運算成本會因為影像解析度或資料集的大小攀升,所以即時應用可能受限於此。

大多時候,這些傳統方法需要人為干預才能使用。如果當初有最新影像分割技術,我可以省下很多時間。

Meta AI 的 Segment Anything 模型(SAM)為什麼重要?

我巴不得七年前就有 Segment Anything 模型!簡單來說,SAM 提升處理複雜資料集的效能。所以雜訊、模糊影像、低對比度等對 SAM 來說不再是問題。

SAM 的另一項優點是多功能和提示控制。不同於傳統方法(各種情境需要特定技術),SAM 的多功能方便使用者使用提示指定所需分割。而提示可以是點、方塊,甚至自然語言描述。

我很希望之前可以下令「我只要查看成熟的咖啡豆」或「我只要查看未成熟的咖啡豆」,並享有現有影像分割的靈活性。這種靈活性讓開發者可以處理各種分割工作。我之前也提到縮放和效率:SAM 處理資訊的速度比傳統方法快。所以這類即時應用更經濟永續,準確度也提升。

不消說,影像分析仍有一些限制需要人為權衡,但我們當然也會提升處理這些難題的效能。

Segment Anything 模型的商機是什麼?

目前所知,Segment Anything 模型在各種影像分割處理潛藏多種商機。例如,簡單建立內容或編輯內容、自動操作電子郵件,或建立即時特效。另外,SAM 的即時物件偵測也對擴增實境或虛擬實境領域有重大影響,互動體驗的虛擬元件因而得以實現。

抑或零售業可用於產品區分。SAM 會自動分割網路商店的產品影像,實現更有效的產品銷售。另一個可能的領域是,根據特定物件特色分類。不僅如此,我判斷影像分割可用於機器人和自動化,協助各種工作更精確地辨識、操作物件。自動駕駛就更不用說了。SAM 還能輔助醫療專業人員區分腫瘤或診斷更準確──儘管這類運用仍有很多疑慮。

我不會直說 SAM 可以解決這些業務,因為這些只是可能的運用。SAM 仍在開發、不斷改善。

開發者如何透過 OpenVINO 解除 SAM 的限制?

目前的 AI 趨勢帶來的優點是大量的開源模型。換句話說,SAM 可以享有開源模型的功能。OpenVINO 也是開放原始碼,所以很方便開發者使用這個工具組。我們每天在 OpenVINO 筆記本存放庫輸入多種 AI 趨勢(即 AI 領域的新知),並每隔兩三天上傳筆記本至存放庫。然後,我們有好消息要給開發者:OpenVINO 存放庫的 SAM 管道已最佳化。

目前存放庫有四部筆記本。第一部筆記本是我們一再提到的 Segment Anything 模型,也是最常見的。您可以直接使用 OpenVINO 編譯模型,或使用神經網路壓縮架構(NNCF)最佳化模型。

第二部是 Fast Segment Anything 模型。原始 SAM 是重型轉換器模型,所以需要大量運算資源。我們無疑可透過量化解決這項問題,但 FastSAM 使用 YOLOv8 分解 Segment Anything 工作為兩個連續階段。

另外是輕型 SAM 模型 EfficientSAM,大幅降低複雜度後突顯 SAM 的效能。最後一個資源是 OpenVINO 存放庫最近發布的「GroundedSAM」,即 GroundingDINO 與 Sam。概念是尋找周框方塊,同時分割周框方塊中的影像。

最棒的是,執行這些筆記本不需使用特定機器,筆記型電腦就可執行,並透過現有的模型一睹影像分割的潛力。

OpenVINO 會如何隨 SAM 和 AI 持續發展?

我想組建深度學習應用程式時,OpenVINO 是降低難度的絕佳工具。如果您已具備 AI 專業知識,不妨再深入瞭解 AI 趨勢,順便瞭解 OpenVINO 如何簡化日常工作。但如果您是開發新手,或非 AI 專業的開發者,OpenVINO 是最適當的起點,因為您可以查看我們提供的範例,及參考 Jupyter Notebook 每個儲存格。

我們保證繼續建立更多範例,及更多 OpenVINO 筆記本。我們優秀的工程師團隊會致力於更新,並努力建立實用的範例:日常可用的概念證明。

另外,AI 電腦去年 12 月上市。我想您不妨趁此機會瞭解 Intel 持續增強的功能,因為我們提升他們使用的硬體,開發者不必購買特定硬體執行最新的 AI 趨勢。您可以在筆記型電腦執行模型,也可以提升效能。

我幾年前是開發初學者,所以我認為當前一定要瞭解 AI 的運作方式、產業差距,棋先一著、改善並嘗試創新。

再者,我認為使用者要理解我們持續探索您的需求:您希望實現什麼?我們開放協作,所以敬請檢視 OpenVINO 筆記本存放庫,查看您可以如何貢獻一己之力。

相關內容

若要進一步瞭解影像分割,請收聽 Segment Anything 提升影像分割能力,並閲讀多功能的 Segment Anything 模型,及 OpenVINO 加速。若要瞭解 Intel 的最新創新技術,請關注 X 的 @IntelLinkedIn

 

本文由 Erin Noble 編審。

快速即時動態定位解決方案開發

駕駛時使用 GPS 作為導航輔助工具,有用但也令人沮喪。雖然即時指引是件好事,但經常必須等待衞星導航才能趕上實際行駛的路段。

這類位置映射的差異在最糟情況不過是有些擾人,但在需要更準確的定位資訊(例如自動駕駛)的應用程式時卻是無法接受。這也是為什麼即時動態定位(RTK)在需要準確定位的應用程式中越來越受歡迎的原因。

RTK 包括了將「校正資料」發送至移動中的接收器,從而提升傳統全球衛星導航系統 (GNSS) 所提供的定位準確性。傳統的 GNSS 接收器每秒接收一次位置資料,而 RTK 的頻率則高出 200 倍。最終結果是定位可準確至 1 或 2 公分,即使是在快速移動的車輛之中。

RTK「沙箱」提供了隔離測試

電子元件與技術解決方案供應商 Rutronik Elektronische Bauelemente GmbH全球創新技術管理主管 Stephan Menze 表示,雖然 RTK 已上市一段時間,但直到最近才變得經濟划算,可供更加廣泛使用。

為試駕嘗試技術,有時沒有捷徑。公司經常會發現,需要特定的基礎架構和各種不同的硬體元件,才能瞭解該解決方案是否值得實行。隔離的測試環境消除了這些障礙,提供更快的答案。這也是為什麼 Rutronik 開發了 Rutronik 配接器板 RAB4,專為 RTK 開發專案設計的沙箱。RAB4 降低了該技術的障礙、加速工程前階段和上市時間。

RAB4 是 Rutronik 系統解決方案的產品,於 2021 年推出,目標在於創建工具以促進銷售,並讓顧客測試特定市場。以 RTK 為例,這些其他市場可能操作無人機或割草機,甚至自駕,所有這一切都可以準確定位中得利 。 

RAB4 配接器板元件

RTK 需要 GPS 資料和發送校正的基站。Wi-Fi 或藍牙連線可以適用於本機基站。但規模較大、範圍更廣的專案(例如智慧城市或農業的實作)可能需要 LTE 無線技術。

RAB4 配接器板具有測試 RTK 技術的所有必要元件:Unicore 的高精度 RTK 定位模組;用於連線的 4G LTE 模組;必要天線;以及預裝 100 MB 資料的 SIM 卡,供公司下載結果,並將從 GNSS 接收器收到的資料與從 RTK 接收器收到的資料相比。(影片 1)

影片 1。RAB4 在隔離的測試環境中提供解決方案開發所需的一切。( 來源:Rutronik 系統解決方案

如果首選藍牙連接,RAB4 可使用 Arduino 介面,該介面與允許此類連接的基板 RDK3 相結合。RAB4 也可與文字轉語音配接器板連結,而配接器以高達 12 種語言輸出電池使用狀態、連線問題和其他資訊。Rutronik 也包含提供完整概念驗證套件的軟體。Menze 表示:「我們試圖向顧客展示系統的運作方式,最後顧客會為硬體和軟體的輕鬆使用感到開心」。

透過 Rover App 展示即時動態定位

為了更輕鬆使用 RTK,Rutronik 開發了一款「Rover」和相關 app,該公司在 Embedded World 2024 崁入式世界展覽會上的 Rutronik 攤位公開展示,訪客可在那自行控制。這個 rover 可透過 app 輕鬆操作,並且可以公分精準度來進行控制。

RAB4 使用 Arduino 介面與 Rutronik 系統解決方案的基板 RDK3 結合,可透過低耗能藍牙進行無線連線。參考站透過藍牙以即時通訊協定將測量到的 GNSS 位置發送至 rover。因此,rover 知道參考站的距離,可以利用其與基地台的相對位置以公分準確度導航,無需在地面鋪設線路作為邊界。

RAB4 的未來迭代正在規劃中,包括使用 Intel 實感攝影機在 rover 和其他應用程式上進行碰撞偵測的模型。Menze 表示,隨著應用程式擴展至實際情況,RTK 技術將需要高處理能力,為此 Rutronik 也將利用 Intel。沙箱系統目前使用 Infineon 微控制器,但計劃在未來的 RTK 和其他概念驗證解決方案的迭代中使用更高效能的Intel 處理器。搭載 Intel 處理器的新基板正處於開發階段。

至於 RTK 本身,隨着智慧城市越來越普及,預計未來會有更多的技術實作。在這類城市,交通燈號可以接收資料並調節交通流量,但若要安全地進行,則需要 RTK 提供準確定位。Menze 表示,即使可能需要耗費幾年時間,自動駕駛對於 RTK來說是令人振奮的使用案例。使用自動引導車輛(AGV)和無人機的最後一步也是同樣前景看好。

無論 RTK 技術的市場前景如何,Rutronik 解決方案都能提供必要元件,在機器人上路前評估其適合性。

 

本文由 insight.tech 編輯總監妮.貝內施(Georganne Benesch)編輯。

零售系統整合商輕鬆部署 AI 解決方案

現今的零售客戶越來越期待個人化與自助服務選項,導致商店技術相較以往更為複雜。為了領先競爭對手,零售商需要先進的系統,例如語音辨識、電腦視覺和 AI 支援的掃描器。這些系統不僅須能順利互相通訊,還須確保與現有機器和商品之間的流暢通訊。

系統整合商(SI)與零售商攜手協調最新技術,卻須花費無數時間評估所有不同的軟硬體選項,才能為每位客戶打造客製化解決方案。

現在有個更好的方法能搞定這一切。經驗豐富的解決方案整合商已測試及部署現今零售市場上眾多尖端技術,並擁有將相關技術整合至完整端對端解決方案的專業知識。透過與整合商合作,SI 可以節省時間、更完美迎合客戶需求,並確保他們提供的進階技術能按預期運作。

立即可用的零售 AI 解決方案

對於許多零售商而言,他們迫不及待迎來自動化與自助服務技術。BlueStar Inc. 是一間專為零售商、製造商、物流公司和其他產業提供技術解決方案的全球供應商,其業務開發經理 David Lester 表示,由於面臨員工短缺、客戶需求日漸嚴苛,以及通貨膨脹導致利潤緊縮,他們向 SI 尋求提升效率的方法。

我們力求提升效率並改善整個零售領域的客戶體驗,各項專業技術因而誕生。BlueStar 與 SI 密切合作,為零售業務整合了 30 種獨特的「一體式」解決方案,業務範圍包括快餐店、購物中心、飯店、雜貨店和精品店。Lester 表示,這些即用搭售套件包含 SI 部署所需的所有硬體、軟體與配件,盡量減少決策流程並縮短設置時間。

Lester 補充說明:「如果您是快餐店的系統整合商,想必最不願意做的就是逐一採購個別元件,用於掃描、付款處理、庫存管理以及銷售點系統涉及的其他事務。透過 BlueStar 一體式解決方案,您只須啟用解決方案、設置在櫃台上,就能立即開始使用。」

透過 AI 自動化技術協助系統整合商

Lester 表示,語音式 AI 是一種日益普及的零售技術(尤其適用於得來速快餐店)。針對此使用案例,BlueStar 與數位訂購互動式語音技術供應商 Sodaclick 合作。Lester 表示:「由於 Sodaclick 對話式語音 AI 總是能掌握客戶需求,因此深受我們喜愛。」

Sodaclick 對話式虛擬助理適用於得來速和多媒體資訊站,使用 Intel® RealSense 3D 相機識別前來的客戶,只要透過程式設計還能瞭解英文、西班牙文、中文和其他 100 多種語言及地區口音。該系統不僅能以自然流暢的語言回應客戶,還能根據人口統計資料、當日時段或零售商選擇的其他指標,提供建議及宣傳活動。

對於採用自助付款系統的商店來說,商品識別並非易事,而語音辨識與電腦視覺的整合功能正好派上用場。

位於喬治亞州費耶特維爾的完全自動化雜貨店 Nourish + Bloom Market 就是最佳個案。當商店的商品識別軟體未能正確辨識出沙拉和其他熟食產品時,該公司轉向 SI UST Global Inc 尋求協助。UST 與 BlueStar 合作,利用 Sodaclick Conversational Voice AI、UST Vision Checkout 系統、自動化付款處理器,以及多媒體資訊站、秤、纜線和其他相關硬體,藉此提升商店的結帳體驗。

現在客戶無需人工協助,即可在商店中購買任何商品。UST Vision Checkout 包括嵌入式攝影機,當人們從貨架取下已包裝商品並放入購物車時,系統就能立即識別並記錄商品價格。至於必須秤重的沙拉和其他熟食產品,客戶則可先向 Sodaclick 語音助理描述商品再放置於秤上。語音系統與電腦視覺攝影機之間達到完美協調,從而實現準確定價。所有商品都結算後,客戶只須告訴語音助理「立即付款」,接著就能用手機完成交易。Lester 表示:「客戶能夠享受流程順暢且極為方便的購物體驗。」

打造未來的零售基礎架構

隨著邊緣 AI 功能提升,BlueStar 正在拓展解決方案的範圍。例如,該公司目前正在開發與服裝技術公司 FIT:MATCH 的整合功能,FIT:MATCH 使用 Lidar 和 AI 擷取客戶體型的 3D 影像,並將其與資料庫中的數位分身進行配對。然後,系統就能針對產品和尺寸提供個人化建議。請前往 insight.tech 收聽我們的 Podcast:與 FIT:MATCH 攜手打造個人化 AI 購物體驗

BlueStar 與 Intel 攜手合作,因此能與諸如此類的創新應用程式並駕齊驅。Lester 表示:「對我們而言,特別是我們的一體式解決方案,Intel 扮演著至關重要的角色。不僅協助我們瞭解 AI 解決方案,並盡可能採用符合成本效益的部署方式,為我們帶來了莫大的助益。」

儘管某些全新 AI 應用程式聽起來很有未來感,但 Lester 認為這些應用程式會持續進化。「我發現人工智慧技術每個月都有所進展。我認為語音 AI 與數位招牌會持續進化,不僅變得更直覺易用,還能提升情境理解能力,提供更多個人化體驗並強化客戶參與度。」

 

本文由 insight.tech 編輯總監妮.貝內施(Georganne Benesch)編輯。

安全且易於部署:盒裝 5G 專用網路

有一段時間,5G 主要是消費者的必備品。畢竟,支援 5G 的智慧型手機可以實現更快的串流速度,並提升整體效能,這是幾乎人人求之不得的。隨著感應器驅動的資料分析興起,5G 的吸引力蔓延至企業與公共部門。每部裝置都是邊緣節點傳輸資料時,以低延遲可靠地存取衍生資訊成為 B2B 部門的首要任務。

彈性高效能運算解決方案的供應商 Trenton Systems 行銷副總裁 Yazz Krdzalic 表示,鑑於可靠且始終可用的資料至關重要,愈來愈多的公共部門和私營企業透過 5G 專用網路確保其業務流程。

從 4G 提升至 5G 就是「增加三個泳道:超可靠、低延遲的資料傳輸;安全性的控制與管理;以及同時容納成千上萬個互聯裝置的通訊能力。現在您可以利用單一技術處理最大的痛點,」Krdzalic 表示。

5G 專用網路提升資料安全性

儘管 5G 有許多優勢,但有一個弱點:取決於公共基礎架構。

發生自然災害時,包括手機訊號塔在內的所有通訊基礎架構可能會癱瘓。當急救人員需要安全傳輸立即的地面資訊時,衞星通訊是一個不穩定的備份。在這些情況下,更明智的做法是仰賴 5G 專用網路。

「由您架設自己的天線、無線電裝置,然後就可以開始運行了。您也能以中斷連線的模式工作,這表示不會受限於母艦,」Krdzalic 表示。群組可以相互共享資訊,當進入運作的手機訊號塔或衛星通訊的範圍內時,可以轉送資料。

5G 專用網路將公共部門和私營企業從公用雲端轉移至專用的安全網路。「您可以利用 5G 的附加價值,增添到自己的專屬圈子裡,」Krdzalic 表示。

網路外洩的可能性會隨著資料傳輸節點數量的增加而增加,因此應用更多安全政策的能力,使得 5G 專用網路對現今的企業營運而言成了格外吸引人的主張。「專屬圈子」強化安全性,這是公共和私營部門的關鍵要素。

5G 專用網路解決方案

Trenton Systems 瞭解希望部署專用 5G 的組織可能想避免將自行組裝元件,於是開發了專用 5G 的整合式邊緣解決方案(IES.5G)。「盒裝網路」將所有元件(堅固耐用的硬體、增強的處理器、軟體和安全性)合而為一。「我們沒有投注一百萬個移動零件,而是花大量時間與合作夥伴一起研究如何為專用 5G 部署開發一個簡單的按鈕,」Krdzalic 表示。

Intel、ZScaler,以及 RAN 和 5G Core 軟體廠商都是為產品帶來優勢的夥伴。Trenton Systems 提供專在極端條件下運作的邊緣運算平台或堅固耐用的伺服器。ZScaler 提供零信任雲端型網路安全平台,同時各種 RAN 和5G Core 廠商的軟體也推動單位的連線能力。

基礎架構(從 CPU 到加速器,乃至於系統上的配接器)是由 Intel 提供及支援。該產品可以在 Intel® Xeon® 可擴充處理器上執行。使用第 3 代 Intel® Xeon® 可擴充處理器的組織可以取得適用於高容量 4G 和 5G vRAN 部署的 Intel® vRAN 加速器 ACC100 配接器,或是取得 Intel® Quick Assist Technology(Intel® QAT)配接器。該系統包含 Intel® FlexRAN,可控制基礎 RAN 架構,是「RAN和核心所仰賴的品質基礎,」Krdzalic 表示。「主機板本身可能配備乙太網路介面卡或 Intel E810 NIC 卡,這是我們要納入這項解決方案的另一件事,以便更輕鬆地在實驗室和現場部署環境中測試 IES.5G,」他補充道。

運算效率與專用 5G 使用案例

Krdzalic 表示,可擴充性以及根據需求劃分和分割頻寬的能力,是 IES.5G 的額外優勢。IT 可以上下擴展箱內伺服器單元,並在需要時擴大運算能力。

IES.5G 解決方案也能支援虛擬網路功能(VNF)和雲端網路功能(CNF),以使用軟體提供網路服務的方式,而非完全仰賴硬體。這些功能讓 IT 可以根據需求劃分網路頻寬並分配。「您可以清楚闡明想如何利用全頻寬;不必假設它只是一個開關,」Krdzalic 表示。例如,急救人員可以隨時存取最佳可用頻寬。因為並非所有人都需要最大容量,基礎架構也不會總是都以最大限度運作,而是只消耗絕對必要的能源。

除公共部門外,5G 專用網路的使用案例遍及製造業和醫療保健領域。未來的重點在於無所不在的持續連線能力,而它始於專用 5G。

畢竟,正如 Krdzalic 所說:「專用 5G 像是在說:『我有自己的資料中心、我有自己的 ISP、我有自己的設備和所需的一切,以確保團隊和我在需要的時候擁有連線能力和運算能力。」

 

本文由 insight.tech 編輯總監妮.貝內施(Georganne Benesch)編輯。

以病患為中心的 AI 重新定義整體照護

醫療專業人士有一項獨特的使命:為病患提供最佳的照護。但從入院到出院,以及其中的所有過程,他們都面臨無數的挑戰。

長期的人力短缺、資源不足以及緊縮的預算只是冰山一角。其中最大的挑戰在於如何在病患住院期間,取得有關病情的重要資訊,特別是監測病患的生物醫學設備每秒時間序列的波形資料。在跟時間賽跑的情況下,醫院如何利用這些資料,讓醫療團隊能輕鬆取得?

時間序列資料的重要性

應對這項挑戰的解方是單一的開放平台,持續收集、處理和整合資料,並即時呈現給臨床醫師。以休斯頓八間醫院所組成的體系為例,其中存在人力配置和照護人員數量不足的問題,夜間時段的挑戰更是嚴峻。這樣的情況迫使他們做出艱難的決定,比如聘請更多旅行護士和醫師,或是拒絕病患。在該組織導入 Medical Informatics Corp. (MIC) 廠商中立、軟體型監測和分析解決方案 Sickbay® Clinical 平台後,事情迎來了轉機。

Sickbay 是經 FDA 核可的軟體臨床平台,可協助醫院標準化病患監測。這項平台能在單一互聯架構上實現大規模靈活照護模型,並且開發 與部署以病患為中心的AI。Sickbay 重新定義了在 EMR 系統和 PAC 影像中儲存和取得靜態資料的傳統方法。網頁式架構可以將近乎即時的串流和標準化資料提供給照護團隊,無論在何處何地,都能以相同的整合方式支援各式工作流程。範圍包括電腦和行動裝置上的嵌入式 EMR 報告與監控資料。

MIC 的產品與創新長暨共同創辦人 Craig Rusin 表示:「 一個病患的床頭監測設備每個小時產生差不多 800,000 個資料點,大概只有 20 個點在臨床上有用。」一般人有所不知,照護人員很難在有距離的情況下聽見或查看非網路設備(如患者房間外的呼吸機)發出的警報。另有類似的情況,現行的病患監測並未使用 AI 工具現有的資料來改善病患照護。

評估影響

採用 Sickbay 的醫院和醫療體系重新定義了病患監控方式,並呈現以下成果,開創靈活、資料導向的全新照護標準:

  • 快速增加床位和人員數量,同時打造靈活的虛擬照護模式,超越傳統的遠距照護、接收和出院。
  • 向已在單位、服務或待命的人員提供更多近乎即時的回顧性資料,改善工作流程和照護。
  • 建立虛擬護理站,一名護士可以通過單一使用者介面跨單位和/或設施監控 50 多名患者。
  • 利用相同的基礎架構成立虛擬指揮中心,監控病患整體照護過程。

不論部署方式為何,Sickbay 都能將控制權交還給醫療團隊,並直接為醫院帶來效益。根據報告,使用 Sickbay 的效益包括減少人力、資本和年度維護成本,以及提高人員、病患和家屬滿意度。最重要的是,採用 Sickbay 的客戶看到了對照護品質和成效提升的直接影響,包括減少住院時間、急救事件發生及加護病房轉移,並且縮短呼吸器使用、雙重簽署、與治療時間。

這樣的成效促使其他醫院重新思考病患監測,實現近乎即時、以病患為中心的 AI 願景。醫療領域的領導者已經證明,透過回歸團隊型護理,增加虛擬人員有助於幫助扭轉人力危機。Rusin 表示:「這並不是要把護士從病患身邊帶走。而是要把一些工作任務集中起來。」在未來可預見的情況下,永遠不會有夠多的護士、醫師和呼吸治療師來滿足所有需求。我們要讓床邊團隊重新回歸到床邊照護。靈活的虛擬照護支援可以實現這個目標。」

改變照護經濟效益

Sickbay 提供改變監測病患的經濟效益,直接影響品質和成效改善。

無論功能或品牌,關鍵在於整合不同設備的能力。Rusin 談到:「我們打造的環境讓醫療人員能夠取得前所未見的資料,而且用史上最經濟可行的方式在這個基礎上建立內容。」

MIC 的策略市場執行副總裁 Heather Hitchcock表示,對醫療機構來說,掌握可用的資料有著深遠的影響。正如一位醫師所說:「我一分鐘內要處理 300 個資料點。沒有機器會幫我做決策,但 Sickbay 幫我更快處理這些資料,做出正確的決策,拯救更多生命。」

從可擴充的病患監測到預測性分析

Sickbay 的價值不僅限於近乎即時的病患監測和虛擬照護,還包含改善長期治療。Sickbay 支援利用相同的資料來發展與部屬預測性分析,協助提前應對惡化及風險。

客戶目前持續在 Sickbay 上發展分析。例如,一位客戶將 32 個近乎即時的多模型風險分數整合到虛擬照護工作流程中。另一位客戶建立了 Sickbay 運算法,分析由兩個獨立監測裝置產生的資料,確定病患理想的血壓水準。Rusin 提到:「要進行這款特定分析,就需要床邊監測器的血壓波形,還有另一台監測器的腦血密度。」

以資料拯救生命

今日整體照護過程的病患治療,將為明日的照護帶來改善。要實現這一點,可靠、具體的資料是起步的要素。如果缺乏這些資料,臨床醫師只能依靠猜測來應對病患身體最迫切的照護需求,少了他們夢寐以求的資料導向決策支持。這種情況將會導致速度緩慢、成本高昂、照護人員待遇不公平,最終無法為病患帶來最大益處。

為了真正實現治療方法與對象一樣具體和個性化的未來,醫療領域必須以產生最大影響力的方式利用病患資料,也就是具體、準確、近乎即時、不受廠商影響、可轉換且得以立即取得。利用時間序列資料的力量,醫療機構能夠以更有效的方式幫助更多人。拯救生命是醫療的首要使命。

 

本文編輯 insight.tech 編輯總監 Georganne Benesch

即時分析改造廠房

製造商承受高度壓力,得要充分利用所有可用的智慧功能,像是機器視覺還有 AI 驅動的視訊分析。這些功能可以成為關鍵性的工具,從瑕疵偵測到保障員工安全都能發揮作用。但很少製造商擁有 AI 領域的專業知識,同時他們需要應對許多挑戰和工作,更不用說要對一項龐大的技術投資做好未來規劃。這些全新技術必須兼具適應性還有互通性。

能跟深入探討這些需求的兩位專家分別是工業機器視訊供應商 Eigen Innovations營收長 Jonathan Weiss,以及 AI 視訊分析公司 AllGoVision銷售兼行銷長 Ali Anirudhan。兩人談到了實現工業 4.0 的挑戰、製造商怎麼善用資料驅動的廠房,以及 AI 如何持續改造廠房(影片 1)。

影片 1 。AllGoVision 與 Eigen Innovations 的產業專家探討 AI 在製造業中的革命性影響。(資料來源:insight.tech

機器視覺和 AI 如何應對工作 4.0 的挑戰?

Jonathan Weiss:我們所做的就是把機器視覺應用在品質檢測上,工業製造領域是我們的重點。傳統的視覺系統非常適合在生產現場偵測問題,通常會告訴你產品是好是壞。但是要怎麼幫助製造商預防瑕疵,而不是只有讓他們知道已經製造出有瑕疵的產品?

這就是我們的軟體特別的地方。我們不只利用視覺系統、攝影機還有不同類型的感應器,還直接跟處理資料,包括歷史資料、OPC UA 伺服器連接,甚至直接連線到網路控制級的 PLC 。我們提供製造零件實際使用的變數和計量指標的深入解析,製程中的出現的問題,還有導致瑕疵發生的變化。我們的方式大量採用 AI 跟 ML 技術。

在目前的工業環境裡面,視訊分析如何應對員工的風險?

Ali Anirudhan:這個產業的重點是怎麼提升自動化水準,增加更多的機器應用。但是人員的角色不會從廠房消失,基本上這表示人和機器之間的互動會越來越多。

根據聯合國的資料,全球企業每年在職業災害和損失上的支出高達 26,800 億美元。這項成本對每個製造商來說都是關鍵問題。過去他們會研究不同的事故案例來制定政策,確保不會再發生類似的事故。

但這種傳統的作法不足以降低成本。事故發生的原因可能有很多種,意外的情況也可能造成潛在的事故。所以你得要建立一個即時的機制,確保事故一開始就不會發生。

也就是說如果廠房員工沒有戴上應該要戴的安全帽,即使事故還沒有發生,系統就會馬上辨別出來,讓現場主管馬上處理。簡單來說:減少事故就是降低保險成本,進而提升公司的收入/ 利潤。

工業製造的領域涉及到人員的行為模式,以及他們和機器或車輛之間的互動方式。不同客戶對員工安全的需求也不一樣:石油和天然氣跟製藥公司的設備、防護裝備還有安全計畫的需求都不同。

例如,我們曾經跟一家印度的公司合作,他們生產線的熱金屬有時候會出現溢漏的情況。不管是從人員還是工廠的安全角度來看,這都非常危險。這間公司希望持續監控,發生任何情況即時報告。 

製造商準備好迎接資料驅動的工廠了嗎?

Jonathan Weiss:製造商一般來說都認識到數位化、自動化的必要性。我的確覺得在大規模計畫的方面還需要更多教育,包括從何開始、如何確保計畫的效率和成果,還有怎麼擴展到工廠之外。

在我的領域裡面,協助工業克服攝影機系統被孤立還有沒辦法跟其他企業溝通的挑戰非常重要。同時也要解決不能在生產線、工廠甚至只是在機器之間擴展 AI 模型的問題。這就是傳統攝影機不足的點。Eigen 已經跨越了這道障礙。

但我跟 Aij 解決的只是冰山一角,整個問題的關鍵就在資料上。透過為所有生產資料建立單一的可信來源,我們推動可採取行動的深入解析和自動化。簡單來說,就是把所有資料存放在同一個位置,包括品質資料、製成資料、安全資料、現場服務類型資料、客戶資料、保固資訊等等。然後開始跟各種企業級應用程式建立雙向連線,這樣 ERP 和品質就可以相互了解關注的部分。

這就是有單一的可信來源還有正確的策略和架構,把各種類型的軟體實施到整個工業企業的單一可信來源裡面。

製造商如何把機器視覺應用到工廠作業?

Jonathan Weiss:首先要瞭解想解決的問題。哪種瑕疵有最大的影響,而且最常出現,是你最希望能夠降低的?

在焊接領域,這種瑕疵通常是肉眼看不到的,所以視覺系統變得非常重要。譬如複雜的組裝過程會需要紅外線攝影機,因為肉眼很難看到零件的整個幾何形狀,來辨別是不是有瑕疵,或者要找出瑕疵會非常有挑戰性。

重點在於找到具有最大價值的使用案例,然後根據這個案例來制定計畫。接下來就是選擇技術。我都鼓勵製造商選擇兼具適應性和擴充性的技術,因為情況順利的話,工廠可能還會部署更多視覺系統。

Ali Anirudhan:現在大多數工廠為了符合法規和其他需求都有安裝 CCTV 攝影機,AllGoVision 的需求可以跟這些現有設備的輸入/輸出輕鬆匹配。也許攝影機的位置要改變,或是照明條件要調整。又或者是特定的情況需要不同的攝影機,譬如說熱攝影機。但在 80% 的情況下,我們可以重複採用現有的基礎架構,直接使用原先的視訊摘要。

跟像 Intel 這樣的夥伴合作有什麼重要性?

Aji Anirubhan:我們是首批採用 Intel 開放式架構的視訊分析供應商之一。從早期版本到 Gen4 和 Gen5,我們持續採用 Intel 處理器,效能有很明顯的提升。Intel 提供的平台和適合執行深度學習模型的技術對我們非常有幫助。

我們很期待像是整合式 GPU 或全新的 Arc GPU 這樣執行深度學習運算法的增強功能,迫不及待利用它們來提升執行運算的效率。在我們目前的策略和未來發展中,Intel 扮演著關鍵的合作夥伴角色。

隨著 AI 領域持續發展,還有哪些機會在等著我們?

Jonathan Weiss:Eigen 進行各種類型的檢測。其中一個例子是檢測在紙上塗上特殊塗層的機器。機器的一部分會在紙張通過的時候分級,只有八秒的時間來偵測機器上堆積兩點五毫米的塗層,不然會造成大約 150,000 美元的損失。這種情況一年可能發生很多次。甚至在一次輪班就發生很多次。

未來我們只有八秒的時間來偵測這種堆積,然後自動執行一個動作來防止設備故障。目前大概一秒鐘可以完成這個動作,但想像一下,未來只需要要三分之二或半秒的時間。

我想技術會變得越來越強大,使用的方式也會越來越多元。我有觀察到很多這類複雜工具的普及化。Eigen 從頭開始打造我們的軟體,目的是讓任何生產線的人員,不論經驗多寡,都能夠建立一個視覺系統。這對我們和客戶來說都非常重要。

雖然我們的領域非常注重產品的品質,但也同意 Aji 在前面提到的觀點,人員的角色不會消失。我覺得這反映了對 AI 普遍的誤解,認為會被 AI 取代,工作會被 AI 搶走。我們在產品品質上看到的情況剛好相反:我們把視覺系統和軟體引進工廠,提升他們檢測零件的速度。隨著工廠的生產量增加,公司有能力雇用更多人員來進一步增加零件生產。

很多客戶都說,視覺檢測是他們工廠流動率最高的職位。這份工作做起來可能不太舒服,員工需要連續站 12 個小時,眼睛盯著通過的零件,頭還要一直轉來轉去。這也是為什麼過去這種需求像是補充的維他命,而不是必要的止痛藥,但現在對企業來說,這些技術已經不再只是維他命了。我們在協助組織緩解難題,這不只是一種額外的增值。

Ali Anirudhan:值得注意的是所有生成式 AI 的存在,還有我們怎麼利用這些技術。大型視覺模型基本上是在解釋複雜的視覺或情境。我舉個例子:有一個環境允許車輛進入,但是人不可以。客戶說:「好,員工推著手推車的話,也可以走這條路線。」但要怎麼定義一個人有沒有手推車?

所以我們在研究像是 LVM 這樣全新的技術增強功能,來推出新的使用案例。在未來幾年,生成式 AI 技術會在應對工廠中的這些使用案例發揮更大的作用。但我們還有很大的進步空間。我們對技術還有正在實施的計畫非常期待。也迫不及待跟全球各地的不同客戶合作,打造更龐大的商業版圖。

相關內容

若要進一步瞭解 AI 驅動製造,請收聽 AI 驅動製造:打造資料導向工廠,以及閱讀機器視覺解決方案:偵測與預防瑕疵。想要掌握 AllGoVision 和 Eigen Innovations 的最近創新技術,歡迎在 Twitter/X 上關注 @AllGoVision@EigenInnovation,以及在 LinkedIn 追蹤 AllGoVisionEigen Innovations Inc.

文由 Erin Noble 編審

利用新一代處理器和 COM Express 調整 AI 工作負載

X 光、超音波和內鏡機器會產生大量資料,過量的資料有時令人無從判讀。為此,醫療裝置 OEM 直接整合 AI 與醫學影像和診斷機器,提升篩選流程的效率、成效,有利臨床醫師和患者判讀。

高階硬體需搭載顯示晶片和運算效能,才能即時執行智慧影像工作負載,支援 AI 支援的醫學影像與診斷。不久前,實現這些功能最簡單的方法是獨立加速器,但獨立加速器的前置硬體成本和耗電量恐怕不菲,效率更是不佳。

然而,錯誤的系統架構才是開支最大的設計決策。AI 目前發展迅速,如果沒有靈活機動且可升級的系統硬體,設備還來不及充分調整可能就要淘汰。

「AI 工作負載發展極其快速,甚至不容討論硬體的時間。」嵌入式解決方案的全球領導者、congatec AG 基礎結構的市場區隔經理 Zeljko Loncaric 說,「時間是醫療裝置設計師最重大的挑戰。而在長生命週期系統,他們還面臨實作新功能的難題。」

搭載 Intel® Core Ultra 行動處理器的 COM Express 模組可以解決這些難題。因為 COM Express 模組整合 GPU 與 NPU,提供優異的 AI 工作負載處理效能與效率。此外,固有的模塊化簡化初始設計流程,且便於處理器代代升級。

平衡邊緣 AI 壽命與嵌入式運算的創新技術

醫學影像裝置需經過各方面的認證流程,才能投入使用。這些裝置的生命週期平均一般為十年,甚至更長。另一方面,AI 技術是醫學影像的重大進展,隨之而來的是超音波、行動超音波、內視鏡機器、X 光等診斷效率和準確度大幅提升的可能。

但鑑於重新設計、認證醫療裝置的時間和費用,OEM 不敢在缺乏確實的商業案例時,轉換為新一代支援 AI 的平台。更別提沒有系統設計可維持多久的答案,導致商業案例更不令人相信。

全新 Intel Core Ultra 行動處理器是首款整合 NPU 的 x86 處理器,也是目前市面上最節能的 SoC 系列產品。整合式 NPU 支援進階 AI 工作負載,省去外加獨立加速器的成本和麻煩。搭配 SoC 超群的每瓦效能,醫療裝置設計師可就資源有限的邊緣 AI 部署,進一步妥善管理耗電量和散熱效率。

「行動超音波裝置和其他電池供電系統處理器每瓦的效能,也十分引人關注。」congatec 產品縣經理 Maximilian Gerstl 說,「Intel 的架構設計令人讚歎。效能呈現的數值很漂亮,而且不只 CPU,顯示晶片也是。新處理器也提供空前的靈活度,客戶可以升級多代系統,但外型規格不變。」

「如果沒有新的重大技術上市,組織會使用同一個模組 10 年以上,省得重新認證。」他接著說,「Intel Core Ultra 行動處理器是一大躍進。醫療保健組織勢必考慮更換。」

開放式標準模組快速系統升級

最新 congatec conga-TC700 COM Express Compact 模組採用隨插即用的外型規格,搭載 Intel Core Ultra 行動處理器,提供處理效能和應用程式就緒的 AI 功能。醫療裝置設計師可利用模組抄近路,組建高效的邊緣 AI 系統,大幅縮短上市時間,同時降低總持有成本(TCO)。另外,COM Express 是全球技術協會、PICMG 管理的開放式硬體標準,TC700 提供供應商中立的系統升級路徑,所以舊版模組可以直接汰換為相同介面但效能更高的模組。

「快速更換硬體的能力亦即組織的應用程式可以長期執行。」Gerstl 說明,「雖然應用程式必須重新認證新的硬體元件,卻可以採用之前應用程式很多的軟硬體設計。」

邊緣 AI 解決方案支援智慧醫療保健

Congatec 的 OEM 聚焦解決方案的生態系統支援 conga-TC700,而且提供高效主動和被動式散熱管理解決方案、長期支援,及即用型評估載板。不僅如此,公司持續探索開放原始碼 Intel® OpenVINO 工具組可提供客戶的 AI 視覺系統開發與部署支援。據 Gerstl 所述,為協助客戶盡快啟用和執行應用程式,公司正致力完成特定使用案例的前期基準測試。

對 congatec 而言,Intel Core Ultra 行動處理器的推出,等同新一代邊緣 AI 裝置價格、效能和耗電量長足的進展。對醫療裝置 OEM 而言,這些處理器是通往全新 AI 支援影像與診斷設備的誘人途徑。

「我們會繼續支援 AI 加速、硬體和軟體,並應用在我們的產品。」Gerstl 說,「我們希望推動這股新趨勢。」

 

本文由 insight.tech 編輯總監妮.貝內施(Georganne Benesch)編輯。

運用 AI 的即時視訊優勢維護工作場所安全

工作場所安全是各行各業都會面臨的實際問題。根據近期報告指出,每年有多達 3.74 億人在工作場所發生意外並因此受影響。這是一個可怕的數字,但幸運的是,企業可以採取行動降低風險。

例如,許多公司已經配備監控攝影機(CCTV)系統,維護日常安全與協助資產管理。這些裝置同樣可以應用在其他用途,例如識別潛在危險,協助減少職業災害的受害人數。

在意外發生次數較少的情況下可以實作這類視訊分析技術,但若意外頻繁重複發生,則代表情況可能更複雜、更令人擔憂。若頻繁發生不幸事件,則會對員工的健康與安全方面帶來重大損害,然而,公司可以透過分析監視器的拍攝畫面並做出行動來藉此預防憾事發生。

重資產行業領域中的安全分析

視訊分析軟體解決方案供應商 AllGoVision 從 CCTV 起家,主要業務為安全和資產管理等,但很快意識到這項技術具有超越安全管理的潛力。AllGoVision 銷售兼行銷長 Aji Anirudhan 表示, 他非常清楚 AllGoVision 無疑能在各類型產業中維護員工的健康。

製造業、能源與公用事業等重資產行業特別受益於視訊分析技術,並從以改善員工的工作條件。基本上在這類行業中,會犧牲員工安全的情況有兩種:第一種,當現場狀況迅速變化時。例如當熱金屬處理不當,或當員工暴露於石油與天然氣外洩產生的有毒氣體中,而造成燒傷等事故。此外,員工若無嚴格遵循安全協議,將會損害自身的健康。例如,在高風險工作環境若沒有佩戴合適的個人防護設備(PPE),可能會提高受傷的風險。

Anirudhan 說明:傳統上,員工安全的保護措施較被動消極。由員工健康安全團隊來對各種可能存在的有害情境進行風險評估,並相應開發訓練計畫。他說:「每當事件發生時,團隊會進行調查,並依狀況更新政策,儘量減少這些事故。」雖然全公司的政策能有效降低工作場所的傷病人數,但這類問題仍十分嚴重。這也是為什麼「只要是能提供深入見解,讓我們了解不安全行為模式的任何解決方案,都有助於預防事故」,Anirudhan 補充說明。

AllGoVision 的目標是成為這樣的解決方案。特別是從事石油與天然氣相關工作的能源與公用事業公司,因不遵守規定而導致安全問題的情況比比皆是。Anirudhan 表示,無論是油田上的鑽井設備,或是燃料的運輸與儲存,日常工作中的每一步都極有可能導致錯誤與意外發生。

運用 AI 維護工作場所安全的機制

為了避免犧牲員工安全,AllGoVision 利用 AI 即時分析現場情況。CCTV 系統串流影片資料,並由 AI 安全分析軟體進行評估。系統能即時拍攝違規或問題區域的影像,並提醒現場主管主動處理異狀。提供儀表板,幫助主管隨時了解人員遵守安全協議的情況,並按照改善計畫監測進度。Anirudhan 表示,員工也希望成為解決方案的一環,這種分析方式可以促進人員就工作場所的各項資訊進行討論,能改善主管一人獨大的專制做法。

AllGoVision 特別注重資料隱私通訊協定,系統中僅保留元資料,不儲存個別員工的畫面。公司也致力於維護模型公平性,並聘請多名顧問,以確實遵守國際資料隱私法規。

經驗豐富的安全分析供應商

AllGoVision 在此領域中表現突出,因為其可以利用視訊分析方面的豐富經驗,來評估特定用戶端的情況,並推薦可實現理想成果的全方位解決方案。該軟體採隨插即用的模式,代表可以與現有基礎架構整合,可增加資料層級取得更多資訊。公司與系統整合商合作,將解決方案整合至大型視訊管理套件中提供給用戶端。

在多種產業中執行工作場所安全協議的經驗十分重要。「AI 日益普及化,幾乎任何人都可以存取開放原始碼提供的演算法,並取得視訊分析技術。Anirudhan 表示:「但要將 AI 推斷應用至攝影機不同、照明條件不同、用戶端期望也不同的各種生產環境中,是最具挑戰性的一環。」「這就是我們的實力所在,能夠實際處理不同垂直領域的安全與員工生產力問題,尤其在石油和天然氣、公用事業和製造產業中,更能展現出我們的先進技術。」

Anirudhan 表示,多年來,AllGoVision 伴隨不同世代的 Intel® 平台不斷成長發展。該公司也是 OpenVINO 的早期採用者之一,並使用 Intel® Xeon® 處理器。Anirudhan 表示:「執行演算法的成本大幅降低,因此能為客戶節省成本。我們認為這是與 Intel 合作的一大優勢。」

運用 AI 維護工作場所安全的相關變革

Anirudhan 十分期待能看見 AllGoVision AI 提升工作場所安全的使用案例,包括針對建築與基礎架構偵測火災和煙霧或進行人群控管。將 AI 應用於工作場所安全仍是新興技術,有機會讓 AI 解決方案創造龐大商機,並帶來顯著影響。

我們不再需要重複、周而復始地實作政策。Anirudhan 表示:「客戶可以明顯意識到採用即時主動策略的價值所在。」未來可能可以監控更多參數,包括員工疲勞指數等。他補充:「未來工作場所中會有更多可穿戴設備、感應器、物聯網裝置,這些都會成為機器與人員管理的不同使用案例。」

此外,Anirudhan 認為生成式 AI 在解決更複雜的使用案例方面的潛力無窮,尤其是涉及人機互動的案例。

AllGoVision 正致力於發展相關技術,能處理棘手的工作場所安全統計資料。Anirudhan 表示:「如果真的能讓 AI 解決我們的一部分難題,我們就能對全社會帶來極大影響。」

 

本文由 insight.tech 編輯總監 Christina Cardoza 編輯。

利用音訊型生成式 AI 協調創新

人工智慧是許多不同技術的總稱。我們常聽到的包括生成式 AI ,尤其是 ChatGPT。ChatGPT 獲得新聞媒體的熱烈報導,但生成式 AI 的播放清單中可不只這首歌。Intel 的 AI 軟體架構師暨生成式 AI 宣傳員 Ria Cheruvu 最近就對音訊空間的生成式 AI 興奮不已(影片 1)

影片 1。Intel 的生成式 AI 宣傳員 Ria Cheruvu 探索音訊型生成式 AI 的業務與開發商機。(資料來源:insight.tech
但任何生成式 AI 都可能讓人生畏,而且開發者並不一定知道要從何著手,或者一旦開始,該如何最佳化模型。與 Intel 合作可以真正簡化流程。例如,新手開發者可以利用 Intel® OpenVINO 筆記型電腦,藉由教學課程和範例代碼來協助他們著手使用 GenAI 。然後,當他們準備進入下一階段或準備擴展時,Intel 也會伴隨左右。

Ria Cheruvu 與我們討論 OpenVINO 筆記型電腦儲存庫,和生成式 AI 用於音訊的實際應用,以及它適用於呼叫中心和實際用於音樂家之間的差異。

生成式 AI 有什麼不同的領域?

就生成式 AI 的類型而言,這個領域肯定正在發展。ChatGPT 不是唯一的例子!文字生成是生成式 AI 非常重要的一種形式,但當然也有影像生成,例如使用 Stable Diffusion 這種模型產生藝術和原型以及不同類型的影像。還有音訊領域,可讓您著手製作音樂,或為合成頭像製作音訊,以及其他許多類型的使用案例。

在音訊領域,快速執行階段尤為重要,這也是常見的痛點之一。您希望模型非常強大,能夠快速產生高品質的輸出,這需要大量的運算資源。所以我想說,最佳化生成式 AI 模型的技術堆疊絕對至關重要,這也是我在 Intel 日常職務中鑽研的一環。

適用於音訊的生成式 AI 有什麼具體商機?

使用語音 AI 或對話式 AI 讀取及處理音訊,光是用想的就很有意思,這是您使用語音代理程式(就像手機上的語音助理)所做的事。將它和用於音訊的生成式 AI 比較:您實際創作內容,例如能夠產生合成頭像或聲音,以便撥打電話和交談。您第一個想到的業務應用肯定是話務中心,或 Metaverse 應用程式,其中存在使用此建立之音訊的模擬環境。

但創作領域的內容創作也存在一些非傳統的業務使用案例,也是我們開始看到一些與音樂生成式 AI 相關應用的地方。對我來說,這相當令人興奮。Intel 開始研究生成式 AI 如何搭配藝術家的工作流程:例如建立構圖,以及使用生成式 AI 採樣節拍。音樂家與音樂製作人如何利用生成式 AI 作為內容創作工作流程的一環,其中也包含很有意思的文化元素。

因此,雖然它不是傳統的業務使用案例(如您在話務中心或使用音訊零售服務的互動式服務亭中看到的那樣),但我確信用於音樂的生成式 AI 在內容創作方面有一些亮眼的應用。最終,它也可能進入其他需要產生音訊片段的領域,例如為 AI 系統訓練建立合成資料。

適用於音訊的生成式 AI 的開發流程是什麼?

生成式 AI 領域目前採用幾種不同的方法。其中之一肯定是調整既有的模型架構,用於其他類型的生成式 AI 模型。例如,Riffusion 基於影像生成模型 Stable Diffusion 的架構;只產生波形,而非影像。

我最近和正在音樂領域研究的人聊過,其中一個話題是您可以提供這些音訊領域模型各式各樣的輸入資料。可以是音符(或許是鋼琴曲目的一個片段),也可以是專門用於 MIDI 格式等使用案例的波形或特定輸入類型。輸入資料包羅萬象。

訓練和部署這些模型需要哪些技術?

我們一直在研究許多有趣的生成式 AI 工作負載,作為 Intel OpenVINO 工具組和 OpenVINO Notebooks 儲藏庫的一環。我們整合了許多音訊生成的關鍵範例,作為非常實用的使用案例,來提示及測試生成式 AI 功能。我們與 Intel 的其他團隊合作無間,使用 Riffusion 模型建立 Taylor Swift 類型的流行節奏,乃至於更進階的模型,可以產生與某人說話相符的音訊。

我透過 OpenVINO 見證了一件事,那就是能將這些模型全都最佳化,特別是在記憶體和模型大小方面,也能在邊緣、雲端和用戶端之間實現靈活性。

OpenVINO 真正針對的是最佳化部分。有一個基本概念,即生成式 AI 模型在大小和記憶體佔用空間很大;這些模型的基礎(包括音訊、影像或文字生成),其中的某些元素非常龐大。透過使用壓縮和量化相關技術將模型佔用空間減半,我們能夠大幅減少模型大小,同時確保維持類似效能。

這全都是由一個非常有趣的局部開發概念所啟發。音樂創作者或音訊創作者在創作內容時希望借助電腦,以及能夠在雲端工作,進行密集的任務,例如音訊資料的收集、錄製、註釋,以及與不同的專家合作建立資料集。然後他們可以在電腦上執行其他工作負載,說:「好吧,這就在系統本機產生一些有趣的流行節奏,然後在房裡進行原型設計。」

開發者馬上開始使用生成式 AI 有哪些範例?

我最喜歡討論的一個例子,就是您準確地採用我們在 Notebooks 儲存庫中展示的這些 OpenVINO 教學課程和工作負載,然後將其變為現實。Intel 與 Audacity 合作,這是一款本質上實現開放原始碼音訊相關編輯創作的工具。這是名副其實的一站式、類似於 Photoshop 的音訊編輯工具。我們做的其中一項工作,就是透過自家的外掛程式整合 OpenVINO 。我們的工程團隊從 Python 擷取 OpenVINO Notebooks 儲存庫的程式碼,將其轉換為 C++,然後部署為 Audacity 的一環。

它能達成我前面提到的更多效能和記憶體改善,但同時也直接整合至許多編輯和播放音訊的許多不同人使用的相同工作流程。您只需醒目提示一段音訊,說聲「產生」,其餘的就交給 OpenVINO 產生。

這是工作流程整合的一個例子,可用於藝術家工作流程;或用於電影產業的語音製作合成音訊;或用於零售產業的互動式服務亭;或用於醫療保健領域的病患與開業醫生對話。緊密整合至工作流程,是 Intel 非常期待推動和協助合作的下一步。

生成式 AI(尤其是適用於音訊的生成式 AI)還有什麼前景?

論及適用於音訊的生成式 AI,我想對於這個領域的任何特定時刻來說,都可能「轉瞬即逝」。光是見證增添多少工作負載就夠令人驚豔了。但只要放眼不久後的未來(可能是年底或明年),我可以看到一些突然出現的發展,絕對會圍繞我前面提到的那些工作流程進行,並確定您確切想要執行的地方,是本機系統,還是雲端,或是混合兩者?這絕對是我真正感興趣的地方。

我們正在使用 Intel® Core Ultra 和類似平台,在 AI 電腦上嘗試一些音訊生成的方法,您坐在房裡與一群音樂家同行一起設計原型並隨意玩耍,理想情況下,您不必為此存取雲端。反之,您可在本機執行,將其匯出至雲端,然後來回移動工作負載。關鍵在於,要問我們如何將利益相關者納入流程,如何準確建立並實例化生成式 AI 解決方案,然後隨著時間進行維護?

最後還要向大家推廣關於生成式 AI 的什麼?

生成式 AI 目前算是很引人注目的領域,但幾乎所有人都認為,只要具備前瞻性的策略,就能從中汲取價值。Intel 產業的價值支柱,就是實際上握住開發者的手,向他們展示利用這項技術可以做什麼,並在每一步協助他們實現想要的目標。

適用於音訊的生成式 AI(通用生成式 AI)進展如此迅速。因此,請密切關注工作負載、評估、測試和原型設計;在我們邁向音訊生成、合成生成和其他這些令人興奮的領域的新時代,它們絕對是關鍵。

相關內容

若要進一步瞭解生成式 AI,請閱讀生成式 AI 解決方案:從炒作到現實,並聆聽生成式 AI 為音訊創作帶來新機遇。若要瞭解 Intel 的最新創新技術,請在 X 的 @IntelAILinkedIn 上追蹤。

 

本文由 Erin Noble 編審。