為了避免犧牲員工安全,AllGoVision 利用 AI 即時分析現場情況。CCTV 系統串流影片資料,並由 AI 安全分析軟體進行評估。系統能即時拍攝違規或問題區域的影像,並提醒現場主管主動處理異狀。提供儀表板,幫助主管隨時了解人員遵守安全協議的情況,並按照改善計畫監測進度。Anirudhan 表示,員工也希望成為解決方案的一環,這種分析方式可以促進人員就工作場所的各項資訊進行討論,能改善主管一人獨大的專制做法。
在多種產業中執行工作場所安全協議的經驗十分重要。「AI 日益普及化,幾乎任何人都可以存取開放原始碼提供的演算法,並取得視訊分析技術。Anirudhan 表示:「但要將 AI 推斷應用至攝影機不同、照明條件不同、用戶端期望也不同的各種生產環境中,是最具挑戰性的一環。」「這就是我們的實力所在,能夠實際處理不同垂直領域的安全與員工生產力問題,尤其在石油和天然氣、公用事業和製造產業中,更能展現出我們的先進技術。」
影片 1。Intel 的生成式 AI 宣傳員 Ria Cheruvu 探索音訊型生成式 AI 的業務與開發商機。(資料來源:insight.tech)
但任何生成式 AI 都可能讓人生畏,而且開發者並不一定知道要從何著手,或者一旦開始,該如何最佳化模型。與 Intel 合作可以真正簡化流程。例如,新手開發者可以利用 Intel® OpenVINO™ 筆記型電腦,藉由教學課程和範例代碼來協助他們著手使用 GenAI 。然後,當他們準備進入下一階段或準備擴展時,Intel 也會伴隨左右。
Ria Cheruvu 與我們討論 OpenVINO 筆記型電腦儲存庫,和生成式 AI 用於音訊的實際應用,以及它適用於呼叫中心和實際用於音樂家之間的差異。
生成式 AI 有什麼不同的領域?
就生成式 AI 的類型而言,這個領域肯定正在發展。ChatGPT 不是唯一的例子!文字生成是生成式 AI 非常重要的一種形式,但當然也有影像生成,例如使用 Stable Diffusion 這種模型產生藝術和原型以及不同類型的影像。還有音訊領域,可讓您著手製作音樂,或為合成頭像製作音訊,以及其他許多類型的使用案例。
在音訊領域,快速執行階段尤為重要,這也是常見的痛點之一。您希望模型非常強大,能夠快速產生高品質的輸出,這需要大量的運算資源。所以我想說,最佳化生成式 AI 模型的技術堆疊絕對至關重要,這也是我在 Intel 日常職務中鑽研的一環。
適用於音訊的生成式 AI 有什麼具體商機?
使用語音 AI 或對話式 AI 讀取及處理音訊,光是用想的就很有意思,這是您使用語音代理程式(就像手機上的語音助理)所做的事。將它和用於音訊的生成式 AI 比較:您實際創作內容,例如能夠產生合成頭像或聲音,以便撥打電話和交談。您第一個想到的業務應用肯定是話務中心,或 Metaverse 應用程式,其中存在使用此建立之音訊的模擬環境。
但創作領域的內容創作也存在一些非傳統的業務使用案例,也是我們開始看到一些與音樂生成式 AI 相關應用的地方。對我來說,這相當令人興奮。Intel 開始研究生成式 AI 如何搭配藝術家的工作流程:例如建立構圖,以及使用生成式 AI 採樣節拍。音樂家與音樂製作人如何利用生成式 AI 作為內容創作工作流程的一環,其中也包含很有意思的文化元素。
因此,雖然它不是傳統的業務使用案例(如您在話務中心或使用音訊零售服務的互動式服務亭中看到的那樣),但我確信用於音樂的生成式 AI 在內容創作方面有一些亮眼的應用。最終,它也可能進入其他需要產生音訊片段的領域,例如為 AI 系統訓練建立合成資料。
適用於音訊的生成式 AI 的開發流程是什麼?
生成式 AI 領域目前採用幾種不同的方法。其中之一肯定是調整既有的模型架構,用於其他類型的生成式 AI 模型。例如,Riffusion 基於影像生成模型 Stable Diffusion 的架構;只產生波形,而非影像。
我們一直在研究許多有趣的生成式 AI 工作負載,作為 Intel OpenVINO 工具組和 OpenVINO Notebooks 儲藏庫的一環。我們整合了許多音訊生成的關鍵範例,作為非常實用的使用案例,來提示及測試生成式 AI 功能。我們與 Intel 的其他團隊合作無間,使用 Riffusion 模型建立 Taylor Swift 類型的流行節奏,乃至於更進階的模型,可以產生與某人說話相符的音訊。
我們正在使用 Intel® Core™ Ultra 和類似平台,在 AI 電腦上嘗試一些音訊生成的方法,您坐在房裡與一群音樂家同行一起設計原型並隨意玩耍,理想情況下,您不必為此存取雲端。反之,您可在本機執行,將其匯出至雲端,然後來回移動工作負載。關鍵在於,要問我們如何將利益相關者納入流程,如何準確建立並實例化生成式 AI 解決方案,然後隨著時間進行維護?
最後還要向大家推廣關於生成式 AI 的什麼?
生成式 AI 目前算是很引人注目的領域,但幾乎所有人都認為,只要具備前瞻性的策略,就能從中汲取價值。Intel 產業的價值支柱,就是實際上握住開發者的手,向他們展示利用這項技術可以做什麼,並在每一步協助他們實現想要的目標。
醫院、醫療裝置是精心編制的交響樂章,協奏的時機得十分精確。醫師要靠多個來源的資訊診斷並治療患者,其中不乏醫療記錄、實驗室結果、血壓血氧監視器,或 X 光、CT 及超音波掃描儀的影像。但這些機器的製造商各異,使用的軟體通訊協定也不同,基本無法互連,抑或無法連線醫院的 IT 系統,所以醫師往往要調出患者四散的資料。
如果是醫揚科技 AIO 醫療 AI 電腦的系統,就可以指揮交響樂,整合患者記錄、異地機器等所有來源的資料,實現高解析度影像傳輸,及 AI 分析效能,所以醫師可以近乎即時地全面檢視患者的病情。
但大量資料訓練的視覺 AI 模型可以協助照護人員在病床邊提供更個人化的照護。透過 AI 增強護理工作能夠更快速、更準確發現異常,而且需要的訓練成本也非常低。透過預先訓練的模型和主動學習,現代方法讓這些模型的快速開發和部署成為可能。Myao Clinic 的 David Holmes 博士表示:「我們的照護人員明白利用 AI 協助患者照護的好處,但像是 POC 超音波這樣的情況還沒有可行的 AI 模型來做使用。」他的工程師團隊利用互動式 AI 模型化工具迅速開發 AI 解決方案,評估病床邊影像的品質,確保患者照護過程中採用最佳的影像。
AI 在醫療造影中的應用不僅僅是作為診斷工具的功能。Long 表示:「透過視覺 AI 判讀影像資料,準確增強人類的能力。」診斷醫師接受專業訓練,從檔案篩選出問題,AI 引導他們擴大評估的範圍也有助益,例如評估乳房攝影檢查來發現乳癌早期徵兆就是一個很好的例子。AI 的優勢在於找出人眼可能因為確認偏誤而忽略的模式。
生物醫學研究中的其他情境也可能從 AI 受益,特別是涉及影像資料的情況。Long 表示:「事實證明,有很多有很多其他視覺相關的醫療系統。」這些醫療系統都可以透過使用 AI 作為增強人類能力的工具中受益。
Long 表示:「 Dell 所帶來的是我們產品組合的廣度、合作關係的深度,還提供所需要的 IT 和基礎架構專業知識。」除此之外,Dell 也不忘醫療保健產業非常重視隱私還有保護病患敏感的健康資訊。Long 談到:「採用技術不只是為了控制成本,而是要透過技術推動人類對改善健康的倡議。我們致力於推動人類照護的進步。」
人工智慧在醫療業的前景
Mayo Clinic 讓我們得以一窺 AI 模型在生物醫學研究中的潛力。我們才剛開始探索 AI 在視覺影像資料上尋找相關性的方法,引導人類朝著新的探索方向前進。
研究人員通常會尋找相關性資料來得出結論,Long 表示:「AI 是用來識別相關性最好的選擇。我對 AI 在加速診斷、改善病患照護、迅速理解下一坡啟發法和療法的潛力非常期待。」
幾乎在每個產業都找得到新的邊緣 AI 和電腦視覺技術使用案例。在工廠裡面,自動光學檢測(AOI)和工業機器人等應用提高了作業效率。在醫療保健領域,這些技術增強了醫學影像和診斷的能力。還實現了我們的城市更智慧化的交通管理,以及提升辦公室和公共空間的安全性。
這麼多不同產業採用 AI 的現象也改變了企業領袖對未來的展望。AI 不再被視為在遙遠的未來才會實現的技術。AI 已經開始為各種類型的組織帶來正面的成果。研華科技(Advantech) 的產品經理劉家懿表示:「AI 正在被應用於現實世界的各種情境中。」研華科技(Advantech) 是邊緣 AI 平台和 AIoT 解決方案的供應商。「在當今的決策者的眼中, AI 是保持競爭力的『必須品』。」
現在是 AI 解決方案開發者絕佳的機會,但他們面對需要克服的挑戰,例如採用 AI 運算解決方案、整合軟體 SDKs、AI 模型訓練等等。
可喜可賀的是,嵌入式硬體夥伴關係讓強大、開發就緒的 AI 運算能力成為可能,像是華研科技(Advantech)的 GPU 卡 EAI-3101,設計搭載 Intel® Arc™ A380 GPU 。GPU 主要提供視覺影像最佳化,是目前用於增強 AI 運算能力的主要加速器之一。
最新嵌入式 GPU 卡支援多種 AI 使用案例
EAI 系列產品提供全方位的 AI 加速和顯示晶片解決方案,包括多款搭載 Intel Arc 顯示晶片的 PCIe 和 MXM GPU 卡。隨著即將亮相的 Intel Arc A380E,研華科技(Advantech)推出了 EAI-3101,這是一款全新嵌入式 PCIe GPU 卡,搭載 Intel Arc A380E,而且壽命長達五年。這款 GPU 卡採用 128 個 Intel Xe Matrix AI 引擎,提供 5.018 TFLOPS 的 AI 運算能力。透過最佳化的散熱解決方案和自動智慧風扇,這些 GPU 卡可以滿足各種使用案例,例如遊戲、醫療分析等。這些設計經證明在 AI 推斷功能和顯示晶片運算方面超越競爭對手。
AIR-150:採用第 13 代 Intel® Core™ 處理器的小型、無風扇邊緣 AI 推斷系統
AIR-310:搭載 MXM-GPU 卡以及第 14 代 Intel® Core™ 處理器支援的邊緣 AI 盒
AIR-510:採用第 14 代 Intel® Core™ 處理器和 RTX 6000 Ada 的邊緣 AI 工作站
這些邊緣 AI 平台 採用最新的 Intel 平台,適用於各種情境。企業可能會為辦公室選擇相對輕巧的 AIR-150。為了實現工廠的 AMR 自動化管理,AIR-310 提供所需的工業協定和具有可擴充性的 GPU 運算能力。至於可能需要更高顯示晶片運算的視覺輔助醫療解決方案,更強大的 AIR-510 是比較合適的選擇。
推動 AI 應用程式開發公平的競爭環境
除了硬體產品外,研華科技(Advantech)還提供跨平台邊緣 AI 軟體開發工具組(SDK)SDK 提供了評估 AI 應用程式在解決方案開發過程中早期硬體需求的基準工具。這有助於開發者選擇最適合解決方案的硬體,防止在過度的運算能力上超支。另外,SDK 還支援部署後的即時監控和無線(OTA)AI 模型更新。
OpenVINO 作為 SDK 的一部分,提供了模型最佳化和硬體加速的優勢。 開放原始碼推斷工具組還透過支援 PyTorch、TensorFlow和 PaddlePaddle等多種 AI 模型框架,幫助 AI 開發者簡化模型部署和軟體開工作流程。
開放原始碼工具組和 SDK 的可用性,再加上成熟的邊緣 AI 產品生態系統,能夠幫助更多的機器製造商、OEM 和 ODM 在穩定、開發就緒的 AI 運算環境以更有效的方式競爭。有助於縮短整體解決方案的開發時間,讓設計師更快推出創新產品。
研華科技(Advantech)也提供了邊緣 AI SDK,這是一款 AI 工具組,用於建立友善環境,從評估、採用 SDK,到在前面提到的 EAI 和 AIR 系列產品上部署。未來幾年,我們會看到更公平的 AI 應用開發競爭環境,有些人說這是「AI 民主化」。
劉家懿認為,以 AI 越來越發達的世界來說,這是應該走的正確道路。「AI 的力量不應該只掌握在少數公司手上。像我們的邊緣運軟平台、SDK 和 OpenVISO 這樣的資源都應該讓所有人運用,」劉家懿說道。「未來 AI 會無所不在,這就是為什麼我們需要這些開放又強大的解決方案。」
雖然醫療科技在過去幾年迅速發展,但在手術室中採用這些先進技術的步調卻比其他領域慢半拍。外科醫師習慣依賴他們精練的手法還有從經驗汲取的知識,這是有其中的道理。但是,醫療技術並不僅限於機器人手臂和 AI 引導手術;將醫療保健資料從傳統的閣樓解放出來,並且讓外科醫師在手術室中隨時取得這些資訊,就能讓醫療界往前邁進一大步。
但是,正因為其中的變化多端, AI 在把正確的資訊和選項帶給醫生的方面有很多可以發揮的地方。在一天之內,手術團隊可能會幫非常不同類型的病患動手術:一下是一個健康的 25 歲女性,一下又是一個重病的 85 歲男性。團隊必須要能夠調整很多因素,還有做出大量的決策。
認知過度負荷可能會導致做出次佳決策或是錯誤。大概每七個個案中就會有一個出現某種嚴重的並發症,機率超過 15%。所以我們在這裡談的是透過狀態意識,透過自動化來進行積極風險管理。這是藉由減少和消除認知過度負荷和臨床情況不斷變化所帶來的不必要差異。我們現在看到最好應用 AI 的個案是顯示特定病患和手術過程的具體資訊,這樣能夠引導整個手術的過程,讓結果在這種支援的情況下更好。
要有最好、最正確的見解,你就得需要完整手術前後的臨床還有過程記錄,但最重要的還是術中的空間,因為這當然是最關鍵的部分,差錯可能就是在這裡出現。就是因為這個原因,而且手術室很即時的特性,整個複雜的程度又高更了。從技術上來說,這對雲端來說不是特別容易的領域。所有過程都在邊緣上,因為沒有辦法依賴雲端的兩秒上傳和下載。所以在這種情境下,邊緣運算還有 Internet of Things 技術工具組就非常重要。
身為手術專家,我們對終端應用程式和使用個案非常瞭解,但在建立基礎設施方面沒有太多經驗。我們缺少其他在嚴謹性、實際架構上相似的使用個案的基準還有可以對比的資料。要有即插即用的智慧手術平台,智慧水準要很高,但在硬體方面不會太龐大,還要能夠產生資訊,同時具備接收演算法和產生 AI 的能力跟頻寬,又要即時顯示出來,這一整套需求其實蠻複雜的。
Intel 一直是我們密切的合作夥伴之一,他們幾乎就像是我們團隊的一份子,共同努力來實現這個目標。設計架構、找到合適的元件、採用他們的一些元件,像是OpenVINO™ 讓 AI 的滲透和使用成為可能,所有這些事情都非常重要。如果沒有像 Intel 這樣的合作夥伴,我們至少步調會慢很多,自己一個元件、一個元件慢慢找,可能還會出更多差錯。