舉凡製造、醫藥或教育,企業莫不使用 AI 轉型產業;就連一般人也看得出這個趨勢。轉型的幕後功臣則是打造解決方案與推動創新的開發者。這項演變的速度,快到連專業人士與專家也望塵莫及。值得慶幸的是,沒有人必須獨自摸索 AI 開發的領域,現成的社群與合作關係生態系統就是您最好的幫手。
參與這場討論的嘉賓是 AI 與開發者社群中兩家公司代表:Intel 的 AI 倡導者 Paula Ramos,以及 Voxel51 的共同創辦人 Jason Corso。Jason 同時任教於 University of Michigan 的 Robotics and EECS 系。他們的話題涵蓋 AI 未來趨勢、開發者如何為推動進展貢獻一己之力,以及參與開發社群的重要性,不僅造福企業與產業,同時也嘉惠開發者本人(影片 1)。
影片 1。Intel 與 Voxel51 的業界思想領袖,探討鼓勵參與開發者社群的重要性。(資料來源:insight.tech)
AI 領域如何演進,哪些趨勢是形塑這項演進的推手?
Jason Corso:過去幾年,有幾項重大發展主導了 AI 思維。第一項發展是大型語言模型問世,這類模型既可擷取大量標記長度,還能嵌入自然人類語言。這項發展也讓我們獲得了能夠真正自然互動的資源。
此外,我們認為結合視覺的語言是一大未來趨勢。這種語言將隨附新的運算功能、可公開取得的資料,以及利用這些基礎模型確實解決 Voxel 所謂「視覺 AI」領域新問題的能力。
附帶一提,我認為我們應該重視資料在各種 AI/ML 模型開發過程所扮演的角色。我們所打造的這種文化,對模型的重視程度勝過其他一切元素。在學校修機器學習課程時,最初是先用下載或教授給的資料集訓練模型,多半側重於演算法。然而,LLM 領域各行各業的領導者已經開始討論,在打造我們所使用的 AI 系統時,優質資料在結合模型、程式碼與資料的過程,扮演了舉足輕重的角色。
以 Voxel 為例,我們極為側重資料所扮演的角色,並且著重於為開發者提供模型以及處理資料的工具,而不是單純期望開發者生成指令碼,將這些資料視覺化。二十年前,我的資料集是數十個範本或成千上百個範本,對吧?如今,我們的資料集則是動輒成千上百萬個範本。因此,實際管理及理解失敗模式和分佈等實在一大難事,在我看來,需要新思維才能達成。
開發者在 AI 發展過程扮演什麼樣的角色?
Paula Ramos:由於情況瞬息萬變,因此開發者每天都在尋找出路。他們必須在人工智慧這個龐大的領域推動創新,因此必須發揮創意才能解決問題。或許我們遇到的問題與 20 年前無異,但現在的工具更完善,有更好的方法可以解決問題。我們還必須進一步思考應用的最終使用者。
目前存在一些挑戰,在我看來,模型開發、資料管理,以及如何以簡單方式部署部署這些模型,仍有成長空間。您是雲端系統還是邊緣解決方案的使用者?解決方案一向是越簡單越好,這也是開發者目前面臨的主要挑戰。
此外,開源社群在這個領域極為重要;這正在改變 AI 發展的節奏。若向所有人開放這些模型,他們就可以存取資料集,逐回改善這些模型。
開發者與 Intel 這類公司合作的最佳方式是什麼?
Paula Ramos:我們現在有很多個管道,也有各種解決方案。舉例而言,我們有硬體加速器可用來重新訓練或微調模型。我們也有可以在邊緣運作的解決方案。
還有開發者可以取用的邊緣參考套件。這是簡單解決複雜問題的一種方式。我們正設法透過教學課程、程式碼和影片,向他們示範如何在製造業、零售業、醫療保健業等不同領域推展業務。這個方法也適用於 LLM 以及如何操作多種模型。
或者開發者也可以使用 OpenVINO™ 將模型最佳化及量化。也就是說,他們可以使用現有的同一套基礎架構,還可將 LLM 最佳化及量化,而且我們也不會強迫開發者為了執行這些 LLM 購買特定硬體。OpenVINO 還讓開發者輕輕鬆鬆即可證明及測試這些 LLM。他們可以先建立試驗專案並提供範例,然後再轉移至實際或最終的生產系統。
我們卓越的儲存庫與開源社群,可以供開發者測試最新 AI 趨勢。如果今天有新東西問世,那麼該特定模型在兩天之內就會出現在 OpenVINO Notebook 儲存庫。舉例而言,您可以在那裡測試 Llama 3.1、YOLOv10 以及最新的 AI 趨勢。這是絕佳的工具。
開發者也可以取用 Intel Developer Cloud,在購買各式各樣的硬體之前先行測試。這實在是太酷了。他們可以取用加速器,以及最新的 AI 趨勢,例如 AI PC。
Voxel51 如何與開發者互動?
Jason Corso:我們的軟體稱為 FiftyOne。它基本上是一種視覺元件,同時也是軟體 SDK,可處理本文討論的工作,例如資料與模型改良。但最近我們推出了這個稱為 Panels 的全新功能。透過 Panels,不懂如何編寫 React 或 Java 或是有 UX 的任何內容,也可以為前端構建功能。您可直接在 Python 編寫,而且依舊能增強 GUI 功能。
我們是開放原始碼驅動的公司,但我們其實有數十位客戶使用我們的商業企業版 FiftyOne 軟體 FiftyOne Teams,而且它能讓您以團隊、雲端或內部部署的方式共同開發相同的功能。我們在製造、安全與汽車領域的客戶群廣泛。
我們今年稍早順利完成了 B 輪融資,而且其實我們正為核心工程工作和開發者關係工作,招募機器學習工程職位。我們對開發者深具信心,因此僱用了受過完整訓練、有能力撰寫論文和程式碼的對象,但他們的角色其實是與社群互動與聯繫。
產業活動如何協助開發者與更廣泛的社群互動?
Jason Corso:Voxel 在 CVPR 之前舉行了首次實體駭客松活動。我們在這類互動中觀察到,開發人員對於接觸新技術躍躍欲試,並且努力設法在新團隊合作解決新問題。
活動固然有趣,但我認為開發者活動的關鍵切入點顯然是教育。參加 CVPR 這類開發者活動或會議,才能真正掌握最新的脈動。去年我教授了電腦視覺入門這個課程:就某種意義而言,我每週花了三小時的時間舉辦這項開發者活動,引領 300 名學生認識電腦視覺。
然而,AI 領域發展神速,似乎每個人無時無刻都在吸收資訊,即使是長年投身這個領域的教職員也是如此。無論是尖端的研究論文,還是必須學習的新 API 與程式庫,要隨時掌握最新資訊都是不可能的任務。
因此,Voxel 設法每週舉辦一次技術活動,讓社群持續參與。以我個人為例,我在東部時間每週一中午都有開放諮詢時間,任何人從 Zoom 登入即可。幾個星期前,我們回顧了某人的論文,並瀏覽了幻燈片和實際的技術模型。但最後的成果卻是:「這是我第一次考慮踏入電腦視覺這個領域。我該注意什麼呢?」
有的是單純與基礎能力有關的原始教育,有的則是真正有助於參與並掌握最新脈動的開發者活動。
還有任何其他開發者應該善加利用的資源嗎?
Jason Corso:正如 Paula 先前說過,開放原始碼是孕育創新的途徑。我們的軟體 FiftyOne 放在 GitHub,歡迎大家建立分支,也可以送交 PR。我們每個月或每兩個月都會發布一次,而且每次發布都有一些屬於我們社群的內容。自發布以來,過去這四年,我們持續透過社群貢獻廣泛瞭解社群的需求。我衷心想對我們建立的開發者社群表示謝意。這個環境充滿活力又豐富,沒有這個社群,我們就不會有今天的成就。
雖然有實際活動,但光是加入開放原始碼專案,也是另一個真正參與 AI 開發者生態系統的好方法。
Intel 如何促進開發者在社群互動?
Paula Ramos:Intel 為了促進互動不遺餘力,而且我們為了與開發者共同推動創新,打造了多種管道。我們有龐大的生態體系統,涉及的範圍不限於推論,還包括訓練,例如異常偵測。
我們有一項名為 Innovator Program 的計畫,在計畫中,來自世界各地的多位開發者共同測試技術。開發者可以自行製作應用程式,然後與我們分享。基本上,他們建立自己的儲存庫,然後建立分支儲存庫,並且建立新的應用程式。日後我會在 LinkedIn 和我的網路重點介紹其中幾位創新者,敬請期待。
此外,我們還參與了 Google Summer of Code,在三個月的時間內與好幾位開發者及 OpenVINO 團隊的不同導師合作。去年,有位參與 Google Summer of Code 的學員,與導師撰寫了一篇關於 Anomalib 的論文。這篇論文送交 CVPR 的 Visual Anomaly Inspection Workshop 之後被接受了。
我們與大學的關係當然也是發展神速,協助大學展開研究,以及撰寫 Intel 能夠支援的研究計畫書。此外,我們透過會議消弭產業與學術圈之間的差距。
我們致力於參與開放原始碼社群,因為開發者是這個社群最重要的一環。我們始終認為,必須讓開發者在我們能提供的軟體使用這個硬體,他們加速之後才能改善管道與工作負載。這才是主要目的。
相關內容
若要進一步瞭解 AI 開發,請收聽 AI 夥伴關係帶動開發者創新。若要掌握 Voxel 的最新創新,請在 X/Twitter 的 @voxel51、LinkedIn 與 GitHub 關注他們。若要掌握 Intel 的最新創新,請在 X/Twitter 的 @intel、LinkedIn 與 GitHub 關注他們。
本文由 Erin Noble 編審。