AI 科學:科學發現與轉化的革命性的改變
2024年4月15日
Theresa Mayer, PhD
要運用人工智慧的力量為科學和社會服務,我們需要改變進行科學研究的基本方式
從具有里程碑意義的美國 CHIPS 與科學法案立法 打開新的分頁/視窗,到加拿大加速聯盟 打開新的分頁/視窗 (Acceleration Consortium) 等重大計畫,全球各地的領導者都對科學研究與創新投入大量資金,以解決當今與未來的重大挑戰。為了因應時代的急迫性,未來進行科學研究的基本方式必須透過推進與連結最近跨越實體與虛擬世界的突破性技術來改變,從遠端控制的高通量自動化實驗室,到由高效能運算與豐富的資料資源所驅動的全新且強大的基礎人工智慧與物理模型。 透過利用這些技術的整合力量,AI for Science 有可能加速前所未有的創新步伐。新的人工智能演算法與模型將帶來無與倫比的能力,協助科學家分析龐大且複雜的資料集,並找出引導其決策與實驗設計的模式。這將會開啟目前科學家無法獲得的突破性解決方案,因為科學家在很大程度上只能利用實際經驗和重點資料集來做出決策。與此同時,自動化的科學實驗將提供許多豐富的新資料集,並具備必要的規模與可重複性,以閉合人工智慧科學的實驗環路。這些實驗平台將為廣大的包容性人群提供民主化的存取和參與,加強全球跨學科的靈活合作,並加速科學發現轉化為實踐。這將為社會帶來巨大的潛在利益:大幅縮短發現救命新藥的時間和成本;開發用於清潔能源、建築和製造業的新型高效能材料;推進細胞農業以改善糧食生產等等。
這篇文章來自 Not Alone 電子報,這是一份每月出版的刊物,直接從研究與學術領袖的角度來展示全球問題的新觀點。
今天的機遇讓人聯想到將近四十年前科技快速變遷的時代。當時,一項向美國國家科學基金會 (National Science Foundation) 主動提出的提案,開啟了美國的高效能運算時代。該提案催生了大規模的協調投資,以建立一個分佈在不同區域的超級計算中心網路。這些超級運算中心以前所未有的規模大幅擴展了先進運算能力的使用,並協助帶動了區域創新中心的成長。自此之後,在硬體、網路能力、面向使用者的服務和人力方面的持續投資,催化了一個更強大且完全整合的先進網路基礎建設資源生態系統,讓全國各地的研究機構,不論其種類、規模或地理位置,都能受惠。
投資關鍵研究與教育基礎設施的 3 大支柱
今天,對 AI for Science 的策略性投資有可能開啟一個更強大的發現與轉譯時代。要充分發揮 AI for Science 的潛力,需要強大的領導力,以及公共和私營部門在新的、轉型性的關鍵研究和教育基礎設施的三大支柱上,進行大量且持續的投資::
高效能運算與資料設施,具備高效能 GPU 與 CPU 運算規模,有助於使用大型、多模態資料集;以及人工智能增強決策能力,並伴隨相關硬體、方法與訓練創新 - 安全與保全的設計與整合。
遠端存取的自動化科學實驗室,具備電腦程式碼驅動、完全整合的機器人控制實驗儀器,適用於生物、化學和材料科學的整合與大規模部署,透過完全可追蹤的高通量實驗研究工作流程來強化科學實務,並將高保真實驗資料和元資料傳輸至雲端供開放存取使用;以及
AI STEM 教育和勞動力培訓,旨在為各級多元化和包容性的 AI 和科學人才庫裝備所需的技能和經驗,以便在 AI for Science 永遠改變的經濟前沿茁壯成長。
AI for Science 的優勢
AI for Science 將建立在這些使能技術與能力的基礎上,摒棄過時的科學發現流程,這些流程主要是以直覺驅動的決策為基礎,並使用有限的資料。它將實現廣泛的額外效益,包括:
加速度、再現性和準確性:透過結合人工智慧、機器學習和高通量實驗室自動化,以及從一開始就融入的安全性,實驗的設計和進行速度可以遠超過以往,並具有無與倫比的準確性和再現性。這能夠解決科學的可重複性危機,並創造可行的監管途徑,減少科學進步和技術應用的瓶頸。
更強、更公平、更靈活的合作: 透過為計算、實驗和開放資料建立統一、可遠端存取的基礎設施網路,AI for Science 促進了在生物、化學、材料科學、電腦科學和工程學交叉領域工作的研究人員和教育工作者之間的國際合作。此外,它也促成了強大且靈活的公私跨領域合作關係。
投入的資金能產生更大的效益: 透過減少重複建置昂貴的基礎建設,並提供遠端存取大型整合式自動化工具集的能力,複雜的科學研究工作流程可以更低的成本執行,而且不受地域限制。這為所有教育等級、類型的學校與社區提供了更公平、更民主化的機會,讓他們都能獲得最先進的能力。
新技術與產業: 透過創造新的人工智慧技術,AI for Science 將加速創新的腳步,為全新的產業及相關的勞動力與工作機會播下種子。這將為不同教育程度與創業能力的個人提供經濟發展機會。
推動 AI for Science 的議程
在下一個十年中,AI for Science 的實現在很大程度上將取決於我們是否承諾共同定義並推動一個涵蓋基礎設施三大支柱的整合策略。初步的概念和試點正在積極的討論和發展中。以下是一些例子。
AI 計算與資料資源的整合網路
為了推進人工智慧科學,大學、非營利機構、中小型公司和新創企業的研究人員需要存取前所未有的高效能運算和資料資源,以進行基礎人工智慧和以物理為基礎的模型和運算。在美國,「國家人工智慧研究資源 (NAIRR) 導入計畫 打開新的分頁/視窗」提供了一個框架,讓公共與私人投資於下一代人工智慧共享基礎設施的主要組成部分,包括最先進的計算集群,以及存取資料、軟體、模型、訓練和使用者支援服務。為了加快 NAIRR 願景的概念驗證,我們推出了一項為期兩年的試點計劃,同時也集合了未來的投資,以實現存取的民主化。
可互操作的自動化實驗室統一網路
AI for Science 需要相應地重視並投資於遠端存取的自動化科學實驗室,以進行生物、化學與材料的實驗研究。此類實驗室網路將可支援複雜的高通量實驗研究工作流程,並統一且可互操作地收集與儲存高保真資料集。我們必須從一開始就將人工智慧安全與保障科學的重點議程納入其中,並將早期的實驗室視為測試平台,以應用、測量和測試負責任的人工智慧方法。該網路將為美國和全球任何規模或地點的機構中的研究人員、教育工作者和創業者提供使用先進實驗能力的民主化機會。
類似的自動化實驗室正在開發和部署中。近年來,領先的生物製藥、化學和材料公司在部署為滿足其市場需求而定制的實驗室方面取得了重大進展。以我們在機器人、自動化和人工智慧領域的開創性進展為基礎,卡內基美隆大學 (CMU) 已經成為第一個在大學校園內建立大型自動化科學實驗室的學術機構,該實驗室將在今年春季晚些時候開放供共用。CMU 雲端實驗室 打開新的分頁/視窗將可全天候遠端存取超過 200 台科學儀器,這些儀器由兩位 CMU 校友所創立的 Emerald Cloud Lab 所開發的共通軟體平台所整合。該實驗室利用機器人技術和人在環技術支援,可同時運行多達 80 種不同的高通量研究工作流程。該實驗室利用輔助感測器進行增強,以實現工作流程的端到端可追溯性,並收集和儲存全面的高保真數據集,以供後續分析和用於人工智慧模型。
人工智慧用於科學教育和勞動力培訓
目前,AI 所支援的科學發現、轉譯與高通量實驗的進展,已經創造出全新的職業發展路徑,並為不同教育程度的個人提供經濟進步的機會。隨著 AI for Science 的發展,它有可能從根本上改變科學教育的方式。舉例來說,學生將從學習乏味且耗時的實驗協議,轉變為編寫電腦程式碼來遠端執行實驗工作流程,並從使用有限的資料集憑直覺設計實驗,轉變為使用大型多模式資料集進行 AI 增強設計。此外,教育應該在整個課程中滲入負責任的 AI 方法和工具。
CMU 領先提供第一個自動化科學碩士學位,並在雲端實驗室提供本科化學課程。這項工作包括與莫爾豪斯學院 (Morehouse College) 合作試點,共同開發課程教材和流程,以便在美國各地的歷史性黑人大學 (HBCU) 和少數族裔服務機構 (MSI) 授課。第二個試點計畫正在進行中,最初的試點對象為匹茲堡地區的高中、兩年制和四年制學院和大學,以增加各教育層級的學習機會。這些努力也將確保 AI for Science 能在機器人與自動化、軟體與 IT 系統、實驗室營運與管理等鄰近領域,提供新的技術學位與證書,為高薪工作打開大門。
總結
AI for Science 是科學的未來。前進的道路是明確的,而可能性也是改變遊戲規則的。讓我們把握時機,透過科技創新創造更美好的世界。
學術界為人工智慧治理做好準備了嗎?
根據 Elsevier 和益普索的最新研究,還沒有: View from the Top: Academic Leaders’ and Funders’ Insights on the Challenges Ahead- 從高處看: 學術領導者和資金提供者對未來挑戰的看法。在受訪的學術領袖中,有 64% 表示 AI 治理是高度優先的工作,但只有 23% 已為這項挑戰做好充分準備。