
科學塑造人類生活的每一方面;從健康到能源生產,以至是國家安全甚至我們對宇宙的理解。如果人工智能可加快科學進程,縮短從產生新想法到驗證結果的時間,將能造福整個社會。
然而,創新的步伐仍然面臨限制。即使有了正確的想法,將其轉化為產品或療法也可能需要數年。在最近的一項調查(在新視窗中開啟)中,60%的美國人表示科學和醫學突破對他們來說來得太慢;73%的人表示我們需要更好的方法來加快科研發現;69%的人認為科學領導力是國家的首要任務。
今天,我們發表《利用 GPT‑5 加快科學實驗早期進度(在新視窗中開啟)》一文,這是一篇與范德堡大學 (Vanderbilt)、加州大學柏克萊分校 (UC Berkeley)、哥倫比亞大學 (Columbia)、牛津大學 (Oxford)、劍橋大學 (Cambridge)、勞倫斯利佛摩國家實驗室 (Lawrence Livermore National Laboratory) 及傑克森實驗室等大學 (The Jackson Laboratory) 及國家實驗室合作者共同撰寫的論文。當中整合了數學、物理學、生物學、計算機科學、天文學和材料科學的早期案例研究,見證 GPT‑5 協助研究人員以新穎手法綜合已知結果,可靠實用的文獻回顧功能,加快複雜困難的計算,甚至為未有解答的命題產生新證明。此外,該論文也記錄了其限制。我們的目標,是讓社群清楚了解這些系統在當前研究環境中能做甚麼和不能做甚麼。
這些案例研究顯示了專家如何利用 GPT‑5 加快科學發現,以及這種加速為何重要:
- 生物學:在由 Derya Unutmaz 醫生領導的一項研究中,科學家們花了數月時間試圖解釋人類免疫細胞中某個令人困惑的變化。GPT‑5 在幾分鐘內,從一份未公開的圖表中識別出可能的機制,並建議了一個證明該機制的實驗。這種速度有助研究人員更快地了解疾病,並開發出更好的治療方法。
- 數學:在另一個案例中,研究人員 Mehtaab Sawhney 和 Mark Sellke 正在處理一個幾十年前由 Paul Erdős 提出的開放性問題。他們卡在了最後一步,而 GPT‑5 提出了一個關於某個奇數如何打破模式的新想法,幫助他們完成了證明。這類進展強化了許多演算法和安全技術最終依賴的數學基礎。
- 演算法及最佳化:研究人員 Sébastien Bubeck 和 Christian Coester 測試機械人和路由中常用的決策方法是否如預期般可靠。GPT‑5 發現了一個新的清晰示例,顯示該方法可能會失敗,並改進了某個典型常見的優化結果,亦即用於找出解決問題最佳方法的數學依據。這種進步有助工程師加深理解機械人、路由和其他現實世界應用程式中使用的決策系統。
OpenAI for Science 的使命是加快科學發現:幫研究人員探索更多想法、更快地測試假設,並發掘原本需要花費大量時間的見解。我們透過將先進模型與合適的工具、工作流程和合作來達成此目標。
我們與學術界、工業界和國家實驗室的研究人員密切合作。這些合作幫助我們了解模型在哪些方面有用,在哪些方面會失敗,以及如何將其整合到科學過程中;從參閱文獻和產生證據,以至是建立模型、模擬和實驗設計。
我們的方法結合了兩種互補的信念。專門的科學工具,如模擬引擎、蛋白質數據庫和計算機代數系統,對於效率和精確度極為重要。與此同時,擴展基礎模型繼續釋放新的推理能力;跨領域連接想法、草擬證明、提出機制,以及根據概念而非關鍵字來瀏覽大量文獻。對於原先已有專門工具的領域,我們希望使用這些工具;而在需要一般推理的範疇,我們則會構建能夠處理相關問題的模型。這兩種渠徑相輔相成。
最有意義的進步來自人類與人工智能的團隊合作。科學家負責議程,釐定問題、選擇方法、批判想法並驗證結果。GPT‑5 則提供廣度、速度以及同時探索多個方向的能力。
有效地使用 GPT‑5 是一種技能。研究人員學會如何提出問題、何時反駁、如何將問題分解成步驟,以及獨立驗證哪些內容。有成效的工作通常類似對話;研究人員和模型不斷地迭代,直到出現成效理想的方向,或者某個想法被推翻。
在這些早期研究中,由專家使用 GPT‑5 似乎能夠縮短部分研究工作流程。雖然無法自主運行項目或解決科學問題,但可以擴大探尋的範圍,幫助研究人員更快地達到正確結果。
- 其中一項越見重要的能力,是概念性文獻搜尋。GPT‑5 通常能識別構思之間更深層次的關係,並從跨語言和不易取得的來源中檢索相關資料。研究人員表示,他們因而發現了以往不知道的參考文獻、聯繫和論文。
- 在結構明確、反饋循環快速的數學和理論電腦科學中,GPT‑5 尤其有用。數學家使用 GPT‑5 可在短短幾分鐘內產生出可行的證明大綱,改變原本可能需時數天或數週的工作。在物理學和運算領域,該模型可以提出簡化的轉換,或指出其他領域中的類似結構。
- 在生物學和其他實證科學中,模型可以提出機制並設計實驗,以在濕實驗室中驗證這些假設。
我們已經超越了模型僅僅總結現有知識的階段。現在,GPT‑5 的早期貢獻可以在專家監督下有意義地協助研究人員。速度有所改善,顯示隨著能力和工具進步,可能會進一步加快科研步伐。
這些案例研究是精心策劃的範例,展示了 GPT‑5 的應用範圍,但並非系統性樣本,無法涵蓋所有失效模式。專家的監督仍然是必不可少的。GPT‑5 有時會產生看似合理但實際上不正確的引用、機制或證明;可能對結構和熱身問題過度執著;有時會忽略領域之間的細微差別;如果不加以糾正,可能會沿著無效的推理路徑前進。這些都是活躍的研究領域,我們正與合作夥伴合作,在改進未來系統的過程中,評估並減少這些失誤。
綜合來看,這些早期研究顯示 GPT‑5 開始能協助新型科學工作。該模型並非自主運作,但在專家手中,此工具能協助證明定理、重新發現與擴展結構、揭示跨領域連繫,並產生機制與實驗以供科學家驗證。
我們也看到這些系統隨著時間和運算能力增加而不斷改進。如果 GPT‑5 能在 20 分鐘內有效地協助解決某些研究問題,我們預期當模型能花上數小時甚至數天來推理問題時,會有更深入的成果。結合世界一流的科學家,只要假以時日,科學生產力有可能大幅飛躍。


