三個大模型合作,1000次迭代,竟能像人類科學家一樣發現方程

 2025-06-21 21:25:43.0

圖片

隨著 AI4Science 的浪潮席捲科研各領域,如何將強大的人工智慧模型真正用於分析科學資料、構建數學模型、發現科學規律,正成為該領域亟待突破的關鍵問題。

近日,中國科學院自動化研究所的研究人員提出了一種創新性框架 ——DrSR (Dual Reasoning Symbolic Regression):通過資料分析與經驗歸納 「雙輪驅動」,賦予大模型像科學家一樣 「分析資料、反思成敗、優化模型」 的能力

在 DrSR 中,三位 「虛擬科學家」 協同工作:

  • 一個善於洞察變數關係的 「資料科學家」;

  • 一個擅長總結失敗教訓與成功經驗的 「理論科學家」;

  • 一個勇於嘗試假設、不斷優化模型的 「實驗科學家」。

這三種角色基於大模型構建起高效的協作機制,共同驅動 DrSR 實現智慧化、系統化的科學方程發現。

在物理、生物、化學、材料等跨學科領域的典型建模任務中(如非線性振盪系統建模、微生物生長速率建模、化學反應動力學建模、材料應力 - 應變關係建模等),DrSR 展現出強大的泛化能力,重新整理當前最優效能,成為 AI 助力科學研究的有力工具。

圖片
  • 論文地址:https://arxiv.org/abs/2506.04282

  • 論文標題:DrSR: LLM based Scientific Equation Discovery with Dual Reasoning from Data and Experience

研究背景

在科學發現和工程建模中,尋找資料背後的數學模型一直是一項核心任務。這正是符號迴歸(Symbolic Regression, SR)的目標 —— 從觀測資料出發,自動生成解釋性強、結構清晰的數學方程。

這種 「從資料中還原規律」 的能力,已在物理、化學、生物、材料等多個學科中發揮了巨大作用,成為人類理解複雜系統的重要工具。

隨著大模型的興起,符號迴歸正邁入一個 「類人推理」 的新階段。例如,LLM-SR 等方法開始嘗試用大模型直接生成公式骨架(skeleton),再配合優化器擬合引數,實現 「從提示詞到方程」 的自動生成。這讓符號迴歸從傳統的遺傳進化演算法中解放出來,效能和表達能力雙雙提升。

但問題也隨之而來,這些方法雖然 「公式寫得快」,卻往往 「不看資料」,更 「不記經驗」。

模型生成公式靠的是大模型內嵌的科學知識,而非對當前實驗資料的深入理解。

一旦某個公式生成失敗,模型通常無法從失敗中改進策略,只會機械地重複嘗試,陷入 「盲猜」 或 「重走老路」 的困境。

結果就是:不是過擬合 「已有套路」,就是反覆生成無效表示式,計算資源浪費嚴重,智慧化程度受限。

爲了解決這一難題,研究團隊提出了全新框架 DrSR:讓模型 「會看題」「會覆盤」「會改進」—— 像科學家一樣,從資料中洞察結構、從失敗中總結經驗、在生成中持續進化。

DrSR:讓大模型 「有據可依、步步為營」 地發現規律

DrSR 的核心理念是 「雙路徑推理」(Dual Reasoning):通過引入 「資料洞察」 與 「經驗總結」 兩條資訊流,為大模型提供結構引導與策略反饋,讓其像科學家一樣高效、穩健地進行探索。

DrSR 的兩大關鍵機制包括:

  •  資料驅動的洞察生成(Data-aware Insight Extraction)

  •  經驗驅動的策略總結(Inductive Idea Learning)

DrSR 的流程並不複雜,關鍵在於:讓 LLM 在每一輪嘗試中都 「看資料、學經驗、再出手」,具體流程如圖 1 所示。

圖片

      圖 1:DrSR 的雙路徑推理機制,讓 LLM 在分析、生成、覆盤三個環節協同工作,模擬科學家的研究思維

模組 a:從資料中提煉結構線索

  • 資料分析模組由一個 「結構洞察型 LLM」 構成,它負責分析輸入輸出變數之間的對映關係,提取變數之間的耦合程度、單調性、線性 / 非線性趨勢等結構特徵。

  • DrSR 不只分析原始資料,還會根據上一輪候選方程的殘差,進一步定位 「沒擬合好」 的數據段,為後續方程生成提供更高質量的提示。

模組 b:從歷史結果中總結成功經驗

方程一旦生成,DrSR 不僅會進行擬合與打分,還會將結果分類為「效果更好」「效果變差」「無法執行」三類,並交由一個 「經驗型 LLM」 進行分析,總結出可以重複利用的經驗知識

該模組會進行如下反思:

  • 為什麼這條方程效果更好 / 更壞 / 無法執行?

  • 從這次方程的生成中,可以總結出什麼經驗或教訓?

總結出的知識以 idea 的形式存入 idea 庫(Idea Library),供後續輪次呼叫,提升生成策略的有效性。

模組 c:方程生成 + 數值擬合

DrSR 的 「主控型 LLM」 負責綜合問題描述、資料分析結論和 idea 庫的經驗,生成方程 skeleton。隨後呼叫 BFGS 等優化器進行係數擬合,並評估方程的整體誤差。表示式被送回評估路徑,進入下一輪經驗提煉與資料再分析迴圈。

這個模組是整個 DrSR 的 「前臺」,而 a 與 b 是強大的 「後端支援」。

總結來說,DrSR 的執行流程是一種閉環:

資料分析 → 提示引導 → 方程生成 → 評估打分 → 經驗總結,如此迴圈。每一次生成,模型都在積累知識、修正路徑,從 「盲目試探」 走向 「有的放矢」。

實驗結果:DrSR 不僅 「更準」,還 「更快、更穩、更聰明」

研究團隊在六大符號迴歸基準任務上系統評估了 DrSR 的效能,涵蓋物理、生物、化學、材料等多個科學領域,結果顯示 DrSR 全面超越現有主流方法,不僅準確率更高,而且在推理效率和泛化能力上也顯著領先。

全面領先的擬合精度與準確率

圖片

      表 1. DrSR 和基線方法在六個符號迴歸基準上的總體效能

如表 1 所示,平均來看,DrSR 在 6 個任務中有 5 個取得了最高準確率(Acc)和最低歸一化均方誤差(NMSE)。特別地,DrSR 在非線性阻尼振盪系統建模任務(Oscillation 2)上達成了近乎完美的 99.94% 準確率,誤差低至 1.8e-12,顯著優於所有基線方法。

快速收斂:從一開始就更聰明

圖片

      圖 2. 訓練收斂性比較

從圖 2 可以看到,DrSR 在幾乎所有資料集上都以更快速度達到更低的誤差。在初期迭代階段,其誤差下降趨勢也更穩定,不容易陷入振盪或卡頓,這說明 DrSR 的雙推理策略能更有效引導方程生成方向,從而減少無效嘗試次數。

✅ 有效率更高:生成的方程更 「靠譜」

圖片

      圖 3. 有效解比例對比

如圖 3 所示,DrSR 生成的方程在語法、編譯、可求值等方面的有效比例普遍高於 LLM-SR 約 10%-20%,這背後正是 「經驗學習」 機制的作用 —— 模型逐步避開常見失敗結構。

泛化更強,且對噪聲和 OOD 更魯棒

圖片

      圖 4. 在 ID 和 OOD 資料下跨科學領域的泛化對比

圖 4 展示了 DrSR 在 ID(域內)與 OOD(域外)資料下的效能對比。可以看到:在所有任務、所有設定下,DrSR 的歸一化均方誤差(NMSE)始終是最低的,展現出極強的模型穩定性。其他方法(如 PySR 或 uDSR)雖然在部分任務中 ID 表現尚可,但面對 OOD 分佈時誤差陡升、效能驟降,而 DrSR 則表現出了 「跨場景保持魯棒」 的能力。

圖片

      表 2. 不同高斯噪聲水平下的效能比較

如表 2 所示,在不同高斯噪聲水平下,DrSR 均顯著優於 LLM-SR,展現出抗噪、抗漂移的泛化優勢。

消融實驗:兩個核心機制 「缺一不可」

圖片

      圖 5. 消融實驗

圖 5 的消融實驗也驗證了兩個核心機制的重要性:沒有結構引導,模型不知從何生成;沒有經驗總結,模型容易反覆試錯。DrSR 的成功,正是這兩者閉環協同的結果。

案例展示:DrSR 如何一步步逼近 「真實方程」

爲了更直觀地展示 DrSR 的 「類科學家」 建模過程,研究團隊以非線性阻尼振盪系統建模任務為例,繪製了其在 1000 次迭代過程中的方程演化軌跡,如圖 6 所示。

圖片

      圖 6. DrSR 的效能軌跡與代表性表示式演化,每一個臺階,都是模型一次深刻的 「認知飛躍」

該任務的真實方程為:

圖片

DrSR 在僅 1000 輪迭代後生成的最優方程為:

圖片

基線 LLM-SR 在 2000 輪迭代後生成的最優方程為:

圖片

可以看到:DrSR 用一半的迭代次數,就生成了更接近真實結構的表示式,充分體現其 「有方向感」 的探索能力。

這一案例也展現出 DrSR 獨特的三大智慧行為:

  • 初期:大膽探索,快速淘汰

在前幾十輪中,DrSR 嘗試了一系列初步構造的方程,例如僅包含多項式組合的表示式(如 -0.5xv - 0.04x² - 0.24v² 等),儘管形式接近,但精度仍遠未達到理想值。此階段模型更像一個 「實驗科學家」,快速試錯、積累經驗。

  • 中期:融合非線性成分,跨越式發展

隨著經驗的積累與數據結構的洞察引入,DrSR 開始生成帶有 sin (x)、x²v 等非線性物理元素的表示式,方程擬合誤差明顯下降近兩個數量級,說明模型已開始理解系統的振盪性本質。此時,它如同一個 「理論科學家」,開始用正確的符號結構組織規律。

  • 後期:精煉組合,逼近真實動力學

最終,DrSR 提出了形如 0.8sin (x) - 0.5xv - 0.5v³ - 0.2x³ 的複雜但精確表示式,誤差降至 10^-5 級別,接近人類解析解。這一過程高度模擬了科學發現中的 「假設 - 驗證 - 歸納」 的迭代式建模模式。

這個案例生動說明了 DrSR 如何結合 「結構洞察 + 經驗引導」 兩種智慧,逐步收斂到準確又可解釋的科學方程。

總結:讓大模型更像科學家,科學智慧邁出關鍵一步

DrSR 提出了一種融合資料感知與經驗反思的符號迴歸新正規化,它通過結構洞察指導生成方向,通過經驗總結提升推理質量,讓大模型在科學建模中逐步具備 「看資料、記教訓、會修正」 的能力。

在多個跨學科的符號迴歸任務中,DrSR 實現了對傳統方法與現有 LLM 基線的全方位超越,在準確率、收斂速度、方程有效性和泛化能力等維度表現突出。作為一套通用性強、可解釋性好、建模效率高的新架構,DrSR 為人工智慧深度參與科學發現提供了堅實技術支撐。

DrSR 已整合至一站式智慧科研平臺 ScienceOne,為科研工作者提供高效、可解釋的科學建模服務。值得強調的是,DrSR 並不依賴特定的大模型,具備良好的模型相容性和可擴充套件性。未來,研究團隊將基於平臺自研的科學基礎大模型 S1-Base,進一步增強 DrSR 在科學建模中的推理能力與跨任務泛化能力。

侷限與展望

儘管 DrSR 展現出優異的建模效能與類科學家的推理能力,但仍存在若干值得改進的方面:

  • 輸出波動:由於大模型生成本身具有隨機性,部分方程可能存在結構冗餘、表達複雜等問題,仍需人工後處理或規則約束。

  • 模態輸入有限:DrSR 目前主要面向結構化數值資料,尚未支援影象、圖表等更豐富的科學輸入形式,制約了其多模態建模能力。

這些問題正是未來演進的關鍵方向。研究團隊計劃繼續擴充套件 DrSR 至多模態科學建模場景,引入持續學習機制,提升策略泛化能力,逐步構建一個具備長期認知積累、適應科學複雜性的智慧建模引擎。

讓人工智慧不僅能 「擬合數據」,更能 「發掘自然規律」,這正是 AI4Science 走向深層科學智慧的必由之路。

文章來源:機器之心