中美AI模型差距正在縮小。
由李飛飛聯合領導,斯坦福大學以人為本人工智慧研究所(HAI)最新發布了2025 AI Index,用整整456頁追蹤了2024年全球AI行業的發展趨勢,並得出了這樣的結論。
至今,HAI已釋出了8份(含本次)AI年度報告,不過今年的這份卻尤為特殊。
這是我們迄今為止最全面的版本,人工智慧對社會的影響從未如此明顯。
雖然報告資訊量爆炸,但手快的網友已經提前為大家劃了重點:
AI推理成本降低了280倍開源模型正在迎頭趕上AI基準測試成績飆升……
話不多說,下面我們詳細展開報告中提到的一些重要結論。
中美AI模型差距正在縮小
從官網訊息來看,鑑於報告內容較多,HAI直接為大家挑出了其中最重要的12個結論。
我們先來看與國內最相關的部分。
中美AI模型差距正在縮小
首先就是AI模型方面,中國模型雖然數量不及美國,但質量方面已迅速縮小差距。
報告顯示,2024年美國機構一共開發了40個值得關注的AI模型,遠高於中國開發的15個和歐洲的3個。
不過,中美模型之間的效能差異正在快速縮小。具體表現為,在MMLU和HumanEval等主要基準測試上,二者的效能差異由2023年的兩位數縮小到2024年的接近相等。
同時,從中美模型過去一年在大模型競技場中的表現也能看出這一追趕趨勢:
當然,這一效能差距正在縮小的趨勢也不侷限於中美之間。
報告提到,排名第一和第十的模型之間的得分差距在一年內從11.9%降至5.4%,排名前兩位的差距現在僅為 0.7%。
也就是說,頂尖模型之間的競爭越來越激烈。
順帶一提,國內在發表AI論文和推出AI專利方面繼續保持領先地位。
中國是對AI最樂觀的國家
其次是在對AI的態度方面,中國始終是全球主要國家和地區中最樂觀的。
報告顯示,2024年中國有83%的人認為AI產品和服務利大於弊,排在後面的是印度尼西亞(80%)和泰國(77%)。
相比之下,美國(39%)、加拿大(40%)等的樂觀情緒遠低於國內。
不過從整體趨勢來看,自2022年以來,幾個之前對AI持懷疑態度的國家樂觀情緒增長顯著,比如美國(+4%)、加拿大(+8%)、法國(+10%)等等。
除了以上兩點,還有一些AI整體趨勢變化也值得關注。
AI基準測試成績飆升,表現逐漸接近人類
一個比較符合大家日常感受的結論是:AI模型在各大基準測試上的得分越來越高了。
報告顯示,研究人員在2023年引入了一些如今大家已耳熟能詳的基準——MMMU、GPQA和SWE-bench,以此測試更高階AI模型的能力極限。
然而僅僅一年之後,從測試得分來看,其效能呈現大幅提升趨勢,分別在MMMU、GPQA和SWE-bench上提高了18.8、48.9和67.3個百分點。
從整體趨勢來看,AI各大能力表現逐漸接近人類,甚至在某些場景下,智慧體能在限時程式設計任務中超越人類。
推理成本下降了280倍,開源模型正在迎頭趕上
另一個符合大家印象的趨勢是:AI正變得更加高效、經濟實惠和易於獲取。
過去兩年間,追求更具價效比的小模型逐漸成為一股潮流。
比如報告中提到的,在MMLU中得分超過60%的小模型:
資料顯示,由越來越強大的小模型驅動,對於效能達到GPT-3.5水平的系統的推理成本,在2022年11月到2024年10月間下降了280倍。
遺憾的是,複雜推理仍然面臨挑戰。
截至目前,AI模型在國際數學奧林匹克競賽問題等任務中表現出色,但仍無法很好應對PlanBench等複雜推理基準測試。
不過與此同時,開源模型也在縮小與閉源模型的差距。
報告中特意提到,在某些基準測試中,它們一年內的效能差異就從8%減少到僅1.7%。
另外在硬體層面,成本每年下降30%,而能效每年提高40%。
以上趨勢共同降低了人們獲取高階AI的門檻。
AI正在融入日常生活,企業投資增長強勁
正是由於AI獲取門檻降低,我們的日常生活也逐漸被AI改寫。
報告顯示,從醫療保健到交通運輸,AI正迅速從實驗室走向日常生活。
比如2023年,美國FDA批准了223種AI醫療裝置,而2015年僅為6種。
另外在自動駕駛方面,美國最大的運營商之一Waymo每週提供超過15萬次自動駕駛出行,而百度的經濟型「蘿蔔快跑」 (Apollo Go)自動駕駛出租車車隊現在已在中國多個城市提供服務。
整體而言,AI的應用落地正在加速。
2024年,有78%的組織報告自己正在使用AI,這比前一年增長了55%。
當然,以上服務也離不開企業對AI的大力投資。
報告顯示,2024年美國對AI的投資為1091億美元,這幾乎是中國(93億美元)的12倍和英國(45億美元)的24倍。
其中生成式AI尤其強勁,吸引了全球私營投資339億美元,這一數字比2023年增長了18.7%。
BTW,除了上述主要結論,報告還提到了:
各國政府正在加強對AI的監管和投資;負責任的AI生態系統正在不斷髮展,但不均衡;目前有2/3的國家提供或計劃提供K-12電腦科學教育(數量是2019年的兩倍),其中非洲和拉丁美洲的進步最大;2024年近90%的知名AI模型來自工業界,高於前一年的60%。