海螺新模型海外爆火:一夜之間,貓、羊駝、長頸鹿都學會跳水了

 2025-06-22 20:41:30.0

一個貓咪跳水的視訊,5 小時就引得上百萬人圍觀,這是動物界的奧林匹克?    

除了貓咪,參賽的還有羊駝、熊貓甚至長頸鹿……

圖片
圖片
圖片

當然,大家都知道這是 AI 做的,但相比之前,裏面的 AI 痕跡已經沒有那麼明顯了。要知道,以前讓 AI 生成複雜運動,它們給出的結果大多是這樣的:  

圖片

這也是為什麼,體操等複雜運動一直被視為視訊 AI 模型的「圖靈測試」。

這波「動物界奧林匹克」的熱度是國內 AI 公司 Minimax 的新模型 ——「Hailuo 02」所帶來的。本週三,該模型官宣上線。在官方釋出的視訊裡,Minimax 給大家展示了新模型的生成的各項「雜技」,並表示,「藝術家們發現類似體操這種高度複雜的場景,Hailuo 02 是目前全球唯一一個可以做到的模型。」

當然,這個「全球唯一」還有待驗證,但在大家發現它驚人的物理動作生成能力後,社交媒體上便充滿了海螺 AI 生成的高難度動作視訊。

image.png

這些視訊的提示詞並不複雜,我們找到了其中一個版本進行測試,效果還不錯(不過要想得到完美結果,可能需要多次測試):    

image.png

提示詞:televised footage of a cat is doing an acrobatic dive into a swimming pool at the olympics, from a 10m high diving board, flips and spins

如果你想生成其他動物的視訊,只需要替換提示詞中的「cat」。

不過,有人提到,就跳水這個動作來說,阿里的通義萬相 wan-2.1-t2v 也能做得很好,這是他在該模型 2 月份剛開源時測到的結果:   

圖片

除了跳水,網友們還拿 Hailuo 02 測試了其他複雜運動,比如單雙槓、藝術體操、跳高:  

圖片

這個模型是怎麼把複雜運動做這麼好的?在官宣模型的文章中,Minimax 表示新模型使用了一種名叫「Noise-aware Compute Redistribution(NCR)」的架構,並公佈了架構圖:   

image.png

看到這裏,很多人可能會問,這些視訊有什麼用呢?這就不得不提最近在短視訊平臺上走紅的各路 AI 視訊 up 了。有人用一隻橘貓,就能編出各種小短劇,比如把各種動物拐回家吃掉,偶爾一集不吃都能讓觀眾覺得非常新鮮。這樣的視訊,甚至有人每天追更。

image.png

說到底,這些 AI 視訊工具最廣泛的用途就在於幫普通人實現創意。AI 視訊工具功能越完善,能借助它們進行創作的人就越多,大家能看到的內容就越豐富。當然,相應地,觀眾對於「創意」的要求也就越高。

除了工具,在現階段,提示詞對於 AI 視訊創作也很關鍵。如果大家有好玩的提示詞,歡迎在評論區分享。

文章來源:機器之心