10月27日,據(jù)美團官微消息,美團 LongCat 團隊正式發(fā)布 LongCat-Video 視頻生成模型。
據(jù)介紹,依托視頻續(xù)寫任務預訓練、Block-Causual Attention 機制和 GRPO 后訓練,LongCat-Video 可穩(wěn)定輸出5分鐘級別的長視頻,且無質量損失。同時,從根源規(guī)避色彩漂移、畫質降解、動作斷裂等行業(yè)痛點,保障跨幀時序一致性與物理運動合理性,完美適配數(shù)字人、具身智能、世界模型等需要長時序動態(tài)模擬的場景需求。
此外,針對高分辨率、高幀率視頻生成的計算瓶頸,LongCat-Video 通過“二階段粗到精生成(C2F)+塊稀疏注意力(BSA)+模型蒸餾”三重優(yōu)化,視頻推理速度提升至10.1倍。
