生數科技與清華大學聯合發佈瞭中國首個長時長、高一致性、高動態性視頻大模型 Vidu,該模型采用原創的 Diffusion 與 Transformer 融合架構 U-ViT,能一鍵生成 16 秒時長、1080P 分辨率的高清視頻內容。