雷递网 乐天 4月10日

生数科技今日宣布完成近20亿元B轮融资,本轮融资由阿里云领投,中网投、九安海棠、好未来、光合创投等投资人战略投资。

星连资本、达泰资本、建发新兴投资、百度BV风投、卓源亚洲等原有股东持续追加投资。

据知情人士对雷递网透露,阿里云领投7亿元,中网投投资了5亿元。生数科技这一轮融资很紧俏,老股东的份额都被砍了一半。

生数科技成立于2023年3月,由瑞莱智慧RealAI、蚂蚁集团与百度风投联合孵化,专注于多模态通用大模型的研发,公司研发人员占比近90%,核心团队源自清华大学人工智能研究院。

生数科技的标志性产品是视频大模型Vidu。该模型是长时长、高一致性、高动态性的视频大模型,支持文生视频、图生视频等功能,采用Diffusion与Transformer融合的原创架构(U-ViT),能一键生成长达16秒的1080P高清视频。

生数科技称,相对于大语言模型,通用世界模型天然承载着物理世界的视觉、听觉和触觉等多模态信息,能够还原人类对物理世界认知、模拟与交互的过程,让人工智能做到与真实人相似的自然交互过程,实现真正的物理 AGI。

生数科技致力于打造对数字世界和物理世界实现精准建模、推理、预测和行动的通用智能体系,以基座世界模型(Foundation World Model)为核心底层,推出应用于数字世界的世界生成模型(WGM)与应用于物理世界的世界行动模型(WAM)。

生数科技称,旗下的Vidu系列模型实现了声画同出、长时长、高时空一致性与电影级视觉品质。全球首创“参考生视频”技术,有效解决商业场景多主体连续一致性痛点,同时依托自研高效训练与推理架构,以及工程优化能力,实现高效生成和极致性价比。Vidu立足生产力场景,为企业客户和专业创作者带来高可控、高一致性、极低成本的模型服务,提升数字内容生产效率。

Vidu系列模型通过MaaS(Vidu AI开放平台)和SaaS(Vidu Agent、Vidu Claw)等方式向全球开发者、创作者和企业提供服务。

同时,Vidu现已登陆阿里云百炼平台,全面支持文生视频、图生视频、参考生视频等模型,为全球用户提供音视频生成能力,服务互联网、广告营销、动画影视、教育文旅等行业。

2025年12月,生数科技还开源了基于视频生成大模型的统一架构的世界行动模型 Motus,基于UniDiffuser统一建模框架,整合多模态知识,实现语言、视频与动作的统一表达与生成。Motus 模型验证了具身基础模型的Scaling law,实现了具身领域的“GPT2 时刻”。

作为真实世界具身智能的“大脑”,Motus致力于解决传统具身智能在链路割裂、数据稀缺与泛化能力缺失等方面的核心痛点,推动机器人从“模块化执行”迈向“统一智能体”。

光合创投合伙人蔡伟表示:通用世界模型正成继大语言模型之后,通往AGI的下一条核心路径。生数科技以U-ViT为底座,打通多模态感知与统一建模能力,在‘理解—生成—行动’之间建立起完整闭环,这不仅是技术上的跨越,更是范式上的重构。从Vidu在数字世界的高效生成,到Motus在真实世界的泛化行动,这种双轨推进,让AI第一次具备了同时作用于虚拟与物理世界的能力。我们看好生数科技成为这一代通用智能基础设施的关键构建者,期待公司不断取得新的突破。

BV百度风投管理合伙人&CEO高雪表示:“BV自首轮便坚定支持生数科技,此次B轮持续追加投资,正是我们高度认可团队核心技术实力、始终看好通用世界模型赛道前景的体现。我们坚信生数科技深耕数字与物理世界融合的AI技术路线,凭借领先的技术突破与产业落地能力,必将持续领跑行业,推动通用人工智能迈向全新发展阶段。”

生数科技创始人朱军表示:“世界模型的核心,是让AI具备对现实世界的统一表征与预测能力。视频是记录现实世界的重要载体,天然包含时间、空间、动作与因果关系等信息,是构建这一能力的关键载体。我们希望通过统一的模型架构,打通从感知到行动的完整链路,构建起贯通理解世界、生成世界与行动于世界的完整技术闭环,使通用世界模型真正成为连接数字世界与物理世界的桥梁。”与此同时,生数科技正加速布局全球化人才版图。

雷递由媒体人雷建平创办,若转载请写明来源。