全球首个统一多模态视频大模型！可灵AI O1正式上线：一句话生成视频

人工智能

2025-12-02

2次阅读

0条评论

快科技12月2日消息，可灵AI正式全量上线其全新O1视频大模型，号称“全球首个统一多模态视频大模型”，打破传统视频生成工具功能割裂、操作复杂的痛点。

目前，该模型已在可灵App及官网开放体验。

全球首个统一多模态视频大模型！可灵AI O1正式上线：一句话生成视频

与以往需分步处理文生视频、图生视频、局部编辑等任务不同，可灵O1基于创新MVL（多模态视觉语言）交互架构，在单一输入框内无缝融合文字、图像、视频等多种指令。

结合Chain-of-thought技术，模型不仅能理解用户意图，还能进行常识推理与事件推演，实现更符合逻辑的视频生成。

全球首个统一多模态视频大模型！可灵AI O1正式上线：一句话生成视频

例如，用户上传一段真人视频后，只需简单对话指令，即可局部增加/删除元素、智能延展前后镜头、捕捉动作生成新画面。

更关键的是，O1通过多视角主体构建技术，彻底解决视频中人物或物体在镜头切换时“特征漂移”的行业难题，确保多主体场景下画面精准连贯。

此外，O1支持3–10秒自由生成时长，把叙事节奏的控制权交还创作者。

无论是短视频博主、广告团队还是个人用户，都能快速产出高质量、高一致性的创意视频。

全球首个统一多模态视频大模型！可灵AI O1正式上线：一句话生成视频

【本文结束】出处：快科技