快科技12月2日消息,可灵AI正式全量上线其全新O1视频大模型,号称“全球首个统一多模态视频大模型”,打破传统视频生成工具功能割裂、操作复杂的痛点。
目前,该模型已在可灵App及官网开放体验。

全球首个统一多模态视频大模型!可灵AI O1正式上线:一句话生成视频
与以往需分步处理文生视频、图生视频、局部编辑等任务不同,可灵O1基于创新MVL(多模态视觉语言)交互架构,在单一输入框内无缝融合文字、图像、视频等多种指令。
结合Chain-of-thought技术,模型不仅能理解用户意图,还能进行常识推理与事件推演,实现更符合逻辑的视频生成。

全球首个统一多模态视频大模型!可灵AI O1正式上线:一句话生成视频
例如,用户上传一段真人视频后,只需简单对话指令,即可局部增加/删除元素、智能延展前后镜头、捕捉动作生成新画面。
更关键的是,O1通过多视角主体构建技术,彻底解决视频中人物或物体在镜头切换时“特征漂移”的行业难题,确保多主体场景下画面精准连贯。
此外,O1支持3–10秒自由生成时长,把叙事节奏的控制权交还创作者。
无论是短视频博主、广告团队还是个人用户,都能快速产出高质量、高一致性的创意视频。

全球首个统一多模态视频大模型!可灵AI O1正式上线:一句话生成视频

全球首个统一多模态视频大模型!可灵AI O1正式上线:一句话生成视频

全球首个统一多模态视频大模型!可灵AI O1正式上线:一句话生成视频
【本文结束】出处:快科技
发表评论: