视频模型

Luma AI Ray3.2 上线:16关键帧 + 8人面捕 + HDR EXR,AI视频向专业制作又迈一步

2026年6月10日2 次阅读
draft.md

draft.md

基于已整理草稿生成的网页版文章,适合先稳定落地,再做局部润色与发布检查。

6月9日,Luma AI 发布 Ray3.2,这是其 AI 视频生成模型的最新版本。核心升级在于把专业视频制作中的关键能力——逐帧关键帧控制、多人面部追踪、高动态范围输出——直接打包进了 AI 生成流程,并首次开放完整 API,支持接入工作室软件和内部制作系统。

16个关键帧:让AI视频"可导演"

Ray3.2 支持在单条视频中放置最多 16 个关键帧,创作者可以精确控制运动轨迹、节奏起伏和场景演进。

这和市面上大多数 AI 视频工具的"运镜"功能不一样。那些工具的"运镜"通常只是"向左平移""推进""旋转"这类简单指令,粒度粗糙,无法表达复杂的镜头意图。Ray3.2 的多关键帧设计,让创作者可以像在 Premiere 或 DaVinci Resolve 里使用关键帧动画一样,对镜头语言进行精确编排——设定起幅、关键动作点、落幅,模型在它们之间自行生成流畅过渡。

Luma 对这个能力的定位很明确:不是给普通用户"图一乐"的消费功能,而是面向"有分镜、有执行计划"的专业创作场景。

面部追踪升级:8人同框不崩脸

上一版本 Ray3 的面捕只支持单人或双人,对于群戏镜头、家庭影像、活动现场等场景力不从心。Ray3.2 将面部性能追踪升级为逐帧追踪最多 8 张人脸,同时骨骼姿态和手势也被纳入追踪范围。

这意味着:拍一段多人会议或者家庭聚会视频,即使人物频繁出画入画,AI 也能在生成过程中保持每个人的面部和肢体一致性,减少"换脸"的出戏感。

HDR + 16位 EXR:为后期制作而生

这是 Ray3.2 最区别于消费级 AI 视频工具的特性。

模型原生支持 HDR(高动态范围)生成,并输出 16 位 EXR 格式。EXR 是好莱坞视觉特效和调色行业的事实标准格式,广泛用于 After Effects、Nuke、DaVinci Resolve 等专业软件的工作流。拿到一段 Ray3.2 生成的 EXR 素材,创作者可以直接拖进合成软件做颜色分级,不需要经历格式转换或画质压缩。

Luma 把这个能力形容为"direction goes in, cinema comes out"——输入导演指令,输出电影级素材。

API 开放:从玩具到工作站

这是 Luma 第一次将 Ray 模型的完整控制面通过 API 暴露给开发者。

工作室可以在 Figma 插件、Maya、Premiere Pro 等现有软件中直接调用 Ray3.2,无需跳转 Web 界面、手动导出导入。对于媒体公司来说,这意味着 AI 视频生成可以直接嵌入已有的资产管理系统、剪辑环境和审片流程,而不是作为独立工具存在。

API 的开放也意味着第三方开发者可以将 Ray3.2 能力嵌入自己的 SaaS 产品或工作流工具,进一步扩大 Luma 的商业覆盖范围。

20秒 1080p:打破"短视频"魔咒

当前大多数 AI 视频工具限制在 5-10 秒的短片段,Ray3.2 支持最长 20 秒的连续输出。这个时长对于叙事性内容有明显优势——从"一个动作"扩展到"一个场景",降低了镜头之间的断裂感,更适合需要有起承转合的内容类型。

受众

Ray3.2 的功能集指向非常明确的专业用户:

  • 影视概念设计、广告制作团队(需要分镜级别的控制权)
  • 游戏工作室(预演、概念视频、环境演示)
  • 独立创作者(短片、MV,需要比消费工具更强的叙事能力)
  • AI 视频开发者(通过 API 集成到自己的产品或工作流)

对于普通消费者,Ray3.2 的学习门槛和定价门槛都偏高,更适合有专业制作背景的用户。

---

> 📌 来源:本文基于 itbrief.news(2026-06-09)报道整理,综合 Luma AI 官方产品页(lumalabs.ai/ray)信息。

参考来源

说明:该页面由基础模板稳定生成,后续可继续局部润色样式或补充模块,再进入发布检查。