Google为其视频创建应用Vids推出了基于提示的头像定制功能,让用户通过文本指令来指导AI生成的主持人。该功能基于Vids现有的头像能力构建,已经为企业演示和培训视频生成合成主持人。现在用户可以指定这些头像应该如何表现、说话和展示内容,而不是依赖默认动画。
这感觉像Google在AI视频领域追赶而非引领。当Synthesia和HeyGen等公司已经提供了数月的精密头像定制功能时,Google的实现似乎专注于工作场景——比如HR培训视频和产品演示。这个时机表明Google正试图让Workspace更加AI原生,但他们正在进入一个拥挤的市场,在这里头像质量和自然度比提示工程更重要。
其他科技媒体缺乏额外报道很说明问题。要么Google悄悄推出了这个功能没有大肆宣传,要么这个功能不够引人注目无法在行业内产生轰动。鉴于我们看到初创公司的AI头像越来越逼真,Google专注企业的做法可能是更安全的选择,但也是较少创新的选择。
对于构建视频生成工具的开发者来说,这证实了基于提示的头像控制正在成为基本要求。真正的问题不是你是否能用文本指导头像——而是你的头像看起来和听起来是否足够像真人,让人们真正愿意观看。Google拥有基础设施优势,但头像质量是大多数用户评判这些工具的标准。
