在今年的I/O开发者大会上,谷歌发布了新一代视频生成模型Veo3,这是其首个可以生成视频背景音效的模型。该模型不仅能合成画面,还能为鸟鸣或街头交通等场景配上相应的音效,甚至能够生成人物对话。据称,Veo 3在物理模拟与口型同步方面表现出色。
目前,这一新模型仅面向美国地区的Gemini Ultra用户以及Vertex AI的企业用户开放,并已被集成到谷歌的AI影视制作工具Flow中。通过Flow,用户依然可以上传人物、风格、场景或物体的图像作为参考,并利用镜头控制功能进行旋转、缩放,甚至调整画面从竖屏到横屏,或者在视频中添加、删除元素。
面对越来越难以辨别的人工智能生成内容,谷歌推出了SynthID Detector工具。用户可以通过上传媒体文件来检测其中是否包含由谷歌用于标记AI作品的SynthID水印。不过,值得注意的是,目前并非所有的图像生成模型都支持这种水印技术。