一个是视频翻译配音工具,可以将视频的声音替换为另外一种语言。还有一个是视频混剪工具,它会打乱视频场景的顺序,生成一个新的“独特”的视频。

上面是第一个工具的效果,视频是韩国女团出游的 VLOG(该视频允许被使用),原视频是韩语讲话,经过工具翻译后变成国语讲话。这不是简单的解说哈,解说主要是创建一段声音然后(作为音轨)并入视频就差不多了,而上面的视频中,国语讲话是与角色的原始讲话时间对齐的。

它的原理大概这样:提取视频的音轨,对音轨进行语音识别、翻译并生成字幕(SRT)文件,使用 TTS 合成 SRT 里所有的配音语音,然后再根据 SRT 的时间点插入对应的合成语音生成新的音轨,最后与影像轨道合并为新的视频文件。当然,其中还有背景音、人声、语音速度的一些处理,不太重要的细节我就不啰嗦了。

大部分的语言都可以支持,视频里是韩语转为国语,其实我也做了韩语转英语,不过没发到视频平台,毕竟国内平台嘛(发英语不太合适)。TTS 发音角色也是可以随意换的,有的角色还有发音情感可以选择。视频里保留了一些原始语音,因为只有合成语音配音效果不是很好,所以留了一点,其实原始语音是可以去掉的。

另外一个工具的效果我就不太方便展示了,它是基于视频关键帧分析影像里的场景切换,然后剪辑并且以随机顺序连接,生成新的视频。它的作用是绕过重复内容的机器审查,生成的视频看起来是“独特”或“原创”的,当然,平台也不傻,人类还是可以轻松分辨两个视频是否相同。


有段时间我看到别人讲述转载视频创收的事情,觉得大概可行,于是就开发了这两个小工具(第一个工具两周,第二个工具一天)。不过,视频媒体这东西,从更高层次上看基本上是做流量,流量高了就需要原创内容,而搞技术的基本不擅长媒体创作,这东西不是谁都适合去搞。

不过,搞点转载,小打小闹还是没问题,如果和视频平台关系好的话就更好了。这两个工具可以在短时间内大批量“创作”。第一个工具 10 分钟可以完成半小时的视频翻译,第二个工具一小时可以完成 100 个视频的去重,有需要的可以联系我哈。