做视频不用动手？我全程只动了嘴

作为纯小白，我花了 2 个小时，用嘴「说」出了一个视频。

不是比喻，是字面意思。

前几天看到一个叫 Remotion Skill 的东西。简单说，它能让你通过跟 AI 对话，用代码生成动态视频。

我想试试，就把之前写的那篇《写到一半要配图？我终于让写作和配图「离婚」了》丢给它，让它帮我做一个短视频。

最后出来的效果还不错。审美、转场、音乐，都挺像那么回事。

整个过程中，最花时间的是音乐卡点。

音乐卡点调整.png

下载了一首 EDM，要让鼓点跟画面转场完美契合。这事儿听起来很技术，但我全程没动手。

我只是跟它说：「这里转场慢了，往前挪一点。」

它就去改代码。

我又说：「现在鼓点落在画面切换之前了，再往后调一点。」

它又去改。

就这样来回几轮，卡点就对上了。

这个过程让我印象最深的，不是最终效果，而是交互方式。

用这个 skill 做视频的时候，我不需要去想：这个动画要怎么实现？这个转场用什么参数？这个卡点要算多少帧？

它会先反问我几个问题：你想要什么风格？节奏快还是慢？要不要加文字动画？

我回答了，它再去生成代码。视频效果随之变化。

不满意？继续说。它继续改。

对话界面可视化.png

后来我在想，这个东西适合谁用？

普通人：只要你脑海里有画面，有场景，你就能用语言描述出来，让 AI 帮你做成视频。

不需要会 Premiere，不需要懂 After Effects，甚至不需要知道「关键帧」是什么。

专业人士：如果你本身就是设计师，或者做视频的，那你跟 AI 沟通的时候，用词会更精准。你想要的画面、效果，描述得更清楚，最终出来的东西也会更好。

它还能做什么？

除了给文章配视频，我查了一下，它的适用场景还挺多。

比如年度回顾类的个性化视频，像 Spotify Wrapped 那种，每个用户看到的内容都不一样。或者把数据、图表做成动画，让枯燥的数字动起来。

再比如批量生成社交媒体内容，产品介绍、功能亮点，一套模板改改数据就能出一堆。还有教程视频，代码演示配上讲解，也能自动生成。

说白了，只要是「模板 + 数据」能批量搞定的视频，它都擅长。

有句话我之前在群里看到过：

AI 是遇强则强。

这次算是有了切身体会。

你给它的描述越精准，它给你的结果越好。你脑子里的画面越清晰，它做出来的东西越接近你想要的。

反过来，如果你自己都说不清楚想要什么，它也只能给你一个「差不多」的东西。

AI遇强则强.png

2 个小时，一个 22 秒的短视频。

不算快，但全程没碰过代码，没打开过剪辑软件。

这种「用嘴做视频」的体验，让我对 AI 的能力边界又多了一点认知。

它不是万能的，但它正在变得越来越能听懂人话。

把下面这段话发给 AI 即可。

帮我安装这个 skill npx skills add remotion-dev/skills。安装到全局目录

如果你想安装到某个项目目录，将后面那句“安装到全局目录”更改为“安装到当前项目目录”就行，或者你指定具体的项目路径。