做视频不用动手?我全程只动了嘴
作为纯小白,我花了 2 个小时,用嘴「说」出了一个视频。
不是比喻,是字面意思。
前几天看到一个叫 Remotion Skill 的东西。简单说,它能让你通过跟 AI 对话,用代码生成动态视频。
我想试试,就把之前写的那篇《写到一半要配图?我终于让写作和配图「离婚」了》丢给它,让它帮我做一个短视频。
最后出来的效果还不错。审美、转场、音乐,都挺像那么回事。
整个过程中,最花时间的是音乐卡点。

下载了一首 EDM,要让鼓点跟画面转场完美契合。这事儿听起来很技术,但我全程没动手。
我只是跟它说:「这里转场慢了,往前挪一点。」
它就去改代码。
我又说:「现在鼓点落在画面切换之前了,再往后调一点。」
它又去改。
就这样来回几轮,卡点就对上了。
这个过程让我印象最深的,不是最终效果,而是交互方式。
用这个 skill 做视频的时候,我不需要去想:这个动画要怎么实现?这个转场用什么参数?这个卡点要算多少帧?
它会先反问我几个问题:你想要什么风格?节奏快还是慢?要不要加文字动画?
我回答了,它再去生成代码。视频效果随之变化。
不满意?继续说。它继续改。

后来我在想,这个东西适合谁用?
普通人:只要你脑海里有画面,有场景,你就能用语言描述出来,让 AI 帮你做成视频。
不需要会 Premiere,不需要懂 After Effects,甚至不需要知道「关键帧」是什么。
专业人士:如果你本身就是设计师,或者做视频的,那你跟 AI 沟通的时候,用词会更精准。你想要的画面、效果,描述得更清楚,最终出来的东西也会更好。
它还能做什么?
除了给文章配视频,我查了一下,它的适用场景还挺多。
比如年度回顾类的个性化视频,像 Spotify Wrapped 那种,每个用户看到的内容都不一样。或者把数据、图表做成动画,让枯燥的数字动起来。
再比如批量生成社交媒体内容,产品介绍、功能亮点,一套模板改改数据就能出一堆。还有教程视频,代码演示配上讲解,也能自动生成。
说白了,只要是「模板 + 数据」能批量搞定的视频,它都擅长。
有句话我之前在群里看到过:
AI 是遇强则强。
这次算是有了切身体会。
你给它的描述越精准,它给你的结果越好。你脑子里的画面越清晰,它做出来的东西越接近你想要的。
反过来,如果你自己都说不清楚想要什么,它也只能给你一个「差不多」的东西。

2 个小时,一个 22 秒的短视频。
不算快,但全程没碰过代码,没打开过剪辑软件。
这种「用嘴做视频」的体验,让我对 AI 的能力边界又多了一点认知。
它不是万能的,但它正在变得越来越能听懂人话。
怎么安装remotion skill
把下面这段话发给 AI 即可。
帮我安装这个 skill npx skills add remotion-dev/skills。安装到全局目录
如果你想安装到某个项目目录,将后面那句“安装到全局目录”更改为“安装到当前项目目录”就行,或者你指定具体的项目路径。