Back to Blog

写到一半要配图?我终于让写作和配图「离婚」了

林小卫很行

这两天,我用重构之后的微信写作工作流跑得正顺。

逻辑线还在脑子里连着,下一段怎么转,已经在心里排队了。

然后工作流跳出来提醒我:下一步,配图。

我那时光标停在第三段末尾,手还放在键盘上。

我盯着那行字看了两秒,脑子像被人按了「切换模式」的按钮:上一秒还在想结构,下一秒就要决定主视觉的颜色、人物站位和画面情绪。

那一刻我意识到:不是我不够自律,是流程把两种完全不同的心流硬绑在了一起。

所以我做了一件听起来有点好笑、但非常管用的事:让写作和配图先「离婚」。

先说说:为什么 v3.0 我写得这么别扭

在原本的 wechat-writer(v3.0)里,写作(文本)和配图(视觉)被塞进同一个 Skill。

刚开始我还挺享受这种「一条龙服务」的。

但用着用着,麻烦就冒出来了,而且是那种你躲不开的麻烦。

第一刀,是心流被打断。

写作是收敛的:你要把读者往一个结论里带。

配图是发散的:你要在很多种画面里挑一个最对的。

这两件事穿插着做,就像你刚把水烧开,转头又去揉面团。都能做,但都做不舒服。

image.png|400

第二刀,是迭代成本变高。

文章改一段很正常。

比如我把结尾那句稍微收了一下,逻辑就顺了。

按理说这事到此为止。

可耦合之后,你会被迫回到另一套脑回路:封面要不要跟着换?主色调要不要重选?侧边栏那 4–6 个总结字要不要重写?

于是你会陷入一种「不改配图心里不踏实,改配图又觉得没必要」的尴尬。

更糟糕的是,配图这件事经常不是一次就满意的。它更像调色:你得反复看、反复试。

第三刀,是角色变得不专业。

一个 Agent 同时当主笔、当视觉总监,最后往往变成「都能做一点,但都不够专注」。

我之前写过一篇更大的复盘:我把 11 个 AI 员工全裁了,只留了 1 个

那次我得到的教训是:流程才是资产,代理只是执行者。

这次「离婚」,其实是同一件事的延续。

[!TIP] 实战小贴士:当你发现某一步「做得好但不想做」,通常不是你懒,是它和前后步骤的心流不兼容。

解耦之后:各管一摊,反而更轻松

我把工作拆成了两条线。

一条只管文字。

一条只管画面。 image.png|400

现在谁负责 做什么 不做什么
wechat-writer(v3.1) 策划 → 撰写 → 审校 → 标题/摘要/标签 → 归档 不做任何视觉 Prompt,不调用生图脚本
wechat-director(v1.0) 分镜(Storyboard.md)→(可选)生图到 img/ 不碰文章结构与文案走向

文本侧:wechat-writer 升级到 v3.1

它变得更「洁癖」了:只负责文本相关的事情。

Stage 3 里,制作人(马可婷)专心做标题和营销包装。

视觉这件事,直接交接出去:文本定稿后运行 /draw交给张艺谋负责。

对我来说,这像是把「写作的桌子」擦干净了。

桌上只留纸和笔,不再堆颜料盒。

image.png|400

视觉侧:wechat-director 全新发布 v1.0

另一边,我把视觉做成一个独立 Skill:wechat-director

它有一个明确的角色:张艺谋。

他不负责说明书式的截图,他只负责意境、构图和情绪。

输入是一篇已经定稿的 Markdown(Draft 或 Published)。

输出是一张分镜表:Storyboard.md

如果我想立刻把图也生成出来,就让它调用 scripts/visualize.py 批量生图,默认放到项目的 img/ 目录。

[!TIP] 实战小贴士:配图最怕「跟着改稿走」。把它独立出来,你就可以在文字稳定后,一次性把视觉做扎实。

新的协作方式:从串行,变成异步并行

解耦之后,我的写作流程更像编辑部了。

先写作。

写到满意,归档。

需要配图时,再把文章交给视觉导演。

于是工作流从「一条流水线」变成了「两条可以并行的线」:

  1. /write:呼延雷锋策划 → 冰清撰写 → 罗永浩审校 → 马可婷包装 → 归档
  2. /draw:张艺谋读文章 → 出分镜 →(可选)生图

最舒服的一点是:它允许「只改文字,不动图片」。

也允许「图片不满意,继续调,但不影响文章定稿」。

image.png|400

这不是拆功能,是把角色变得更像角色

这次重构,表面上是把一段代码拆成两段。

但我更在意的,是那种「写起来踏实」的感觉。

冰清可以只管文字的温度。

张艺谋可以只管画面的张力。

而我终于不用在写作中途,被迫从「讲清楚」跳到「画好看」。

如果你也在搭自己的内容系统,我想把这句话留给你:

先想清楚边界,再谈功能。