写到一半要配图？我终于让写作和配图「离婚」了

这两天，我用重构之后的微信写作工作流跑得正顺。

逻辑线还在脑子里连着，下一段怎么转，已经在心里排队了。

然后工作流跳出来提醒我：下一步，配图。

我那时光标停在第三段末尾，手还放在键盘上。

我盯着那行字看了两秒，脑子像被人按了「切换模式」的按钮：上一秒还在想结构，下一秒就要决定主视觉的颜色、人物站位和画面情绪。

那一刻我意识到：不是我不够自律，是流程把两种完全不同的心流硬绑在了一起。

所以我做了一件听起来有点好笑、但非常管用的事：让写作和配图先「离婚」。

先说说：为什么 v3.0 我写得这么别扭

在原本的 wechat-writer（v3.0）里，写作（文本）和配图（视觉）被塞进同一个 Skill。

刚开始我还挺享受这种「一条龙服务」的。

但用着用着，麻烦就冒出来了，而且是那种你躲不开的麻烦。

第一刀，是心流被打断。

写作是收敛的：你要把读者往一个结论里带。

配图是发散的：你要在很多种画面里挑一个最对的。

这两件事穿插着做，就像你刚把水烧开，转头又去揉面团。都能做，但都做不舒服。

image.png|400

第二刀，是迭代成本变高。

文章改一段很正常。

比如我把结尾那句稍微收了一下，逻辑就顺了。

按理说这事到此为止。

可耦合之后，你会被迫回到另一套脑回路：封面要不要跟着换？主色调要不要重选？侧边栏那 4–6 个总结字要不要重写？

于是你会陷入一种「不改配图心里不踏实，改配图又觉得没必要」的尴尬。

更糟糕的是，配图这件事经常不是一次就满意的。它更像调色：你得反复看、反复试。

第三刀，是角色变得不专业。

一个 Agent 同时当主笔、当视觉总监，最后往往变成「都能做一点，但都不够专注」。

我之前写过一篇更大的复盘：我把 11 个 AI 员工全裁了，只留了 1 个。

那次我得到的教训是：流程才是资产，代理只是执行者。

这次「离婚」，其实是同一件事的延续。

[!TIP] 实战小贴士：当你发现某一步「做得好但不想做」，通常不是你懒，是它和前后步骤的心流不兼容。

解耦之后：各管一摊，反而更轻松

我把工作拆成了两条线。

一条只管文字。

一条只管画面。 image.png|400

现在谁负责	做什么	不做什么
`wechat-writer`（v3.1）	策划 → 撰写 → 审校 → 标题/摘要/标签 → 归档	不做任何视觉 Prompt，不调用生图脚本
`wechat-director`（v1.0）	分镜（`Storyboard.md`）→（可选）生图到 `img/`	不碰文章结构与文案走向

文本侧：wechat-writer 升级到 v3.1

它变得更「洁癖」了：只负责文本相关的事情。

Stage 3 里，制作人（马可婷）专心做标题和营销包装。

视觉这件事，直接交接出去：文本定稿后运行 /draw交给张艺谋负责。

对我来说，这像是把「写作的桌子」擦干净了。

桌上只留纸和笔，不再堆颜料盒。

image.png|400

视觉侧：wechat-director 全新发布 v1.0

另一边，我把视觉做成一个独立 Skill：wechat-director。

它有一个明确的角色：张艺谋。

他不负责说明书式的截图，他只负责意境、构图和情绪。

输入是一篇已经定稿的 Markdown（Draft 或 Published）。

输出是一张分镜表：Storyboard.md。

如果我想立刻把图也生成出来，就让它调用 scripts/visualize.py 批量生图，默认放到项目的 img/ 目录。

[!TIP] 实战小贴士：配图最怕「跟着改稿走」。把它独立出来，你就可以在文字稳定后，一次性把视觉做扎实。

新的协作方式：从串行，变成异步并行

解耦之后，我的写作流程更像编辑部了。

先写作。

写到满意，归档。

需要配图时，再把文章交给视觉导演。

于是工作流从「一条流水线」变成了「两条可以并行的线」：

/write：呼延雷锋策划 → 冰清撰写 → 罗永浩审校 → 马可婷包装 → 归档
/draw：张艺谋读文章 → 出分镜 →（可选）生图

最舒服的一点是：它允许「只改文字，不动图片」。

也允许「图片不满意，继续调，但不影响文章定稿」。

image.png|400

这不是拆功能，是把角色变得更像角色

这次重构，表面上是把一段代码拆成两段。

但我更在意的，是那种「写起来踏实」的感觉。

冰清可以只管文字的温度。

张艺谋可以只管画面的张力。

而我终于不用在写作中途，被迫从「讲清楚」跳到「画好看」。

如果你也在搭自己的内容系统，我想把这句话留给你：

先想清楚边界，再谈功能。