Best Minds Board
收藏夹变产出:小红书素材流水线的最小实现
2026-01-16 · Zon(个人创作者 / 工程师) · MVP:手动收集 → 素材卡 → 草稿 → 待发布队列(复用 shareAuto 已验证链路)
从“看到就收藏”到“每天可发布 1 条”——先跑通结构化生产线,再谈自动化
要点速览
- 把“收藏”当作一种 data source:先用最小字段(URL + 3 句话 + 1 个角度)入库,不等自动抽取。
- 复用你仓库里已验证的 Article → Draft → PublishJob(pending) 流程:收藏只需要补齐“入库”这一步。
- 自动化的正确顺序:先手动跑通 30 条 → 再加抽取/聚类/标签 → 最后才考虑抓取/同步各平台。
关键洞见
- 产出靠“可复用结构”,不是靠“灵感”:每条收藏都要被压成可复写的 1 张素材卡。
- 最小素材卡 = “一句话结论 + 证据/例子 + 你的角度/行动”,这三段就足以生成小红书正文。
- 决定成败的 crux:你是否把“收藏”当作 Inbox,并给它 SLA(例如 48 小时内必须处理)。
步骤指南(新手友好)
新手模式
- Capture(捕获)
把收藏入口统一:浏览器分享/复制链接后,立刻写 1 句“为什么收藏”(否则就是噪音)。 - Distill(蒸馏成素材卡)
用 3 句模板:①结论(我学到什么)②证据(原文/例子)③角度(我怎么用/我反对什么)。 - Store(入库到系统)
在 shareAuto 里存为 Article(source=bookmark),字段先够用:url/title/notes/tags/capturedAt。 - Draft(生成草稿)
调用现有 POST /api/generate:输入素材卡 → 输出小红书标题/正文/标签 + 配图建议。 - Queue(排队发布)
创建 PublishJob(status=pending),先手动发布;发布后回填链接与数据用于复盘。
检查清单
-
每条收藏都有 why(不然删掉)
-
素材卡写完 ≤ 5 分钟(否则模板太重)
-
草稿可在 1 次修改内发布(否则输入不够好)
-
发布后记录:标题、钩子、赞藏评(否则无法迭代)
-
每周复盘:把高表现结构固化为 prompt + UI 按钮
奥卡姆优先(只保留必要的)
- 不要做“自动抓取小红书收藏”作为第一步(成本高、合规/稳定性差)。
- 不要做“向量知识库/检索”作为第一步(你缺的是输入结构,不是检索)。
- 先把“每天 1 条发布”跑通,再决定要不要重做架构。
SVG 图解
专家视角
Tiago Forte — Building a Second Brain / PARA 方法提出者(paraphrase)
- 立场: 捕获只是开始,价值来自“蒸馏 + 再表达”;系统应围绕“下一步行动”设计。
- 论据: 1) 原文很少能直接发布,必须先被压缩成可复用的“内容原子”;2) 让系统替你记忆,写作才会稳定发生;3) 输出(表达)反过来会提升你对输入的筛选质量。
- 边界: 如果没有固定节奏与约束(例如每天处理 5 条收藏),任何系统都会退化为“更豪华的收藏夹”。
“paraphrase(非原话):Capture → Distill → Express;为未来的你而写。” — fortelabs.com
方案对比
| 方案 | 适用场景 | 收益 | 代价 | 关键风险 | 第一步 |
|---|---|---|---|---|---|
| A | 你现在:内容还没跑起来;希望 7 天内看到真实发布 | 立刻可执行;合规;不依赖抓取;几乎零开发 | 需要手动输入;一致性靠习惯 | Inbox 堆积,导致“永远在收藏、从不产出” | 今晚从收藏夹挑 10 条,按 3 句模板写成 10 张素材卡 |
| B | 你已连续产出 30 条;想把处理时间从 5 分钟降到 2 分钟 | 统一入口 + 标签;可做导出/同步;部分自动摘要 | 部署维护成本;正文抽取对动态页不稳定 | 过早工程化拖慢产出节奏 | 先上 linkding/wallabag,只做“导出 + 每晚处理 5 条” |
证据与置信度
| 主张 | 证据 | 置信度 | 来源 |
|---|---|---|---|
| 你现有仓库已跑通“素材→草稿→待发布作业”的链路 | xhs_material_verification.md:arXiv 搜索→入库→生成小红书内容→创建 PublishJob(pending) | High | 仓库内验证记录(见 Details) |
下一步
- 建一个“收藏 Inbox”入口:哪怕是表单/CSV,只要能落到 Article(source=bookmark)
- 连续 7 天:每天处理 5 条收藏 → 生成 1 条草稿 → 发布并记录数据
- 第 8 天复盘:找出高表现结构,把它固化成 prompt + 一键生成
细节(可选)
二级页面
保持主报告简洁。复杂推导、长表格、深度材料放到二级 HTML 页面,再在这里以链接方式引用。
MVP 数据结构(建议)
FavoriteItem { url, title, why, excerpt?, tags[], capturedAt }
MaterialCard { claim, evidence, angle, hook, draftHint }
Draft { channel, title, body, tags[] }
PublishJob { channel, status=pending, scheduledAt?, postUrl?, metrics? }
在 shareAuto 里怎么落地(最小改动)
- 新增一种 source:
bookmark/xhs_favorite,把收藏先“当作素材源”。 - 提供一个最简入口(表单/CLI/手填 JSON):写入
Article的url/title/notes/tags。 - 复用已验证链路:
POST /api/generate→POST /api/publish-jobs(先手动发布)。
开源组件(可选)
- 收藏/阅读稍后:
linkding(自托管书签 + API + 标签)。 - 长文稍后读:
wallabag(read-it-later,自托管)。 - 网页正文抽取:
Mozilla Readability(JS)、trafilatura/readability-lxml(Python)。 - 保存网页:
MarkDownload(网页转 Markdown)、SingleFile(保存为单文件 HTML)。 - 截图→文字(动态页/登录页兜底):
tesseractOCR。
合规与现实约束
- 小红书页面高度动态 + 登录强:不要把“自动抓取收藏”作为 MVP;优先手动摘录/截图/OCR。
- 你的目标不是“全量同步收藏”,而是“每天可发布 1 条”:先跑通 30 条,再做自动化。
你仓库里可复用的证据点
xhs_material_verification.md:已跑通Article → Draft → PublishJob(pending)(来源为 arXiv)。xhs_publish_example.md:发布素材结构示例,可作为输出格式基准。
备注:本文外部链接未在线核验(当前环境无网络)。
来源
收尾总结
你要的不是更聪明的收藏夹,而是一个“每天产出”的可信系统。
- 用 3 句模板把收藏蒸馏成素材卡,先保证可复用。
- 用队列管理发布,不让灵感决定你什么时候写。
- 当你已经稳定产出,再把自动化当作杠杆,而不是拐杖。
一个下一步动作
今晚 30 分钟:从收藏夹挑 10 条,按“结论/证据/我的角度”写成素材卡,并生成 1 条小红书草稿。
“用一句收束全篇的核心引言。
可换行以形成节奏。”
— Name