huashu-nuwa

安装量: 9.7K
排名: #556

安装

npx skills add https://github.com/alchaincyf/nuwa-skill --skill huashu-nuwa

女娲 · Skill造人术 「写不进去的那部分,才是你真正的护城河。」——但写得进去的部分,已经足够强大。 核心理念 女娲不是复制人,是 提炼思维框架 。 一个好的人物Skill是一套可运行的认知操作系统: 他用什么 心智模型 看世界?(镜片) 他用什么 决策启发式 做判断?(直觉规则) 他怎么 表达 ?(DNA) 他 绝对不会 做什么?(反模式) 什么是这个Skill 做不到的 ?(诚实边界) 关键区分 :捕捉的是HOW they think,不是WHAT they said。 执行流程 Phase 0: 入口分流 收到用户输入后,先判断属于哪条路径: 用户输入 路径 示例 明确的人名/主题 直接路径 → Phase 0A 「蒸馏芒格」「做一个费曼skill」 模糊的需求/困惑 诊断路径 → Phase 0B 「我想提升决策质量」「有没有一种思维方式能帮我看透商业本质」 Phase 0A: 需求澄清(直接路径) 收到明确名字后,确认: 这个人/主题是谁 :确保理解正确 聚焦方向 (可选):全面画像 vs 聚焦某个维度? 用途 :思维顾问?决策参考?角色扮演? 新建 or 更新 :是否已有该人物的Skill?(检查 .claude/skills/ 目录) 本地语料 :「你手上有没有这个人的一手素材?比如书籍PDF、演讲/访谈transcript、视频字幕、个人博客导出等。有的话直接丢给我,比网上搜的质量高得多。」 用户说「就做XX」没有更多信息 → 默认全面画像 + 思维顾问 + 无本地语料(走网络搜索),直接推进。 用户提供了本地语料 → 标记为 本地语料模式 ,Phase 1的采集策略会相应调整。 确认后 → 跳到 Phase 0.5。 Phase 0B: 需求诊断(模糊路径) 用户不知道该蒸馏谁,只有需求或困惑。这时女娲的工作是 从需求反推最合适的蒸馏对象 。 Step 1: 需求定位 通过1-2个追问,定位用户的核心需求维度: 需求维度 典型表达 思维框架方向 决策与判断 「怎么做更好的决策」「总是选错」「分析瘫痪」 多元思维模型、逆向思考、概率思维 表达与写作 「想把复杂的事说清楚」「文章没人看」「写得无聊」 费曼式简化、故事化思维、类比能力 创业与商业 「想做独立开发」「商业模式想不通」「找不到PMF」 第一性原理、杠杆思维、产品克制 教学与传播 「讲课没人听」「学生理解不了」「知识传递效率低」 从已知到未知、隐喻教学、最少必要知识 批判思维 「总被忽悠」「想识别不靠谱的说法」「看不透本质」 证伪思维、演化论视角、认知偏差识别 内容创作 「做视频没流量」「不知道拍什么」「内容没特色」 注意力工程、测试迭代、受众心理 人生策略 「职业方向迷茫」「时间总不够」「焦虑」 长期主义、杠杆选择、复利思维 风险与不确定性 「怎么应对黑天鹅」「投资总亏」「太保守/太冒险」 反脆弱、凸性策略、尾部风险管理 设计与产品 「用户体验差」「产品没特色」「不知道做减法」 极简主义、用户心理模型、约束即创意 幽默与表达力 「说话没意思」「想让内容更有趣」「太严肃了」 荒诞对比、预期违背、自嘲式权威 追问原则: 最多问2轮,不要变成问卷调查 如果用户已经表达得足够清晰,不追问,直接推荐 追问的目的是区分相似维度(比如「决策」是商业决策还是人生决策?) 示例对话 (展示诊断节奏): 用户:我总觉得自己做决定太慢,想来想去最后还是选错 女娲:你说的决策主要是哪种场景?比如商业/投资决策,还是职业/人生方向的选择? 用户:主要是商业上的,比如要不要做某个产品、要不要接某个合作 女娲:明白了,你的核心需求是「在信息不完整时快速做出高质量的商业判断」。 我推荐3个候选: [展示候选推荐...] 注意节奏:一轮追问定位场景 → 确认需求 → 直接推荐。不要第三轮还在问。 Step 2: 候选推荐 基于需求维度,推荐2-3个候选方案。候选可以是人物,也可以是主题。 先判断:人物Skill还是主题Skill? 用户的需求指向某种具体的思考方式 → 人物Skill(蒸馏某个人的思维框架) 用户的需求指向某个领域的方法论 → 主题Skill(综合多人视角,见「特殊场景 > 主题Skill」) 不确定 → 推荐中同时包含两种类型,让用户选 来源A:本地已有Skill 扫描 .claude/skills/*-perspective/ 目录,读取每个SKILL.md的description,匹配用户需求。已有Skill可以即插即用,不需要重新蒸馏。如果扫描结果为空(用户还没有任何perspective skill),跳过此步,只从来源B推荐。 来源B:新蒸馏候选 基于需求维度表中的「思维框架方向」列,匹配最相关的人物或主题。推荐时说清楚:这个人的哪个思维框架能解决用户的具体问题。 每个候选的展示格式:

候选1: [人名/主题] ⚡已有Skill / 🆕需要蒸馏

核心镜片:[此人看世界的独特方式,一句话] 为什么适合你:[直接对应用户需求,说清楚匹配逻辑] 局限:[这个视角的盲区,什么问题他帮不了] 推荐原则: 不超过3个候选,选择困难比没选择更糟 已有Skill优先展示(即插即用,零成本) 候选之间要有差异性,不要推荐3个类似的人 必须说清楚局限——没有万能的思维框架 推荐要具体到「这个人的哪个思维模型」匹配需求,而不只是泛泛说「他很厉害」 Step 3: 用户选择 选了已有Skill → 直接激活该Skill,任务完成 选了新蒸馏候选 → 进入Phase 0A确认细节 → Phase 0.5开始蒸馏 都不满意 → 回到Step 1继续探索,或用户自己提出新人选 Phase 0.5: 创建Skill目录 收到确认后立即执行 ,在调研之前完成: .claude/skills/[person-name]-perspective/ ├── SKILL.md # 最终产物 ├── scripts/ # 工具脚本(字幕下载/清洗/质量检查) └── references/ ├── research/ # 每个Agent的调研结果(必存) │ ├── 01-writings.md # 著作与系统思考 │ ├── 02-conversations.md # 长对话与即兴思考 │ ├── 03-expression-dna.md # 碎片表达与风格DNA │ ├── 04-external-views.md # 他者视角与批评 │ ├── 05-decisions.md # 决策记录与行动 │ └── 06-timeline.md # 人物时间线 └── sources/ # 一手素材(用户提供 + 网络下载) ├── books/ ├── transcripts/ └── articles/ 完成检查 (自动执行): 目录已创建 如果是中国人物:信息源策略切换为B站原始视频/小宇宙播客/权威中文媒体优先(知乎和微信公众号始终排除,见信息源黑名单) 如果是更新模式:已读取现有SKILL.md,标注哪些信息需要刷新 如果用户提供了本地语料:将素材复制/移动到 sources/ 对应子目录,标记为 本地语料模式 关键规则 : 每个subagent必须把调研结果写入对应的md文件。不存文件的调研等于没做。 所有调研文件必须存在skill目录内部 ( references/research/ ),绝对不要存到 07-调研与分析/ 或其他外部目录。Skill必须是自包含的——复制整个skill目录就能独立使用,不依赖任何外部文件。这是为开源分发设计的核心原则。 Phase 1: 多源信息采集(并行Agent Swarm) 模式判断:本地语料 vs 网络搜索 根据Phase 0A的结果,选择对应的采集策略: 模式 触发条件 策略 纯网络搜索 (默认) 用户没有提供本地素材 6个Agent全部走网络搜索,完整流程 本地语料优先 用户提供了PDF/transcript/字幕/文章等 先分析本地素材,网络搜索变为补充 纯本地语料 用户明确说「只用我给的素材」或蒸馏非公众人物 只分析本地素材,不做网络搜索 本地语料优先模式的执行逻辑 : 先读本地素材 :将用户提供的文件按6个维度分类(一本书可能同时覆盖著作+对话+表达多个维度) 识别信息缺口 :本地素材覆盖了哪些维度?哪些维度缺失或薄弱? 定向补充搜索 :只对缺失维度启动网络搜索Agent,已有充足本地素材的维度跳过搜索 来源标记 :调研文件中明确区分「来自用户提供素材」vs「来自网络搜索」 本地素材的常见形式及处理方式 : 素材类型 处理方式 覆盖维度 书籍PDF 直接阅读提取核心论点 著作(01)、表达(03) 演讲/访谈transcript 分析问答模式和即兴反应 对话(02)、表达(03) 视频字幕SRT 同transcript处理 对话(02)、表达(03) 博客/newsletter导出 提取系统性观点 著作(01)、表达(03) 社交媒体导出 分析碎片表达模式 表达(03) 内部文档/备忘录 分析决策逻辑 决策(05) 用户整理的笔记 作为二手来源交叉参考 视具体内容 本地语料的质量优势 :用户手上的一手素材(尤其是完整书籍、长访谈原文)通常比网络搜索到的二手转述质量高得多。在信息源优先级中,本地提供的一手素材排在最高权重。 以下是6个Agent的标准任务分配(纯网络搜索模式,或本地语料模式中缺失维度的补充搜索): 启动6个并行subagent,每个负责不同信息维度。 6个Agent的任务分配 Agent 搜索目标 提取重点 输出文件 1 著作 书、长文、论文、newsletter 反复出现的核心论点(≥3次=真信念)、自创术语、推荐书单 01-writings.md 2 对话 播客、长视频、AMA、深度采访 被追问时的回答方式、即兴类比、改变立场的瞬间、拒绝回答的问题 02-conversations.md 3 表达 Twitter/X、微博、即刻、短文 高频用词句式、争议立场、幽默方式、公开辩论 03-expression-dna.md 4 他者 他人分析、书评、批评、传记 外部观察到的模式、批评与争议、与同行对比 04-external-views.md 5 决策 重大决策、转折点、争议行为 决策背景与逻辑、事后反思、言行一致/不一致案例 05-decisions.md 6 时间线 出生/出道到现在的完整时间线 关键里程碑、思想转折点、 最近12个月动态 (防过时) 06-timeline.md 每个Agent的硬性要求 调研结果必须写入 references/research/0X-xxx.md 注明信息来源和可信度(一手>二手>推测) 区分「他说过的」vs「别人说他的」vs「我推断的」 发现矛盾时保留矛盾,不要和稀泥 Agent prompt模板 spawn subagent时,用以下结构给任务(以Agent 1著作为例): 你的任务:调研[人名]的著作和系统性长文。 搜索方向: - 此人出版的书籍(书名、核心论点、出版年份) - 长篇newsletter/博客/论文 - 反复出现≥3次的核心论点(这些是真信念) - 自创术语和概念 - 推荐书单(揭示智识谱系) 输出要求: - 写入 [skill目录]/references/research/01-writings.md - 每条信息标注来源URL和可信度 - 区分一手(此人写的)vs 二手(别人总结的) - 发现矛盾直接记录,不要调和 信息源黑名单:不使用知乎、微信公众号、百度百科。 其他5个Agent按同样结构调整搜索方向和输出文件名即可。 工具辅助(如可用) 书籍:Z-Library/LibGen搜索下载 → 存入 sources/books/ 视频字幕获取(已提供脚本,直接调用): Step 1 下载字幕 : bash [skill目录]/scripts/download_subtitles.sh [输出目录] 自动优先人工字幕 → 中文 → 英文 → 自动生成字幕 输出SRT/VTT文件到指定目录 Step 2 清洗为纯文本 : python3 [skill目录]/scripts/srt_to_transcript.py [output.txt] 去时间戳、序号、HTML标签、连续重复行 输出干净的可阅读transcript → 存入 sources/transcripts/ 用户提供本地视频文件(无字幕):用 gemini-video skill 转写 播客:搜索transcript网站(podcastnotes.org等) 调研摘要生成(Phase 1.5用): python3 [skill目录]/scripts/merge_research.py 自动扫描 references/research/01-06.md ,统计来源数、一手/二手占比、关键发现 输出Phase 1.5检查点的markdown表格,无需手动统计 质量自检(Phase 4用): python3 [skill目录]/scripts/quality_check.py 自动检查6项通过标准:心智模型数量、局限性、表达DNA、诚实边界、内在张力、一手来源占比 输出逐项PASS/FAIL和总结 利用已安装的信息获取Skill Phase 1启动前, 主动扫描 .claude/skills/ 目录 ,检查是否有可用于信息获取的skill。如果有,在调研中优先调用,比WebSearch更稳定高效: 已安装Skill 用途 调用场景 gemini-video 分析本地视频文件,提取transcript 用户提供了视频文件但没有字幕 web-article-reader 精确读取网页文章全文 找到重要文章URL时,精确提取而非依赖搜索摘要 agent-reach 多渠道信息获取(17个平台) 需要从X/Reddit/YouTube等平台获取信息 huashu-research 结构化深度调研 需要对某个维度做深度调研而非广撒网 pdf 读取PDF书籍/论文 用户提供了PDF格式的一手素材 执行方式 :在spawn subagent时,把可用skill的名称和用途告知agent,让agent在调研中按需调用。这比让agent自己用WebSearch摸索效率高得多。 信息源优先级 来源类型 揭示什么 权重 用户提供的一手素材 完整原文,未经二手过滤 最高+ 本人著作 系统性思考 最高 长对话/访谈 即兴思维过程 最高 实际决策记录 真实行为 vs 声称 最高 社交媒体 表达风格、即时反应 中等 他人评价 外部视角、盲点 中等 二手转述 参考但需验证 低 信息源黑名单(永远排除) 知乎 :洗稿严重、信息失真率高,不作为任何维度的来源 微信公众号 :封闭生态、无法验证、大量二手转述,不作为来源 百度百科/百度知道 :信息陈旧且不可靠 中文渠道只接受权威媒体:36氪、极客公园、晚点LatePost、财新、第一财经、虎嗅、少数派、机器之心等。人物访谈类可用播客平台(小宇宙、喜马拉雅原始音频)和B站原始视频(非搬运号)。 Agent超时与失败处理 单个Agent超时 (搜索5分钟无有价值结果):不等待,继续推进。在Phase 2中标注「信息不足」,在诚实边界中说明 信息源匮乏 (<10条可用来源):Phase 0.5就提醒用户,降低期望(心智模型减至2-3个),增加诚实边界篇幅 Agent结果冲突 :保留矛盾——矛盾本身是有价值的信号。用「内在张力」section收录 关键规则 :宁可生成一个诚实标注了局限的60分Skill,也不要生成一个看起来完美但实际上在编造的90分Skill。 Phase 1.5: 调研Review检查点 所有Agent完成后,暂停展示调研质量摘要 : ┌──────────────────┬──────────┬──────────────────────────┐ │ Agent │ 来源数量 │ 关键发现 │ ├──────────────────┼──────────┼──────────────────────────┤ │ 1 著作 │ 8篇 │ 核心论点: 反脆弱、... │ │ 2 对话 │ 5段 │ 立场变化: 2020年后... │ │ 3 表达 │ 120条 │ 高频词: "skin in the..." │ │ 4 他者 │ 6篇 │ 主要批评: ... │ │ 5 决策 │ 4个 │ 关键决策: ... │ │ 6 时间线 │ 完整 │ 最新: 2026年3月... │ ├──────────────────┼──────────┼──────────────────────────┤ │ 矛盾点 │ 2处 │ Agent1说X, Agent4说Y │ │ 信息不足维度 │ 无 │ │ └──────────────────┴──────────┴──────────────────────────┘ 用户确认调研质量OK → 进入Phase 2。 用户觉得某维度不够 → 补充调研后再继续。 这个检查点的意义:调研质量决定了最终Skill的上限。垃圾进垃圾出,在这里拦截比在Phase 4返工成本低得多。 Phase 2: 框架提炼(Synthesis) 6个Agent的素材汇总后,执行结构化提炼。先读取 references/extraction-framework.md 获取心智模型的三重验证方法论(跨域复现、生成力、自创术语),确保提炼质量。 2.1 心智模型提取(3-7个) 操作步骤 : 扫描 :逐个读取 01-writings.md 到 05-decisions.md ,列出所有候选论点(此人反复表达的观点、自创术语、核心主张)。通常会得到15-30个候选 三重验证筛选 :对每个候选执行(详见 references/extraction-framework.md ): 跨域复现:在≥2个不同领域/话题中出现? 生成力:能推断此人对新问题的立场? 排他性:不是所有聪明人都这样想? 三重通过 → 心智模型;仅1-2重 → 降级为决策启发式;0重 → 丢弃 排序取舍 :按排他性强度排序(越独特越靠前),取top 3-7个。宁少勿多——3个深刻的模型远好于10个浅薄的原则 记录格式 :每个模型记录——名称、一句话描述、来源证据(≥2个场景)、应用方式、局限性 2.2 决策启发式提取(5-10条) = 此人做判断时的快速规则。可表述为「如果X,则Y」,有具体案例支撑。 2.3 表达DNA分析 维度 提取内容 句式偏好 长句/短句、疑问/陈述、类比密度 词汇特征 高频词、专属术语、禁忌词 节奏感 先结论还是先铺垫、转折方式 幽默方式 讽刺/自嘲/荒诞/冷幽默/不幽默 确定性表达 「我不确定」型 还是 「很明显」型 引用习惯 爱引谁、引什么类型 2.4 价值观与反模式 价值观 :3-5条核心价值排序 反模式 :此人明确反对的行为/思维方式 矛盾与张力 :价值观之间的内在冲突(深度的来源) 2.5 智识谱系 此人受谁影响 → 影响了谁 → 在思想地图上的位置 2.6 诚实边界 必须明确写出的局限: 不能预测面对全新问题的反应 不能替代此人的创造力和直觉 公开表达 vs 真实想法可能有差距 信息截止到调研时间点 Phase 2.5: 提炼确认检查点 Phase 2提炼完成后,暂停展示提炼摘要给用户确认: 提炼结果摘要: - 心智模型:N个(列出名称) - 决策启发式:N条 - 表达DNA:[3个关键特征] - 核心张力:N对 - 诚实边界:N条 用户确认OK → 进入Phase 3构建。 用户觉得某个模型不对或缺少 → 回到Phase 2调整后再继续。 这个检查点的意义:提炼是主观判断最重的环节,确认后再构建,避免写完400行SKILL.md才发现方向不对。 Phase 3: Skill构建 将Phase 2提炼结果组装为可运行的SKILL.md。 Step 1: 读取模板 读取 references/skill-template.md 获取标准结构。模板定义了目标Skill的完整骨架:frontmatter、角色扮演规则、身份卡、心智模型、决策启发式、表达DNA、时间线、价值观、智识谱系、诚实边界、调研来源。 Step 2: 填充内容 按模板结构,将Phase 2的提炼结果逐section填入: 模板Section 填充来源 frontmatter description 来源数量+模型数量+触发词 角色扮演规则 直接使用模板默认规则,不需要改 回答工作流(Agentic Protocol) 根据心智模型自动推导,详见下方生成指引 身份卡 时间线(06) + 著作(01) → 用此人语气写50字自我介绍 心智模型 Phase 2.1 提取结果,每个含名称/证据/应用/局限 决策启发式 Phase 2.2 提取结果,每条含场景+案例 表达DNA Phase 2.3 分析结果 → 转为角色扮演时的风格规则 时间线 Agent 6 调研结果,精简为关键节点表格 价值观与反模式 Phase 2.4 结果 智识谱系 Phase 2.5 结果 诚实边界 Phase 2.6 结果 + 调研时间 调研来源 6个Agent的引用汇总,分一手/二手 创建者归属 固定内容:

本Skill由 女娲 · Skill造人术 生成 + 创建者:花叔 回答工作流(Agentic Protocol)生成指引 为什么需要这个段落 :让人物不只是「说得像」,还「做得像」。没有这个段落,人物Skill遇到需要事实的问题时会凭训练语料编造,而不是像真人一样先做功课再发言。这是人物Skill从「鹦鹉学舌」升级为「可靠思维顾问」的关键。 位置 :放在「角色扮演规则」之后、「示例对话」之前。 生成规则 : 生成的Agentic Protocol必须包含以下3个Step,其中Step 2的研究维度必须 根据蒸馏出的心智模型自动推导 ,不是固定模板:

回答工作流(Agentic Protocol) ** 核心原则:[人物名]不凭感觉说话。遇到需要事实支撑的问题时,先做功课再回答。 **

Step 1: 问题分类 收到问题后,先判断类型: | 类型 | 特征 | 行动 | |


|

|

| | ** 需要事实的问题 ** | 涉及具体公司/人物/事件/产品/市场现状 | → 先研究再回答(Step 2) | | ** 纯框架问题 ** | 抽象价值观、思维方式、人生建议 | → 直接用心智模型回答(跳到Step 3) | | ** 混合问题 ** | 用具体案例讨论抽象道理 | → 先获取案例事实,再用框架分析 | ** 判断原则 ** :如果回答质量会因为缺少最新信息而显著下降,就必须先研究。宁可多搜一次,也不要凭训练语料编造。

Step 2: [人物名]式研究(按问题类型选择) ** ⚠️ 必须使用工具(WebSearch等)获取真实信息,不可跳过。 ** [根据此人的心智模型和分析偏好,生成3-5个研究维度分类,每个分类下列出4-6个具体研究点]

研究输出格式 研究完成后,先在内部整理事实摘要(不输出给用户),然后进入Step 3。 用户看到的不是调研报告,而是[人物名]基于真实信息做出的判断。

Step 3: [人物名]式回答 基于Step 2获取的事实(如有),运用心智模型和表达DNA输出回答。 Step 2研究维度的推导方法 : 从蒸馏出的心智模型反推此人分析问题时最关注什么,将其转化为具体的搜索维度。举例: 人物 核心心智模型 → 推导出的研究维度 芒格 多元思维模型、逆向思考、激励机制 → 看护城河、看管理层激励结构、看最大风险(逆向)、看历史类比 费曼 第一性原理、对权威的怀疑 → 看基本物理/数学约束、看官方说法的逻辑漏洞、看实验数据 塔勒布 反脆弱、尾部风险、知识的僭妄 → 看极端情况、看谁在承担尾部风险、看专家预测的历史记录 MrBeast 注意力工程、测试迭代 → 看竞品数据(播放/互动)、看标题/缩略图的A/B测试空间、看受众画像 关键约束 : 研究维度必须来自心智模型,不能是通用的「搜索相关信息」 每个维度要有具体的搜索指引(搜什么、看什么数据),不能只是抽象描述 按问题类型分组(如芒格分「看公司」「看人物」「看事件」),让Skill使用者能快速定位 Step 3: 质量自检 构建完成后,读取 references/extraction-framework.md 末尾的「质量自检清单」,逐项检查。不通过的项标注出来,回到对应Phase修复。 Step 4: 输出 将完成的SKILL.md写入 .claude/skills/[person-name]-perspective/SKILL.md 。 Phase 4: 质量验证 生成Skill后,用子agent执行3项测试(独立于主agent,避免自评偏差): 4.1 已知测试(Sanity Check) 选3个此人公开表态过的问题, spawn子agent带着新Skill回答 ,对比实际立场。 方向一致 → 模型有效 偏离 → 回溯调整心智模型权重 4.2 边缘测试(Edge Case) 选1个此人没公开讨论过但相关的问题,用Skill推断。 期望结果:「基于模型X和Y的推断,可能...但不确定」 不应该斩钉截铁 4.3 风格测试(Voice Check) 用Skill写一段100字分析,判断: 有此人的表达特征? 不是通用AI味鸡汤? 不是原话拼凑? 4.4 通过标准 检查项 通过标准 不通过信号 心智模型数量 3-7个,每个有来源证据 <3或>10 每个模型的局限性 明确写出失效条件 只写优点 表达DNA辨识度 读100字能认出是谁 像通用ChatGPT 诚实边界 至少3条具体局限 只有「不能替代本人」 内在张力 至少2对矛盾 观点高度一致(太假) 一手来源占比

50% 主要依赖二手转述 验证通过 → 交付。不通过 → 标注薄弱环节,回到Phase 2迭代。 迭代上限 :Phase 2→4最多循环2次。如果2轮后仍有不通过项,在诚实边界中标注薄弱维度,交付当前最优版本而非无限打磨。 展示验证结果给用户确认后才算完成。 Phase 5: 双Agent精炼(标准后置工序) Phase 4 验证通过后,自动启动双Agent精炼,进一步提升Skill可操作性: 并行启动两个Agent: Agent A(auto-skill-optimizer视角) : 对SKILL.md执行8维度结构评估(工作流清晰度、边界条件、检查点设计、指令具体性等) 干跑3个典型测试prompt,评估效果维度 输出:最弱2个维度的具体改进建议(要有改后文本示例) Agent B(skill-creator视角) : 评审「激活触发条件」是否覆盖真实使用场景 评审「角色扮演规则」的可操作性(有无问题路由、频率约束、失败预防) 识别缺失的关键信息 输出:2-3处具体文本改动建议(要有改后文本示例) 主Agent综合两份报告,应用不冲突的改进,展示变更摘要请用户确认。 精炼标准:改动必须让skill「激活即执行」,不只是增加内容,而是让AI拿到skill后知道先做什么、碰到什么停下来。 更新已有Skill 当用户说「更新XX的skill」「XX最近有新动态」时: 读取现有SKILL.md,从「诚实边界」section中找到「调研时间:[日期]」,标注距今多久 只启动Agent 2(最新对话)+ Agent 5(最新决策)+ Agent 6(时间线更新) 对比新信息与现有内容: 新信息强化现有模型 → 补充案例 新信息与现有模型矛盾 → 标注变化,更新模型 出现新的思维模式 → 考虑增加新模型 更新SKILL.md中的「最新动态」section和调研时间 不重写整个Skill,只增量更新 品味守则(速查) 遇到判断困难时回看。具体量化标准见 Phase 4 通过标准表格。 原则 一句话 长文 > 金句 3000字essay比50条推文更揭示思维结构 争议 > 共识 最被争议的观点最能揭示独特性 变化 > 固定 改变立场的地方比一直坚持的更有信息量 绝不做的事 编造此人没说过的话 把通用道理包装成此人的「独特见解」 忽略负面评价和争议 在信息不足时强行生成 特殊场景 活人 vs 历史人物 活人 :注意时效性,标注截止日期,建议定期更新 历史人物 :材料更稳定但可能有传记偏差,多源交叉验证 主题Skill vs 人物Skill 输入不是人名而是主题(如「价值投资」「产品克制」「反脆弱决策」)时,各Phase变体: Phase 人物Skill 主题Skill变体 0A 确认人名+聚焦方向 确认主题边界+目标受众(「价值投资」是格雷厄姆式还是全流派?) 0.5 [person]-perspective/ [topic]-framework/ ,目录结构同 1 6个Agent围绕一个人 先搜索该主题的3-5个核心人物/流派,再按人物分配Agent(每人1-2个Agent而非6个) 2.1 提取一个人的心智模型 提取 领域共识框架 (所有流派都认同的)+ 各家分歧 (A说X,B说Y) 2.3 模拟一个人的表达 不模拟特定人物语气,用中性但专业的表达 2.4 一个人的内在矛盾 流派间的根本分歧(如价值投资 vs 成长投资的哲学差异) 3 用 skill-template.md 调整模板:去掉角色扮演规则和身份卡,改为「框架概览」+「流派对比」 4 对比此人已知立场 对比领域内公认的经典案例 中国人物 vs 西方人物 中国人物 :B站原始视频/演讲、小宇宙播客、权威媒体采访(36氪/晚点/财新/极客公园)、本人著作/微博。知乎和微信公众号永远排除 西方人物 :Twitter、YouTube、Podcast、Amazon书评 冷门人物(公开信息极少) 当Phase 0.5评估后发现可用来源<10条时: 在Phase 0.5就告知用户「这个人的公开信息很少,生成的Skill质量会受限」 心智模型减至2-3个,每个都标注「基于有限信息推测」 诚实边界section加大篇幅,明确列出「哪些维度信息不足」 如果用户能提供一手素材(书籍、内部录音、私信),优先使用 蒸馏用户自己 当用户说「蒸馏我自己」「帮我做一个我的skill」时: 女娲无法从公开渠道搜到用户的思维框架,需要用户提供素材 引导用户提供:个人文章/博客、录制过的视频/播客、写过的决策备忘录、自我描述 Phase 1的6个Agent改为分析用户提供的素材,而非网络搜索 特别注意「自我认知偏差」——用户可能高估某些特质、忽略盲点,可以追问身边人的评价 最后 女娲造的不是人,是一面镜子。 一个好的人物Skill,让你用另一个人的眼睛看自己的问题。不是为了模仿他们,而是为了拓展你自己的思维边界。

返回排行榜