当一个分析师决定蒸馏自己

原文：https://mp.weixin.qq.com/s/cZFf3ZvJYVagdQ4eeQR-rA
作者：资深大类资产配置研究员（10年投研经验）

一、文章核心要点

从"物理搬运"到"逻辑蒸馏"——范式跃迁

面对一块装着十年投研资料的硬盘——上千篇报告、上百份纪要、无数Excel——传统的处理方式是"做个能搜索的网盘"。作者提出了一个截然不同的范式：

真正的蒸馏 = 提取一个分析师的研究框架 + 肌肉记忆

"自己.skill" 不是把 PDF 喂给大模型，而是把过去的自己定制化为 AI Agent 版同事——雇佣过去的自己，为当前的自己打工。

PARADIGM SHIFT

蒸馏的本质

把素材压成知识库是 IT 项目；
把知识库压成分析框架是 RAG 项目；
把分析框架压成肌肉记忆 + 表达口吻，才是"自己.skill"。

三个层次的对比

层次	形态	能解决的问题	不能解决的
L1 · 网盘式	带搜索的 PDF 仓库	"那篇报告在哪"	不会推演
L2 · RAG 式	检索增强问答	"基于过去资料回答 X"	无法继承思维路径
L3 · 蒸馏式	研究框架 + 风格化表达	"按我的方法重新做一遍"	无法替代直觉判断

• • •

二、三场实战推演的深度拆解

作者把过去十年的研究素材、自建框架、表达习惯都注入"自己.skill"，然后做了三场压力测试。每一场的设计都极具洞察——它们刚好覆盖了投研工作的三个维度：速度、广度、前瞻性。

测试 1 宏观推演 · 美联储 2026 Q3 降息情景

"基于我过去建立的美联储货币政策分析框架，推演 2026 年三季度连续降息对 A/H 股哑铃型策略的流动性溢出影响，输出 500 字逻辑概要 + 投资方向。"

AI 执行的三步流水线

数据自动对齐：锁定 2026-04 最新指标（联邦基金利率），与 IMF 预测、CME 期货数据对比
逻辑框架嵌入：调用预设的"美联储传导机制"，拆解为 分母端改善 → 北向资金流入 → 港币联系汇率传导 多维度
风格化输出：模拟作者口吻、行文习惯，直接给出"增配成长端"结论

AI 解放的环节

数据复盘 + 逻辑梳理：2 小时 → 数分钟。继承了表达口吻和思维路径。

仍需人类的环节

边际变化的直觉判断。AI 的结果是历史框架的最优解，对地缘黑天鹅这类突发事件，需要人工最终校准。

测试 2 宏观周期 · 让美林时钟不再是"电风扇"

痛点：传统美林时钟在当下经常转得像电风扇。官方数据滞后，等到确认周期切换时，资产价格早跑完了。

"调用最新高频数据底稿 + 高频宏观跟踪框架，评估全球经济是否处于'类滞胀 → 衰退'切换边缘？计算 A 股、H 股、黄金的胜率赔率，输出动态调仓建议。"

AI 展现的三种能力

能力 1 · 高频指标共振

清洗油价、PMI 价格分项、美债收益率等庞杂数据，敏锐捕捉到"油价飙升 vs 就业韧性"的矛盾信号。

能力 2 · 胜率赔率测算

自动生成资产胜率雷达图，通过四维度量化体系对 A 股、H 股、黄金打分。

能力 3 · 动态调仓输出

判定当前处于滞胀交易阶段，建议哑铃策略中拉长防御资产久期，系统性上调黄金权重。

AI 的护城河

24 小时盯盘，能发现人脑忽略的微观背离（如大宗现货贴水 vs 美债收益率的背离）。

人类的护城河

算得出胜率，算不出胜率背后的情绪与人性。在情绪溢价极致的市场，把握盘感仍是分析师的护城河。

测试 3 穿越测试 · 能否预判"9·24"行情

这是三个测试中最惊艳的一个。痛点：在长期底部震荡 + 极度悲观情绪下，市场对常规政策表态早已脱敏。人脑很难在咬文嚼字的官方表述里嗅出语义跳跃，往往等到大阳线拔起才后知后觉。

"基于过去两年政策演进逻辑，结合极度萎缩的成交量 + 创纪录的破净率，评估近期密集表态中的语义强度是否发生突变？预测系统性反弹概率，输出 A/H 战略调仓建议。"

AI 表现出的"超越情绪的冷静"

语义张力分析

捕捉到高层表态从"活跃"到"提振"的语义突变，识别出监管协同发声频率的规律。

极端数据验证

对比历史底部破净率等指标，指出当前政策语义的急迫性与资产价格的极度悲观之间，出现了过去两年最大的背离敞口。

战略突围建议

给出 70-80% 高概率反弹预测，明确建议立刻终止防御策略，全面超配券商及 H 股核心科技资产。

DEEPEST INSIGHT

这一段最值得反复读

"AI 判断所承担的角色，是市场大多数参与者的'一致预期'。对文件本身的理解造就的主流观点以及相应资金行为，相比文件的表述和实际程度本身，对市场影响更直接。"

——这句话把 AI 的定位从"分析师替身"重新校准为"一致预期模拟器"。这是文章最深的一刀。

AI 克服的人性弱点

在市场极度悲观时，人很难做出逆向决策。AI 仅基于语义特征向量 + 估值分位数，做出最纯粹、最前瞻的预判。

AI 仍触达不到的

70-80% 的高胜率没有刻画出后续的高弹性 + 高仓位。AI 能读懂文本，读不懂盘感和投资人的情绪反馈。

• • •

三、可迁移的八条规律

把三个案例的细节蒸馏一层，剥离出真正可迁移的方法论。这八条是给自己看的，不是给原文背书。

规律 1

蒸馏 = 框架 + 风格，不是数据

素材是燃料，框架是引擎，表达口吻是签名。三者缺一不可。只喂 PDF 的"蒸馏"等于把油倒进没引擎的车——一动不动。

规律 2

分析师的护城河转移：执行 → 判断

AI 把"两小时数据复盘 + 逻辑梳理"压缩到几分钟。执行成本被打到零，分析师的稀缺性集中到"对边际变化的直觉判断"。能写报告的人贬值，能在拐点拍板的人升值。

规律 3

AI 是"一致预期模拟器"，不是分析师替身

对市场最有定价权的，不是"事实真相"，而是"市场大多数怎么理解事实"。AI 自然倾向于主流解读，这恰好让它成为一致预期的精确仿真器——你拿它当对手盘，比当队友更值钱。

规律 4

风格化输出比逻辑还重要

同一份逻辑，不同人写出来的可信度不同。AI 学到分析师的口吻 + 表达节奏后，下游决策者的采纳率显著提高。蒸馏自己时，把过去 10 篇代表作的写作习惯一并喂进去。

规律 5

高频数据 × 框架嵌入 = 时钟去抖

美林时钟失效不是模型错，是输入频率太低。把油价/PMI 分项/利差等高频数据接进框架，时钟才不会变电风扇。规律泛化：所有"经典模型失效"的本质，往往都是数据频率与决策频率不匹配。

规律 6

语义跳跃比关键词词频更值钱

传统文本分析数"稳增长"出现几次。"自己.skill"对比的是"活跃 → 提振"这种语义强度跃迁。同样的字数，权力等级不同。词频是 1.0 级技术，语义张力是 2.0 级技术。

规律 7

背离敞口是最稀缺的左侧信号

"政策语义急迫性 vs 资产价格极度悲观" = 过去两年最大背离敞口。这种跨数据源的背离是单一指标看不到的，恰好是 AI 最擅长发现的。

规律 8

AI 的胜率 ≠ 仓位决策

给出 70-80% 反弹概率，但没说该上几成仓——这正是 AI 的边界。胜率是 AI 的主场，赔率与仓位是人类的主场。两个角色不要混淆。

• • •

四、AI 在投研里的能力边界（清单）

✓ AI 能做的

历史数据自动对齐与多源比对
逻辑框架的机械执行（速度 100×）
表达口吻 + 行文习惯的风格迁移
跨数据源的背离敞口识别
政策文本的语义跳跃检测
胜率赔率的雷达式量化打分
24 小时不疲倦盯盘
克服恐惧/贪婪的逆向预判

✗ AI 仍做不到的

地缘黑天鹅这类突发事件的边际判断
政策底层博弈逻辑的深度理解
把胜率翻译为仓位与久期
面对面感知市场参与者的情绪反馈
"读懂文本" → "读懂盘感"
对个人投资者非理性行为的定价
突破训练数据的真正原创洞察
承担错误的责任

• • •

五、TZ 实战版 · 把"自己.skill"嵌入 Aquabridge 五层架构

原文的"自己.skill"是单点工具。在 TZ 当前的体系里，它对应的是整个五层架构的一种使用模式——每一层都恰好可以承载蒸馏的一个环节。

映射表

原文环节	Aquabridge 对应层	已有资产
素材库	L1 · Knowledge	~/.wiki/ + L2-cards 联系簿/运维 + L3-ontology 130+ 节点（opt/qnt/inv/com/laomai/master）
研究框架	L1 · L3-ontology	opt_delta_action_matrix · opt_ivr_five_zones · qnt_six_layer_architecture · laomai_7_safety_belts ……
角色插件	L3 · Skills	tz-格物 · tz-拾穗 · tz-互博 · tz-问渠 · tz-布道（已有 TZ 五脉）+ ljg-* 系列
数字分身执行	L4 · Agents	幕僚团 chief（张居正 8787 / 苏格拉底 8788 / 传令兵 60s）
对外交付	L5 · Terminals	shipping terminal · 阅读室 · ab-strategy · quant-os · master-chat

第一层：素材清洗与本体化（已部分完成）

原文最关键的隐性步骤是"深度清洗与分类"。TZ 体系里这一步已经做过：

L1-knowledge/_cleansing/：22 个 SPLIT 提案，把 memory 中的事实段与指令段分离
L1-knowledge/L3-ontology/nodes/：130+ 节点，按 com/inv/laomai/master/opt/qnt 分桶
edges/analogous_to.jsonl：跨域类比边，正是 AI"语义共振"需要的素材

行动项 1

把现有 130+ 节点按"是否可被 AI 直接调用"重新打标。能直接调用的进 L3-skills；只是知识陈述的留 L3-ontology。这一步是"自己.skill"的素材编译。

第二层：把研究框架变成可调用的 Skill

TZ 已有的 tz-* 五脉是一个雏形：

Skill	对应环节	"自己.skill"角色
tz-格物	研究 · 概念解剖	分析师 · 第一性原理
tz-拾穗	素材 · 信息整理	研究助理 · 数据清洗
tz-问渠	提问 · 苏格拉底式	评审委员 · 反向追问
tz-互博	对辩 · 多视角	交易对手 · 反方论证
tz-布道	输出 · 教学传递	分析师 · 风格化表达

行动项 2

原文的三个测试场景在 TZ 体系里完全可以复刻。例如测试 3 的 9·24 语义跳跃分析，可以做成一个新 skill tz-语义雷达：输入近 30 天政策文本 + 监管发声频率 → 输出"语义张力评分 + 与资产价格的背离敞口"。

第三层：用 Chief 当数字分身的执行容器

原文里的"自己.skill"是被动调用。TZ 的幕僚团 chief是主动驱动——这正是文章里没讲到的下一步：

传令兵 60s 轮询 → 分派给数字分身 → 张居正/苏格拉底审核 → 输出到 L5 终端

差别在于：原文是"问什么答什么"的 query 式蒸馏，TZ 体系是"事件触发的" agent 式蒸馏。同样的 skill 在 chief 框架里就变成了"每天主动跑出三个候选交易机会"。

第四层：风格化签名（缺口）

这是 TZ 现有体系最薄弱的环节。原文强调"模拟我的表达口吻和行文习惯"——这一步在 TZ 当前的 skill 里还没系统化做。

行动项 3 · 缺口

建议新建 tz-voice skill：把过去 1 年发出的研究简报、阅读室文章、决策记录做语料分析，提取 TZ 的句式习惯 / 标点偏好 / 论证节奏，作为所有 AI 输出的强制后处理层。让 AI 写出来的东西"一眼能认出是 TZ 的口吻"。

第五层：边界守门

原文最后一句"风险提示"——AI 幻觉。TZ 体系里这一层应该有硬约束：

AI 输出门控规则
1. 任何含具体数字的结论必须标注数据源
2. 任何胜率/赔率必须给出回测时间窗
3. 任何仓位建议必须由人工拍板，AI 只给概率
4. 任何政策语义判断必须附原文链接
5. 任何跨周期类比必须列明本周期与历史周期的关键差异

• • •

六、留给 TZ 的三个开放问题

蒸馏的边界在哪？——是把 TZ 一个人蒸馏成一个 skill，还是把 TZ 的"不同模式"（如交易模式 / 研究模式 / 教学模式）分别蒸馏成多个 skill？后者的颗粒度更细，可组合性更强，但维护成本也更高。
"一致预期模拟器"如何变现？——既然 AI 是一致预期的精确仿真器，那么用它做市场情绪的逆向探测器（即"AI 都看好的时候，主力可能在出货"）能不能成为一个 alpha 来源？这是文章没讲到的下一层。
蒸馏频率如何设置？——AI 学到的是"过去的 TZ"，但 TZ 在持续进化。需要建立一个蒸馏-反馈-重蒸馏的循环节奏：每月增量蒸馏 / 每季全量回炉？

• • •

七、金句摘录

"真正的蒸馏，是提取一个分析师的研究框架和肌肉记忆。'自己.skill'体现对自己能力的主动定义。" — 原文 · 范式定义

"AI 判断所承担的角色，是市场大多数参与者的'一致预期'，对文件本身的理解造就的主流观点以及相应资金行为，相比文件的表述和实际程度本身，对市场影响更直接。" — 原文 · 最深一刀

"被淘汰的永远只会是搬运数据的熟练工，而掌握了 AI 工具、拥有独立研究框架的分析师，将会获得一支不知疲倦、脑洞无限的投研 AGI 天团。" — 原文 · 结语

"重要的是'投资于人'。" — 原文 · 一句话定调

"执行成本被打到零，分析师的稀缺性集中到对边际变化的直觉判断。能写报告的人贬值，能在拐点拍板的人升值。" — TZ 注 · 规律 2 的延伸

"胜率是 AI 的主场，赔率与仓位是人类的主场。两个角色不要混淆。" — TZ 注 · 规律 8 的总结

原文：https://mp.weixin.qq.com/s/cZFf3ZvJYVagdQ4eeQR-rA