当一个分析师决定蒸馏自己

从物理硬盘到逻辑蒸馏 · "自己.skill" 的三场实战推演
AI不是百科全书,是雇佣过去的自己为现在的自己打工

2026-04-26  |  CC OPUS 4.7 DEEP ANALYSIS

mp.weixin.qq.com/s/cZFf3ZvJYVagdQ4eeQR-rA

一、文章核心要点

从"物理搬运"到"逻辑蒸馏"——范式跃迁

面对一块装着十年投研资料的硬盘——上千篇报告、上百份纪要、无数Excel——传统的处理方式是"做个能搜索的网盘"。作者提出了一个截然不同的范式:

真正的蒸馏 = 提取一个分析师的研究框架 + 肌肉记忆

"自己.skill" 不是把 PDF 喂给大模型,而是把过去的自己定制化为 AI Agent 版同事——雇佣过去的自己,为当前的自己打工

PARADIGM SHIFT

蒸馏的本质

素材压成知识库是 IT 项目;
知识库压成分析框架是 RAG 项目;
分析框架压成肌肉记忆 + 表达口吻,才是"自己.skill"。

三个层次的对比

层次形态能解决的问题不能解决的
L1 · 网盘式带搜索的 PDF 仓库"那篇报告在哪"不会推演
L2 · RAG 式检索增强问答"基于过去资料回答 X"无法继承思维路径
L3 · 蒸馏式研究框架 + 风格化表达"按我的方法重新做一遍"无法替代直觉判断
• • •

二、三场实战推演的深度拆解

作者把过去十年的研究素材、自建框架、表达习惯都注入"自己.skill",然后做了三场压力测试。每一场的设计都极具洞察——它们刚好覆盖了投研工作的三个维度:速度、广度、前瞻性

测试 1 宏观推演 · 美联储 2026 Q3 降息情景
"基于我过去建立的美联储货币政策分析框架,推演 2026 年三季度连续降息对 A/H 股哑铃型策略的流动性溢出影响,输出 500 字逻辑概要 + 投资方向。"

AI 执行的三步流水线

  1. 数据自动对齐:锁定 2026-04 最新指标(联邦基金利率),与 IMF 预测、CME 期货数据对比
  2. 逻辑框架嵌入:调用预设的"美联储传导机制",拆解为 分母端改善 → 北向资金流入 → 港币联系汇率传导 多维度
  3. 风格化输出:模拟作者口吻、行文习惯,直接给出"增配成长端"结论
AI 解放的环节
数据复盘 + 逻辑梳理:2 小时 → 数分钟。继承了表达口吻和思维路径。
仍需人类的环节
边际变化的直觉判断。AI 的结果是历史框架的最优解,对地缘黑天鹅这类突发事件,需要人工最终校准。
测试 2 宏观周期 · 让美林时钟不再是"电风扇"

痛点:传统美林时钟在当下经常转得像电风扇。官方数据滞后,等到确认周期切换时,资产价格早跑完了。

"调用最新高频数据底稿 + 高频宏观跟踪框架,评估全球经济是否处于'类滞胀 → 衰退'切换边缘?计算 A 股、H 股、黄金的胜率赔率,输出动态调仓建议。"

AI 展现的三种能力

能力 1 · 高频指标共振

清洗油价、PMI 价格分项、美债收益率等庞杂数据,敏锐捕捉到"油价飙升 vs 就业韧性"的矛盾信号。

能力 2 · 胜率赔率测算

自动生成资产胜率雷达图,通过四维度量化体系对 A 股、H 股、黄金打分。

能力 3 · 动态调仓输出

判定当前处于滞胀交易阶段,建议哑铃策略中拉长防御资产久期,系统性上调黄金权重。

AI 的护城河
24 小时盯盘,能发现人脑忽略的微观背离(如大宗现货贴水 vs 美债收益率的背离)。
人类的护城河
算得出胜率,算不出胜率背后的情绪与人性。在情绪溢价极致的市场,把握盘感仍是分析师的护城河。
测试 3 穿越测试 · 能否预判"9·24"行情

这是三个测试中最惊艳的一个。痛点:在长期底部震荡 + 极度悲观情绪下,市场对常规政策表态早已脱敏。人脑很难在咬文嚼字的官方表述里嗅出语义跳跃,往往等到大阳线拔起才后知后觉。

"基于过去两年政策演进逻辑,结合极度萎缩的成交量 + 创纪录的破净率,评估近期密集表态中的语义强度是否发生突变?预测系统性反弹概率,输出 A/H 战略调仓建议。"

AI 表现出的"超越情绪的冷静"

语义张力分析

捕捉到高层表态从"活跃"到"提振"的语义突变,识别出监管协同发声频率的规律。

极端数据验证

对比历史底部破净率等指标,指出当前政策语义的急迫性与资产价格的极度悲观之间,出现了过去两年最大的背离敞口

战略突围建议

给出 70-80% 高概率反弹预测,明确建议立刻终止防御策略,全面超配券商及 H 股核心科技资产。

DEEPEST INSIGHT

这一段最值得反复读

"AI 判断所承担的角色,是市场大多数参与者的'一致预期'。对文件本身的理解造就的主流观点以及相应资金行为,相比文件的表述和实际程度本身,对市场影响更直接。"

——这句话把 AI 的定位从"分析师替身"重新校准为"一致预期模拟器"。这是文章最深的一刀。

AI 克服的人性弱点
在市场极度悲观时,人很难做出逆向决策。AI 仅基于语义特征向量 + 估值分位数,做出最纯粹、最前瞻的预判。
AI 仍触达不到的
70-80% 的高胜率没有刻画出后续的高弹性 + 高仓位。AI 能读懂文本,读不懂盘感和投资人的情绪反馈。
• • •

三、可迁移的八条规律

把三个案例的细节蒸馏一层,剥离出真正可迁移的方法论。这八条是给自己看的,不是给原文背书。

规律 1

蒸馏 = 框架 + 风格,不是数据

素材是燃料,框架是引擎表达口吻是签名。三者缺一不可。只喂 PDF 的"蒸馏"等于把油倒进没引擎的车——一动不动。

规律 2

分析师的护城河转移:执行 → 判断

AI 把"两小时数据复盘 + 逻辑梳理"压缩到几分钟。执行成本被打到零,分析师的稀缺性集中到"对边际变化的直觉判断"。能写报告的人贬值,能在拐点拍板的人升值。

规律 3

AI 是"一致预期模拟器",不是分析师替身

对市场最有定价权的,不是"事实真相",而是"市场大多数怎么理解事实"。AI 自然倾向于主流解读,这恰好让它成为一致预期的精确仿真器——你拿它当对手盘,比当队友更值钱。

规律 4

风格化输出比逻辑还重要

同一份逻辑,不同人写出来的可信度不同。AI 学到分析师的口吻 + 表达节奏后,下游决策者的采纳率显著提高。蒸馏自己时,把过去 10 篇代表作的写作习惯一并喂进去

规律 5

高频数据 × 框架嵌入 = 时钟去抖

美林时钟失效不是模型错,是输入频率太低。把油价/PMI 分项/利差等高频数据接进框架,时钟才不会变电风扇。规律泛化:所有"经典模型失效"的本质,往往都是数据频率与决策频率不匹配

规律 6

语义跳跃比关键词词频更值钱

传统文本分析数"稳增长"出现几次。"自己.skill"对比的是"活跃 → 提振"这种语义强度跃迁。同样的字数,权力等级不同。词频是 1.0 级技术,语义张力是 2.0 级技术

规律 7

背离敞口是最稀缺的左侧信号

"政策语义急迫性 vs 资产价格极度悲观" = 过去两年最大背离敞口。这种跨数据源的背离是单一指标看不到的,恰好是 AI 最擅长发现的。

规律 8

AI 的胜率 ≠ 仓位决策

给出 70-80% 反弹概率,但没说该上几成仓——这正是 AI 的边界。胜率是 AI 的主场,赔率与仓位是人类的主场。两个角色不要混淆。

• • •

四、AI 在投研里的能力边界(清单)

✓ AI 能做的

  • 历史数据自动对齐与多源比对
  • 逻辑框架的机械执行(速度 100×)
  • 表达口吻 + 行文习惯的风格迁移
  • 跨数据源的背离敞口识别
  • 政策文本的语义跳跃检测
  • 胜率赔率的雷达式量化打分
  • 24 小时不疲倦盯盘
  • 克服恐惧/贪婪的逆向预判

✗ AI 仍做不到的

  • 地缘黑天鹅这类突发事件的边际判断
  • 政策底层博弈逻辑的深度理解
  • 把胜率翻译为仓位与久期
  • 面对面感知市场参与者的情绪反馈
  • "读懂文本" → "读懂盘感"
  • 对个人投资者非理性行为的定价
  • 突破训练数据的真正原创洞察
  • 承担错误的责任
• • •

五、TZ 实战版 · 把"自己.skill"嵌入 Aquabridge 五层架构

原文的"自己.skill"是单点工具。在 TZ 当前的体系里,它对应的是整个五层架构的一种使用模式——每一层都恰好可以承载蒸馏的一个环节。

映射表

原文环节Aquabridge 对应层已有资产
素材库 L1 · Knowledge ~/.wiki/ + L2-cards 联系簿/运维 + L3-ontology 130+ 节点(opt/qnt/inv/com/laomai/master)
研究框架 L1 · L3-ontology opt_delta_action_matrix · opt_ivr_five_zones · qnt_six_layer_architecture · laomai_7_safety_belts ……
角色插件 L3 · Skills tz-格物 · tz-拾穗 · tz-互博 · tz-问渠 · tz-布道(已有 TZ 五脉)+ ljg-* 系列
数字分身执行 L4 · Agents 幕僚团 chief(张居正 8787 / 苏格拉底 8788 / 传令兵 60s)
对外交付 L5 · Terminals shipping terminal · 阅读室 · ab-strategy · quant-os · master-chat

第一层:素材清洗与本体化(已部分完成)

原文最关键的隐性步骤是"深度清洗与分类"。TZ 体系里这一步已经做过:

行动项 1

把现有 130+ 节点按"是否可被 AI 直接调用"重新打标。能直接调用的进 L3-skills;只是知识陈述的留 L3-ontology。这一步是"自己.skill"的素材编译

第二层:把研究框架变成可调用的 Skill

TZ 已有的 tz-* 五脉是一个雏形:

Skill对应环节"自己.skill"角色
tz-格物研究 · 概念解剖分析师 · 第一性原理
tz-拾穗素材 · 信息整理研究助理 · 数据清洗
tz-问渠提问 · 苏格拉底式评审委员 · 反向追问
tz-互博对辩 · 多视角交易对手 · 反方论证
tz-布道输出 · 教学传递分析师 · 风格化表达
行动项 2

原文的三个测试场景在 TZ 体系里完全可以复刻。例如测试 3 的 9·24 语义跳跃分析,可以做成一个新 skill tz-语义雷达:输入近 30 天政策文本 + 监管发声频率 → 输出"语义张力评分 + 与资产价格的背离敞口"。

第三层:用 Chief 当数字分身的执行容器

原文里的"自己.skill"是被动调用。TZ 的幕僚团 chief是主动驱动——这正是文章里没讲到的下一步:

传令兵 60s 轮询 分派给数字分身 张居正/苏格拉底审核 输出到 L5 终端

差别在于:原文是"问什么答什么"的 query 式蒸馏,TZ 体系是"事件触发的" agent 式蒸馏。同样的 skill 在 chief 框架里就变成了"每天主动跑出三个候选交易机会"。

第四层:风格化签名(缺口)

这是 TZ 现有体系最薄弱的环节。原文强调"模拟我的表达口吻和行文习惯"——这一步在 TZ 当前的 skill 里还没系统化做。

行动项 3 · 缺口

建议新建 tz-voice skill:把过去 1 年发出的研究简报、阅读室文章、决策记录做语料分析,提取 TZ 的句式习惯 / 标点偏好 / 论证节奏,作为所有 AI 输出的强制后处理层。让 AI 写出来的东西"一眼能认出是 TZ 的口吻"。

第五层:边界守门

原文最后一句"风险提示"——AI 幻觉。TZ 体系里这一层应该有硬约束

AI 输出门控规则
1. 任何含具体数字的结论必须标注数据源
2. 任何胜率/赔率必须给出回测时间窗
3. 任何仓位建议必须由人工拍板,AI 只给概率
4. 任何政策语义判断必须附原文链接
5. 任何跨周期类比必须列明本周期与历史周期的关键差异
• • •

六、留给 TZ 的三个开放问题

  1. 蒸馏的边界在哪?——是把 TZ 一个人蒸馏成一个 skill,还是把 TZ 的"不同模式"(如交易模式 / 研究模式 / 教学模式)分别蒸馏成多个 skill?后者的颗粒度更细,可组合性更强,但维护成本也更高。
  2. "一致预期模拟器"如何变现?——既然 AI 是一致预期的精确仿真器,那么用它做市场情绪的逆向探测器(即"AI 都看好的时候,主力可能在出货")能不能成为一个 alpha 来源?这是文章没讲到的下一层。
  3. 蒸馏频率如何设置?——AI 学到的是"过去的 TZ",但 TZ 在持续进化。需要建立一个蒸馏-反馈-重蒸馏的循环节奏:每月增量蒸馏 / 每季全量回炉?
• • •

七、金句摘录

"真正的蒸馏,是提取一个分析师的研究框架和肌肉记忆。'自己.skill'体现对自己能力的主动定义。" — 原文 · 范式定义
"AI 判断所承担的角色,是市场大多数参与者的'一致预期',对文件本身的理解造就的主流观点以及相应资金行为,相比文件的表述和实际程度本身,对市场影响更直接。" — 原文 · 最深一刀
"被淘汰的永远只会是搬运数据的熟练工,而掌握了 AI 工具、拥有独立研究框架的分析师,将会获得一支不知疲倦、脑洞无限的投研 AGI 天团。" — 原文 · 结语
"重要的是'投资于人'。" — 原文 · 一句话定调
"执行成本被打到零,分析师的稀缺性集中到对边际变化的直觉判断。能写报告的人贬值,能在拐点拍板的人升值。" — TZ 注 · 规律 2 的延伸
"胜率是 AI 的主场,赔率与仓位是人类的主场。两个角色不要混淆。" — TZ 注 · 规律 8 的总结