原理

Principles

  • 我构建的是一个可信回测与影子撮合引擎,其目标是在相同口径与数据的前提下能复现同样的结果。
  • 不是展示“赚多少”,而是展示“策略与实盘的可验证一致性”。
  • 可复现:同一口径(spec)+ 同一数据 → 结果字节级一致。
  • 证据链:每次发布提供 FREEZE 包与指纹:spec_hash_short "-", freeze_sha256_short "-", code_git_short "-"
  • 影子撮合:对照实盘生成漂移指标 Drift bps(p50/p90) 与资金费等价误差。
  • 当前覆盖加密货币市场,口径与资金费结算均按交易所原始规则实现。
  • 只读延时:所有展示延时 ≥ 15m;不提供交易指令。
  • 我同时搭建了策略生成自主进化引擎。它可以在锁死口径下进行确定性演化,配有混合演化机制、漂移感知优化、与影子对照的逐级晋升。防过拟合机制包括冻结数据集、双跑一致校验、复杂度惩罚与外样本验证,防止策略因偶然性被放大。目前该引擎已经和回测引擎达成小闭环。但是现在还不打算开放,嘿嘿

Reproducible · Auditable · Deterministic · Verified

问答(节选)

以下为关于「可复现性 / FREEZE 包」「影子撮合与漂移」「系统与数据」「进阶挑战」的问答节选

第一组:关于「可复现性」与「FREEZE 包」(核心承诺)
问题一:拿到 spec_hash 与 FREEZE 包后,如何在本地复现字节级一致的报告?是否需要连你们服务器?FREEZE 包包含什么?

FREEZE 包是可离线运行的实验快照,包含:

  • 完整结果(result.jsonreport.jsonaudit.json);
  • 当时的 CONTRACTengine_spec.yaml
  • 五指纹(code_git_hashdata_versionspec_hashrandom_seedenv_fingerprint);
  • 数据切片校验(.sha256)、日志与配置。

复现步骤:解压 → 用 manifest.json 对照依赖 → 运行 python3 -m crypt.runners.replay_freeze manifest.json(可离线)→ sha256sum -c manifest.sha256 验证一致。不是 Docker 镜像,但元数据与哈希足够复现。

问题二:spec_hash 的具体组成?是否包含代码、参数、数据版本、手续费/滑点模型、再平衡、随机种子?

spec_hash = SHA1(engine_spec.yaml + CONTRACT.json + fee_model.py + slippage_model.py + rebalancer.py + seed)

改动上述任意文件/参数都会产生新 spec_hash

问题三:涉及随机性时如何保证确定性?跨平台能 100% 一致吗?

固定 random_seednumpy/random/torch),记录进化过程,打印 env_fingerprint。 只要 Python/依赖版本一致,跨 Linux/Windows 结果哈希一致。

第二组:关于「影子撮合」与「漂移指标」(实盘验证)
问题四:影子撮合如何工作?是否使用逐笔账本?

实盘成交价 vs. 模拟成交价对照,差值为 execution_drift。默认 4h K 线,也支持 Level2(交易所开放时)。

问题五:「漂移中位线 x bps」如何计算?是否可见 p90/p95/p99?极端行情会放大吗?

bps 为相对成交额的基点: drift_bps = (fill_shadow - fill_real)/fill_real × 10^4。提供全分布;极端时期会扩大,并由报告标注异常区间。

问题六:资金费等价误差如何计算?

历史费率回放;计算 funding_align_bps = (funding_shadow - funding_real)/funding_real × 10^4。不做预测。

第三组:关于「系统架构」与「数据」(基础设施)
问题七:离线引擎还是中心化服务?交付形态?

可独立部署:Docker 版或 FREEZE+Runner 工具包。内网运行,不依赖我们的 API。

问题八:历史数据来源与清洗?

直接来自交易所与 Binance Data Portal;清洗含 5σ 过滤、UTC 统一、缺口补齐与多交易所交叉校验;每日 data_audit_stub 验证。

第四组:进阶挑战(外部依赖 & 统计意义)
问题九:涉及外部数据的策略如何锁死依赖以复现?

保存外部源摘要与缓存副本,失效时走副本重放;动态 API 的策略不纳入“确定性回测”。

问题十:“被数学证明”的含义?

非形式化证明;指确定性一致性的可证明性与统计显著性检验(KS / t-test)。

行业意义(节选)
  • 研究黄金标准:spec_hash + FREEZE 达成字节级复现,告别“炼丹术”。
  • 审计与合规自动化:五指纹构成证据链,显著降低信任成本。
  • 价值主张转移:从“神秘阿尔法”到“可验证稳健性”。
  • 潜在风险:框架趋同可能带来集体脆弱性,需要分散化与监控。

过去像炼金术,未来像化学:标准流程、纯净试剂、可重复实验 - 真正的信任

← 返回首页