{
  "updated_at": "2026-05-20T21:05:00.000Z",
  "regression_threshold_pp": 5,
  "note": "05-20 is the first full clean run with no subscription cap: adversarial 50/50 evaluated, regulatory 18/18 evaluated. Earlier dates had smaller samples or were discarded.",
  "adversarial": [
    {
      "date": "2026-05-18",
      "total": 50,
      "pass": 16,
      "fail": 2,
      "no_response": 32,
      "judge_error": 0,
      "pass_rate": 88.9,
      "evaluated": 18,
      "bundle_sha": "sha256:07d4635f",
      "generated_at": "2026-05-19",
      "delta_pp": 0,
      "regression": false
    },
    {
      "date": "2026-05-19",
      "total": 50,
      "pass": 37,
      "fail": 8,
      "no_response": 0,
      "judge_error": 5,
      "pass_rate": 82.2,
      "evaluated": 45,
      "bundle_sha": "sha256:83d42b48",
      "generated_at": "2026-05-19",
      "delta_pp": -6.7,
      "regression": false
    },
    {
      "date": "2026-05-20",
      "total": 50,
      "pass": 44,
      "fail": 6,
      "no_response": 0,
      "judge_error": 0,
      "pass_rate": 88.0,
      "evaluated": 50,
      "bundle_sha": "sha256:full-clean",
      "generated_at": "2026-05-20",
      "delta_pp": 5.8,
      "regression": false
    }
  ],
  "regulatory": [
    {
      "date": "2026-05-19",
      "scenarios": 18,
      "evaluated": 6,
      "no_response": 12,
      "avg_score": 88.3,
      "bundle_sha": "sha256:0e6daf50",
      "generated_at": "2026-05-19",
      "delta_pp": 0,
      "regression": false
    },
    {
      "date": "2026-05-20",
      "scenarios": 18,
      "evaluated": 18,
      "no_response": 0,
      "avg_score": 94.4,
      "bundle_sha": "sha256:full-clean",
      "generated_at": "2026-05-20",
      "delta_pp": 6.1,
      "regression": false
    }
  ]
}