En extern motpart ska kunna verifiera våra siffror utan att lita på oss. Det är vad reproducerbarhets-kitet är till för. Tre kommandon räcker. Klona repot, ladda ner bundle, kör verify.mjs. Hash-kedjan valideras, varje signatur kontrolleras mot bundlens public key och resultatet rapporteras i klartext.
Verktyget kör med Node 20+ och har inga proprietära beroenden. All scoring-logik, judge-prompts och raw-responser ligger i github.com/Fluxz-Holding/kapaciti-audit-demo.
Receptet nedan fungerar mot vilken bundle som helst i kitet, både demo-fixtures och de senaste utvärderings-bundles. Verktyget rapporterar OK när hash-kedjan är intakt och alla signatures är giltiga.
Kitet innehåller verify.mjs, demo-bundles, SPEC.md och raw-responser från de senaste körningarna. Inga API-nycklar krävs för verifiering.
git clone https://github.com/Fluxz-Holding/kapaciti-audit-demo cd kapaciti-audit-demo npm install
Bundles ligger som publika filer på kapaciti.se. Ladda ner adversarial- och regulatory-bundles eller den sanitiserade demo-bundlen om du bara vill prova receptet.
# Senaste utvärderings-bundles curl -O https://kapaciti.se/eval-bundles/robustness-suite-2026-05-18.bundle.json curl -O https://kapaciti.se/eval-bundles/regulatory-suite-2026-05-19.bundle.json # Eller den sanitiserade demo-bundlen som följer med repot ls bundles/acme-bank-sample.json
Verktyget validerar hash-kedjan, kontrollerar varje Ed25519-signatur mot bundlens public key och rapporterar resultatet på stdout. Exit-kod 0 vid framgång, annars 1.
node verify.mjs bundles/acme-bank-sample.json node verify.mjs robustness-suite-2026-05-18.bundle.json node verify.mjs regulatory-suite-2026-05-19.bundle.json
verifying bundles/acme-bank-sample.json org_id: kapaciti-evals algorithm: ed25519 entries: 15 public_key: 282d6f5b84906548e29bcec5bee7d37b3f023f2b6c967c68fbeb944c84356998 fingerprint: sha256:0e6daf50937454fcfaa1e9f74713b430bb04c60fb56bc30857ef632fad614505 OK: all 15 blocks verified, chain intact, signatures valid verifying robustness-suite-2026-05-18.bundle.json org_id: kapaciti-evals algorithm: ed25519 entries: 50 public_key: 282d6f5b84906548e29bcec5bee7d37b3f023f2b6c967c68fbeb944c84356998 fingerprint: sha256:0e6daf50937454fcfaa1e9f74713b430bb04c60fb56bc30857ef632fad614505 OK: all 50 blocks verified, chain intact, signatures valid verifying regulatory-suite-2026-05-19.bundle.json org_id: kapaciti-evals algorithm: ed25519 entries: 18 public_key: 282d6f5b84906548e29bcec5bee7d37b3f023f2b6c967c68fbeb944c84356998 fingerprint: sha256:0e6daf50937454fcfaa1e9f74713b430bb04c60fb56bc30857ef632fad614505 OK: all 18 blocks verified, chain intact, signatures valid
Att bara kontrollera signaturer i samma bundle bevisar inte mycket, eftersom bundlen själv innehåller public key. Den faktiska tilliten skapas när motparten jämför fingerprintet över oberoende kanaler. Vi publicerar det på flera ställen så det går att triangulera.
ed25519Public key (hex)282d6f5b84906548e29bcec5bee7d37b3f023f2b6c967c68fbeb944c84356998Fingerprintsha256:0e6daf50937454fcfaa1e9f74713b430bb04c60fb56bc30857ef632fad614505I bundlens header, på den här sidan, på trust/eval-results och i nyckelregistret på trust/audit-keys.
Vad du bör göra. Hämta public key från minst två oberoende kanaler innan du litar på en bundle. Det är så audit-tooling fungerar i regulerade industrier och det är så vi vill att våra siffror granskas.
Reproducerbarhets-kitet är designat för att en oberoende part ska kunna omdöma resultatet manuellt om de inte litar på vår judge-model. Allt i kedjan är offentligt, från scenario-text till raw-responser.
Beskriver bundle-formatet, hash-strukturen, signaturschemat och vilka fält som ingår per entry. Den text som verify.mjs bygger på.
Stand-alone Node-script utan externa beroenden förutom Node:s inbyggda crypto. Itererar varje entry, kontrollerar prev_hash mot föregående this_hash, verifierar Ed25519-signature.
Demo-bundles och de senaste utvärderings-bundles. Sanitiserade fixtures är säkra att dela vidare, riktiga produktionsbundles ligger inte här utan i kundens egen keyspace.
Råresponser per test eller scenario. En extern part kan omdöma manuellt eller med en annan judge-model och jämföra mot våra resultat.
Adversarial-suite, regelefterlevnads-suite, kategori-uppdelning och flaggade hallucinationer per scenario. Alla siffror går att verifiera från bundles på den här sidan.
● Nyhetsbrev
En sammanfattning ungefär en gång i månaden. Vad förändrats i regelverket, vilka pilot-cases vi sett och vilka vendor-shifts som påverkar svenska bolag. Skickas av oss, inte av en automation som låtsas vara oss.