Helvetic AI | Schweizer KI-Evaluation & Compliance

HELVETIC
AI

Unabhängige KI-Evaluation für Schweizer Unternehmen.

Standort Bern, Schweiz Gegründet 2026 Technologie Inspect AI · Compl-AI · Swiss-Bench Leistungen AI Compliance & AI Performance Fokus Schweizer KMU & Konzerne

Compliance

Ist Ihre KI konform?

EU AI Act, FINMA 08/2024, nDSG. Risikoklassifizierung, Konformitätsbewertung, auditierfähige Evidenz.

Compliance-Pfad → Performance

Welches Modell passt zu Ihren Aufgaben?

Domänenspezifisches Benchmarking in DE/FR/IT. Halluzinationserkennung, Modellvergleich, Selektionsevidenz.

Performance-Pfad →

01 / Das Problem

KI ist längst im Einsatz, aber niemand prüft sie unabhängig.

50% der Schweizer Finanzinstitute nutzen bereits KI, 91% davon generative KI. Doch die Governance hat nicht Schritt gehalten. Nur die Hälfte hat KI in eine explizite Strategie eingebunden.

Der EU AI Act verlangt voraussichtlich ab Dezember 2027 technische Compliance-Nachweise für Hochrisiko-Systeme. FINMA erwartet bereits heute nachvollziehbare Modellvalidierung. Doch es gibt keine Schweizer Evaluationsinfrastruktur und keine unabhängigen Prüfer im Mittelstandssegment.

FINMA-Erhebung (veröffentlicht April 2025): Von ~400 befragten Finanzinstituten nutzt die Hälfte KI, die Governance-Lücke ist erheblich. Stanford-Studie (2024): 58% Halluzinationsrate bei juristischer KI-Analyse. Asai et al. (Nature, 2026): LLMs halluzinieren Zitate in 78–90% der Fälle — wenn Modelle Gesetzesartikel zitieren, erfinden sie die Referenzen in der Mehrzahl der Fälle. Der EU AI Act Digital Omnibus verschiebt Hochrisiko-Fristen auf Dezember 2027 (Annex III) bzw. August 2028 (Annex I).

	Traditionelles KI-Audit	Helvetic AI
Dauer	3–6 Monate	5–10 Tage
Kosten	CHF 200K+ (Big Four)	ab CHF 8'000
Methodik	Proprietäre Black Box	Reproduzierbar, evidenzbasiert
Basis	Meinungsbasiert	Evidenzbasiert, systematische Benchmarks
Unabhängigkeit	Vendor-Beziehungen	Keine Provisionen, kein Pay-for-Score

50%

der Schweizer Finanzinstitute nutzen bereits KI

91%

davon setzen generative KI ein. Governance hinkt hinterher

Dez. 2027

EU AI Act Hochrisiko-Deadline (Annex III)

5–10 Tage

vom Erstgespräch zum fertigen Evaluationsbericht

Quellen: FINMA AI-Erhebung (veröffentlicht April 2025), EU AI Act Digital Omnibus 2025

System-Fundament & Compliance

Inspect AI (UK AISI) Compl-AI (ETH Zürich) Swiss-Bench nDSG EU AI Act FINMA Schweizer Unternehmen

Inspect AI: UK AI Safety Institute · Compl-AI: ETH Zürich / INSAIT · Swiss-Bench: eigene Schweizer Sprachbenchmarks

02 / Das System

Ein Evaluationssystem: unabhängig, reproduzierbar, Schweiz-spezifisch.

Unser System kombiniert Inspect AI (UK AI Safety Institute), Compl-AI (ETH Zürich) und Swiss-Bench (eigene Schweizer Benchmarks). Jedes Modell erhält einen HAAS (Helvetic AI Assurance Score) über 6 Dimensionen, mit Konfidenzintervallen und detaillierten Benchmark-Ergebnissen, Scoring-Aufschlüsselungen und Methodik-Dokumentation zur Reproduktion.

HAAS-Score

6 Dimensionen: Leistung (inkl. Halluzinationsrate), Robustheit, Sicherheit, Konformität, Schweizer Sprache, Dokumentation. Jede Dimension 0–100 mit Konfidenzintervallen.

Reproduzierbare Methodik

Sie erhalten umfassende Benchmark-Ergebnisse und detaillierte Scoring-Aufschlüsselungen: Konfiguration, Seed-Werte, Datensätze. Sie können jeden Test jederzeit selbst wiederholen.

Unabhängigkeit

Keine kommerziellen Beziehungen zu KI-Modell-Anbietern. Keine Provisionen. Keine Vendor-Partnerschaften. Kein Pay-for-Score. Jedes Modell wird gleich evaluiert.

Datensouveränität

5 Handoff-Modi: Benchmark-Intelligence (Standard), API-Key, Docker auf Ihrer Infrastruktur, Hardware vor Ort, Anonymisierung vorab. Sie entscheiden.

Air-Gapped-Evaluation verfügbar. Für FINMA-regulierte Institutionen und Hochsicherheitsumgebungen: Wir bringen die Evaluation auf dedizierter Hardware zu Ihnen. Keine Daten verlassen Ihre Räumlichkeiten. Alle Übergabe-Modi →

Swiss-Bench Leaderboard: Wie schneiden führende KI-Modelle bei Schweiz-spezifischen Aufgaben in DE/FR/IT ab? 11 Modelle in 436 Szenarien — quartalsweise aktualisiert. Swiss-Bench ansehen →

Anwendungsfälle

Wie Schweizer Unternehmen Helvetic AI nutzen.

Konfiguration

Wir konfigurieren die Evaluations-Pipeline für Ihre Modelle, Daten und Compliance-Anforderungen.

2–4 Stunden

Evaluation

Das System benchmarkt systematisch: HAAS-Score, Schweizer Sprachqualität, EU AI Act Compliance, domänenspezifische Szenarien.

3–8 Arbeitstage

Übergabe

Sie erhalten den Evaluationsbericht mit HAAS-Scores, Lückenanalyse und Empfehlungen, plus umfassende Benchmark-Ergebnisse und detaillierte Scoring-Aufschlüsselungen.

Berichtslieferung

04 / Gründer

Fatih Uenal, PhD

Ich baue KI-Systeme für regulierte Schweizer Unternehmen und kenne die Governance-Lücke aus erster Hand. Laut Studien nutzen über 75% der Mitarbeitenden KI-Tools ohne formale Genehmigung. Die grossen Beratungen ignorieren KMU, die Tools sind zu teuer, und die Regulierung wird strenger.

Helvetic AI schliesst diese Lücke mit unabhängiger Evaluation, Schweizer Infrastruktur und dem Prinzip, dass KI sicher eingesetzt werden kann, wenn man die richtige Evidenz hat.

Forschung PhD Political Science (HU Berlin), Postdoc Harvard & Cambridge
Technologie MSc Computer Science (CU Boulder), MITx Statistics & Data Science
Praxis AI systems & security operations in regulated Swiss infrastructure
Standort Bern, Schweiz

05 / Kontakt

Bereit für eine unabhängige Evaluation?

Starten Sie mit einer KI-Risikoklassifizierung oder direkt mit einer Modell-Evaluation. In ein bis zwei Wochen wissen Sie, wo Ihre KI-Systeme stehen, evidenzbasiert, nicht meinungsbasiert.

Risikoklassifizierung ab CHF 3'000 · Modell-Evaluation ab CHF 8'000 · FINMA-Validierung ab CHF 15'000 · Alle Leistungen

contact@ai-helvetic.ch