Häufig gestellte Fragen
FAQ
KI-Assurance ist das Produktangebot von Helvetic AI. Wir sind ein unabhängiges Swiss AI Assurance Lab, das KI-Modelle automatisiert evaluiert – für Performance, EU AI Act Compliance, FINMA-Validierung und Schweizer Sprachanforderungen. Jede Evaluation liefert einen KIAS-Score über 6 Dimensionen.
Nein. Sie wählen aus 4 Handoff-Modi: API-Key (Standard), Docker auf Ihrer Infrastruktur (reguliert), dedizierte Hardware vor Ort (Premium), oder Anonymisierung vorab (Privacy-First). In keinem Modus verlassen Ihre Daten die Schweiz.
Der günstigste Einstieg ist eine KI-Risikoklassifizierung ab CHF 3'000. Damit erfahren Sie, ob Ihr KI-System unter die EU AI Act Hochrisiko-Kategorie fällt und welche Pflichten gelten. Für eine vollständige KI-Modell-Evaluation mit Benchmark-Ergebnissen starten die Preise ab CHF 8'000.
Eine KI-Modell-Evaluation dauert 3–8 Arbeitstage, abhängig vom Umfang. In dieser Zeit evaluieren wir 3–5 KI-Modelle mit Ihren echten Daten mittels Inspect AI & Compl-AI, erstellen eine Genauigkeitsmatrix mit Konfidenzintervallen und liefern Ihnen reproduzierbare Benchmark-Ergebnisse mit dokumentierter Methodik.
Minimal. Im Standard-Modus stellen Sie einen API-Key bereit – wir kümmern uns um den Rest. Im Docker-Modus benötigen Sie jemanden, der einen Container starten kann. Der gesamte Prozess ist darauf ausgelegt, Ihren Aufwand zu minimieren.
Der KI-Assurance Score (KIAS) ist unser zusammengesetzter Bewertungsrahmen über 6 Dimensionen: Genauigkeit, Robustheit, Fairness, Datenschutz, Transparenz und Schweizer Regulierungs-Alignment. Jede Dimension wird von 0–100 bewertet, mit Konfidenzintervallen und Stichprobengrössen. Details auf unserer Methodik-Seite.
Inspect AI ist die Evaluations-Infrastruktur des UK AI Safety Institute (MIT-Lizenz), eingesetzt von führenden KI-Laboren wie xAI, mit Beiträgen von DeepMind und Anthropic. Compl-AI ist die EU AI Act Compliance-Benchmark-Suite der ETH Zürich, INSAIT und LatticeFlow AI (ArXiv: 2410.07959). Unsere Engine kombiniert beide mit Swiss-Bench, unseren eigenen Schweizer Benchmarks.
Swiss-Bench ist unser proprietärer Benchmark für Schweizer Sprachen (Deutsch, Französisch, Italienisch), juristische Terminologie, Finanzfachsprache und domänenspezifische Fehlermodi. Wir veröffentlichen die Ergebnisse quartalsweise als Open-Source-Leaderboard und ArXiv-Publikation.
Eine strukturierte Analyse Ihres KI-Systems gemäss EU AI Act Risikoklassen (minimal, begrenzt, hoch, inakzeptabel). Sie erhalten einen dokumentierten Entscheidungsbaum, eine Risikomatrix und konkrete Handlungsempfehlungen. Der ideale Einstieg ab CHF 3'000, um zu klären, welche regulatorischen Pflichten für Ihr System gelten.
Wir evaluieren 3–5 KI-Modelle mit Ihren echten Daten auf Schweizer Infrastruktur mittels Inspect AI & Compl-AI. Sie erhalten eine Genauigkeitsmatrix mit Konfidenzintervallen, eine Fehlermodus-Analyse und reproduzierbare Benchmark-Ergebnisse mit dokumentierter Methodik. Ab CHF 8'000.
Die Premium-Leistung für Finanzinstitute: Wir validieren Ihre KI-Modelle gemäss FINMA-Anforderungen an Modellrisikomanagement. Inklusive Modellrisiko-Governance, Validierungsbericht und Dokumentation für die Aufsicht. Ab CHF 15'000.
Eine umfassende Konformitätsbewertung Ihres KI-Systems gegen die Anforderungen des EU AI Act. Technische Evaluation, Risikomanagement-Dokumentation, Qualitätsmanagement-Prüfung und menschliche Aufsichtsmechanismen. Sie erhalten einen audit-fertigen Bericht. Ab CHF 8'000.
KI-Modelle verändern sich laufend. Wir führen Ihre Benchmarks automatisch bei jedem relevanten Modell-Update erneut durch und melden Genauigkeits-Drift und Compliance-Änderungen, bevor sie zum Problem werden. Verfügbar als Quartals-Abonnement ab CHF 3'000–5'000 pro Quartal.
Sie erhalten: (1) Einen standardisierten Evaluationsbericht mit KIAS-Scores, Lückenanalyse und Empfehlungen. (2) Den kompletten Evaluations-Harness (Konfiguration, Seed-Werte, Datensätze) – Sie können jeden Test jederzeit selbst wiederholen. (3) Ein Findings-Gespräch zur Ergebnisinterpretation.
Wir sind ein technisches Audit-Labor, kein Beratungsunternehmen. Unsere Engine liefert automatisierte, reproduzierbare Ergebnisse – keine manuellen Assessments oder subjektiven Meinungen. Einstieg ab CHF 3'000 (vs. CHF 200'000+ bei Big Four). Jeder Test ist wiederholbar.
Ja. Wir haben keine kommerziellen Beziehungen zu KI-Modell-Anbietern. Keine Provisionen, keine Vendor-Partnerschaften, kein Pay-for-Score. Jedes Modell wird mit derselben Methodik evaluiert. Unsere Unabhängigkeit ist ein Kernprinzip – lesen Sie unsere vollständige Unabhängigkeitserklärung.
Starten Sie mit einer KI-Risikoklassifizierung (ab CHF 3'000), um zu klären, welche regulatorischen Anforderungen für Ihr System gelten. Dann folgt eine KI-Modell-Evaluation (ab CHF 8'000) mit reproduzierbaren Benchmarks. Für Finanzinstitute empfehlen wir die FINMA-Validierung (ab CHF 15'000). Laufendes Monitoring hält Ihre Compliance aktuell. Alle Leistungen finden Sie auf unserer Leistungen-Seite.
KI-Halluzinationen entstehen, wenn ein Modell plausibel klingende aber faktisch falsche Informationen generiert – z.B. erfundene Gerichtsurteile, nicht existierende Regulierungen oder falsche Finanzdaten. Eine Stanford-Studie (2025) zeigt eine 58% Halluzinationsrate bei juristischer KI-Analyse. FINMA Guidance 08/2024 nennt Halluzinationen explizit als GenAI-Risiko. Wir messen die Halluzinationsrate quantitativ als Teil des KIAS-Scores und identifizieren Themenbereiche mit erhöhtem Risiko.
KI-Bias (Verzerrung) liegt vor, wenn ein Modell bestimmte Gruppen systematisch benachteiligt – etwa bei Kreditentscheiden, Versicherungsprämien oder Bewerbungsscreenings. Der EU AI Act stuft solche Systeme als Hochrisiko ein. Wir messen Fairness-Metriken über demografische Gruppen und domänenspezifische Szenarien als Teil der KIAS-Fairness-Dimension.
FINMA Guidance 08/2024 definiert 7 Aufsichtsbereiche für KI: Governance, Risiko-Identifikation, Datenqualität, Testing & Validierung, Dokumentation, Erklärbarkeit und unabhängige Überprüfung. Unsere FINMA-Validierung (P3) evaluiert Ihr Modell gegen alle 7 Bereiche mit 30 FINMA-spezifischen Szenarien inkl. Halluzinations-Stresstests.
Modell-Drift bezeichnet die schleichende Verschlechterung der KI-Performance über Zeit – durch veränderte Daten, Modell-Updates oder regulatorische Änderungen. Die EZB hat Banken mit EUR 1,24 Mio. gebüsst für veraltete AML-Modelle. Unser Monitoring (P5) führt quartalweise automatisierte Re-Evaluationen durch: Drift-Erkennung, Halluzinations-Tracking, Compliance-Änderungen.
Wenn Sie KI-Systeme in geschäftskritischen Prozessen einsetzen – Kreditentscheide, Schadenbearbeitung, Kundenberatung, Rechtstextanalyse – dann ja. Der EU AI Act verlangt ab Dezember 2027 technische Compliance-Nachweise für Hochrisiko-Systeme. FINMA erwartet bereits heute unabhängige Modellvalidierung. Starten Sie mit unserem kostenlosen Readiness Check, um Ihren Handlungsbedarf einzuschätzen.
KI-Assurance ist das Produktangebot von Helvetic AI (ai-helvetic.ch). Helvetic AI ist die Dachmarke und juristische Einheit (Einzelfirma, Fatih Uenal, PhD). Alle Evaluations-, Compliance- und Monitoring-Leistungen laufen unter KI-Assurance.