Question 1

Was ist Helvetic AI?

Accepted Answer

Helvetic AI ist ein unabhängiges Schweizer KI-Evaluationslabor, das KI-Modelle systematisch prüft: für Performance, EU AI Act Compliance, FINMA-Validierung und Schweizer Sprachanforderungen. Jede Evaluation liefert einen HAAS-Score über 6 Dimensionen.

Question 2

Verlassen meine Daten die Schweiz?

Accepted Answer

Nein. Sie wählen aus 5 Handoff-Modi: Benchmark-Intelligence (Standard, keine Daten nötig), API-Key, Docker auf Ihrer Infrastruktur, dedizierte Hardware vor Ort oder Anonymisierung vorab. In keinem Modus verlassen Ihre Daten die Schweiz.

Question 3

Was kostet der Einstieg?

Accepted Answer

Der günstigste Einstieg ist eine KI-Risikoklassifizierung ab CHF 3’000. Für eine vollständige KI-Modell-Evaluation mit Benchmark-Ergebnissen beginnen Preise ab CHF 8’000.

Question 4

Wie lange dauert eine Evaluation?

Accepted Answer

Eine KI-Modell-Evaluation dauert 5–10 Arbeitstage je nach Umfang. Eine Risikoklassifizierung dauert ca. 1 Woche. Eine FINMA-Validierung dauert 2–4 Wochen.

Question 5

Brauche ich IT-Ressourcen?

Accepted Answer

Minimal. Im Standard-Modus (Benchmark-Intelligence) brauchen Sie nichts. Wir haben die Benchmark-Daten bereits. Für Custom-Evaluationen stellen Sie einen API-Key bereit. Der gesamte Prozess ist darauf ausgelegt, Ihren Aufwand zu minimieren.

Question 6

Was ist der HAAS-Score?

Accepted Answer

Der Helvetic AI Assurance Score (HAAS) ist unser zusammengesetztes Scoring-Framework über 6 Dimensionen: Leistung, Robustheit, Sicherheit, Konformität, Schweizer Sprache und Dokumentation. Jede Dimension wird 0–100 bewertet mit Konfidenzintervallen.

Question 7

Was sind Inspect AI und Compl-AI?

Accepted Answer

Inspect AI ist das Evaluations-Framework des UK AI Safety Institute (MIT-Lizenz), genutzt von führenden KI-Laboren. Compl-AI ist die EU AI Act Compliance-Benchmark-Suite von ETH Zürich, INSAIT. Unser System kombiniert beide mit Swiss-Bench, unseren eigenen Schweizer Benchmarks.

Question 8

Was ist Swiss-Bench?

Accepted Answer

Swiss-Bench ist unsere proprietäre Benchmark-Suite mit 436 Szenarien in 11 Aufgaben, die Modelle auf Deutsch, Französisch und Italienisch an domänenspezifischen Aufgaben testet. Wir veröffentlichen Ergebnisse vierteljährlich als Open-Source-Leaderboard.

Question 9

Was erhalte ich konkret?

Accepted Answer

(1) Einen standardisierten Evaluationsbericht mit HAAS-Scores, Lückenanalyse und Empfehlungen. (2) Detaillierte Benchmark-Ergebnisse, Scoring-Aufschlüsselungen und Methodik-Dokumentation zur unabhängigen Verifizierung (Konfiguration, Seed-Werte, Datensätze). Sie können jeden Test selbst wiederholen. (3) Einen Findings-Call zur Ergebnisinterpretation.

Question 10

Wie unterscheiden Sie sich von Beratungsunternehmen?

Accepted Answer

Wir sind ein technisches Audit-Labor, kein Beratungsunternehmen. Unser System liefert systematische, reproduzierbare Ergebnisse. Keine manuellen Bewertungen oder subjektiven Meinungen. Einstieg ab CHF 3’000 vs. CHF 200’000+ bei Big Four. Jeder Test ist wiederholbar.

Question 11

Sind Sie wirklich unabhängig?

Accepted Answer

Ja. Keine kommerziellen Beziehungen zu KI-Modell-Anbietern. Keine Provisionen, keine Vendor-Partnerschaften, kein Pay-for-Score. Jedes Modell wird mit demselben System und derselben Methodik evaluiert.

Question 12

Was verlangt FINMA bei KI-Modellen?

Accepted Answer

FINMA Guidance 08/2024 definiert Aufsichtsbereiche für KI: Governance, Risikoidentifikation, Datenqualität, Test & Validierung, Dokumentation, Erklärbarkeit und unabhängige Überprüfung. Unsere FINMA-Validierung evaluiert gegen alle Bereiche mit 30 FINMA-spezifischen Szenarien.

Question 13

Was sind KI-Halluzinationen?

Accepted Answer

KI-Halluzinationen treten auf, wenn ein Modell plausibel klingende, aber faktisch falsche Informationen generiert: erfundene Gerichtsurteile, nicht existierende Regulierungen, falsche Finanzdaten. Stanford (2024) fand eine 58% Halluzinationsrate bei juristischer KI-Analyse. Wir messen Halluzinationsraten quantitativ als Teil des HAAS-Scores.

Question 14

Wer steckt hinter Helvetic AI?

Accepted Answer

Helvetic AI wurde von Fatih Uenal, PhD gegründet — mit dem Ziel, unabhängige KI-Evaluation für Schweizer Unternehmen zugänglich zu machen. Hintergrund: PhD (HU Berlin), Postdoc Harvard & Cambridge, MSc Computer Science (CU Boulder), MITx Statistics & Data Science. Sitz in Bern, Schweiz.

Question 15

Ist Ihre Methodik peer-reviewed?

Accepted Answer

Unsere Methodik basiert auf über 40 peer-reviewed Publikationen aus Venues wie Nature, NeurIPS, ICLR, ICML, ACL und NAACL. Ein dedizierter wissenschaftlicher Artikel, der das Swiss-Bench-Evaluationsframework, die von Experten verifizierte Ground Truth und die statistischen Methoden beschreibt, befindet sich derzeit in Vorbereitung zur peer-reviewed Publikation.

Häufig gestellte Fragen

Noch Fragen?