Google Gemini 3.5 Flash wird Standard: Was die Preiserhöhung für Schweizer Startups bedeutet

| loaded.ch | 8 Min. Lesezeit
AI Startup Gemini API-Kosten Schweiz
Teilen:

Google hat am 19. Mai 2026 bei der I/O-Konferenz Gemini 3.5 Flash angekündigt — seit 1. Juni ist es Standard in allen Google-AI-Produkten. Die neue Flash-Version schlägt den Vorgänger Gemini 3.1 Pro bei Coding- und Agent-Benchmarks, kostet aber dreimal mehr als der alte Flash. Für Schweizer Startups, die gerade ein MVP, eine investor-ready Website oder eine AI-gestützte Produktinfrastruktur planen, ändert sich die Kostenkalkulation merklich. Flash-Preise verdreifacht — für Startups, die jetzt eine investor-ready Website oder ein MVP brauchen, ist das relevant: API-Budgets müssen neu kalkuliert werden, besonders wenn Agent-Workflows zentral sind.

CHF 1.35 / 8.10

Neue Flash-Preise pro M Tokens (Input/Output)

76,2 %

Terminal-Bench 2.1 Score (schlägt 3.1 Pro mit 70,3 %)

4x schneller

Output-Tokens/Sek. vs. andere Frontier-Modelle

Gemini 3.5 Flash schlägt Gemini 3.1 Pro — aber kostet dreimal mehr

Google positioniert Gemini 3.5 Flash nicht mehr als „günstiges Einstiegsmodell”, sondern als Standard-Tier für Agent- und Coding-Workflows. Laut der offiziellen Ankündigung vom 19. Mai 2026 übertrifft 3.5 Flash den bisherigen Pro-Tier in drei zentralen Kategorien:

BenchmarkGemini 3.5 FlashGemini 3.1 ProBedeutung
Terminal-Bench 2.176,2 %70,3 %Agent-Tasks + Terminal-Operationen
MCP Atlas83,6 %78,2 %Model Context Protocol Tool-Use
CharXiv Reasoning84,2 %Multimodales Chart- und Bildverständnis
GDPval-AA1656 EloAgent-Evaluierungsmetrik (reale Tasks)

Die neue Preisstruktur: CHF 1.35 Input / CHF 8.10 Output pro Million Tokens (ca. $1.50 / $9.00 zum aktuellen Wechselkurs). Das ist dreimal mehr als Gemini 3 Flash (CHF 0.45 / CHF 2.70), aber rund 40 % günstiger als Gemini 3.1 Pro (CHF 2.25 / CHF 13.50).

💡 Schweizer Startups, die heute Claude oder GPT-4o nutzen: 3.5 Flash ist ca. 60 % günstiger als Claude Opus 4.7 (CHF 4.50 / CHF 22.50), aber nur bei Agent- und Coding-Tasks konkurrenzfähig.

Für Startups bedeutet das: Flash ist nicht mehr die Spar-Option, sondern das neue Standardmodell für agentic workflows. Wenn Ihr MVP auf Code-Generierung, Browser-Agents oder multimodalen Workflows basiert, rechnet sich 3.5 Flash trotz Preiserhöhung — weil die Alternative (3.1 Pro oder Claude/GPT) teurer ist.

Wann lohnt sich der Wechsel für Schweizer Startups?

Die Entscheidung hängt davon ab, welche Tasks Ihr MVP hauptsächlich abdeckt. Hier die Praxis-Matrix:

Wechseln Sie auf Gemini 3.5 Flash, wenn:

  • Ihr MVP hauptsächlich Code generiert (Terminal-Bench +8,4 % vs. 3.1 Pro)
  • Sie Agent-Workflows bauen, die Tools orchestrieren (MCP Atlas +6,8 %)
  • Multimodale Analyse (Bild + Video + Text) zentral ist
  • Sie aktuell Gemini 3 Flash nutzen und mehr Power brauchen

Bleiben Sie vorerst bei 3.1 Pro / Claude / GPT, wenn:

  • Ihr MVP primär Wissensfragen beantwortet (GPQA-Lücke zu Claude/GPT bleibt)
  • Long-Context-Retrieval (>128k Tokens) kritisch ist
  • Sie auf Google 3.5 Pro warten wollen (angekündigt für Juni 2026, 2M-Token-Context)

Achtung: Google 3.5 Pro kommt im Juni 2026

Sundar Pichai kündigte bei der I/O-Keynote an: „Give us until next month to get it to you." Gemini 3.5 Pro bringt 2M-Token-Context (doppelt so viel wie Flash), Deep Think Reasoning und stärkere Long-Context-Retrieval. Wenn Ihr MVP auf grosse Dokumenten-Analysen setzt, lohnt sich eventuell Abwarten.

Preisvergleich: Was kostet ein Startup-MVP mit Gemini 3.5 Flash?

Schweizer Startups sollten die Total Cost of Ownership pro Task-Typ rechnen, nicht nur die Token-Preise vergleichen. Hier die wichtigsten Anbieter im Vergleich (Stand Juni 2026):

AnbieterModellInput (CHF/M)Output (CHF/M)ContextBest for
GoogleGemini 3.5 Flash1.358.101MAgent-Tasks, Coding, Multimodal
GoogleGemini 3.1 Pro2.2513.502MWissens-Tasks, lange Dokumente
AnthropicClaude Opus 4.74.5022.50200kReasoning, Qualität über alles
OpenAIGPT-5.5 Instant~3.60~10.80128kGeneral Purpose, breites Tooling

Rechenbeispiel: MVP mit 100k Agent-Calls pro Monat

Annahme: 1’500 Input-Tokens + 500 Output-Tokens pro Call

  • Gemini 3.5 Flash: (100’000 × 1’500 / 1M × CHF 1.35) + (100’000 × 500 / 1M × CHF 8.10) = CHF 607.50/Monat
  • Claude Opus 4.7: (100’000 × 1’500 / 1M × CHF 4.50) + (100’000 × 500 / 1M × CHF 22.50) = CHF 1’800/Monat
  • Einsparung mit Flash: CHF 1’192.50/Monat (ca. CHF 14’300/Jahr)

Für Seed-Stage-Startups, die ein AI-gestütztes MVP bauen, ist das der Unterschied zwischen 3 und 8 Monaten Runway bei gleicher Funktionalität.

Wechseln Sie auf Gemini 3.5 Flash, wenn Coding und Agent-Tasks dominieren. Warten Sie auf 3.5 Pro (Juni 2026), wenn Long-Context-Retrieval oder Deep Think zentral sind. Bleiben Sie bei Claude/GPT, wenn höchste Reasoning-Qualität wichtiger ist als Kosten.

Praktische Entscheidungshilfe: Welches Modell für welchen Startup-Use-Case?

Use CaseEmpfohlenes ModellWarum
Code-Generierung (React, Python, APIs)Gemini 3.5 FlashTerminal-Bench 76,2 %, 4x schneller, CHF 1.35/M
Agent-Workflows (MCP, Tools, Browser)Gemini 3.5 FlashMCP Atlas 83,6 %, beste Tool-Use im Juni 2026
Multimodale Analyse (Bild + Text)Gemini 3.5 FlashCharXiv 84,2 %, natives Multimodal-Verständnis
Long-Context (>500k Tokens)Gemini 3.1 Pro2M Context, bessere Retrieval bei langen Docs
Höchste Reasoning-QualitätClaude Opus 4.7Frontier-Model, dafür 2,7x teurer

Für die meisten Schweizer Seed-Stage-Startups ist Gemini 3.5 Flash ab Juni 2026 die wirtschaftlichste Wahl — wenn der Use-Case Agent- oder Coding-lastig ist. Für Reasoning-Heavy-MVPs (z. B. Rechtsberatung, Medical Diagnostics, komplexe Finanzanalyse) bleibt Claude Opus 4.7 oder GPT-5.5 die bessere Wahl, trotz höherer Kosten.

Was ändert sich bei der Migration von Flash 3.x auf 3.5?

Wenn Sie aktuell Gemini 3 Flash oder 3.1 Pro im Stack haben, läuft die Migration meist in einer Stunde. Google hat die SDKs kompatibel gehalten, Sie ändern nur den Model-String von gemini-3.1-pro-preview auf gemini-3.5-flash.

Drei Punkte, die Startups beachten sollten:

  1. Context Caching bleibt gleich — wenn Sie grosse System-Prompts cachen, funktioniert das weiter
  2. Thinking Config (Reasoning-Modi) sind identisch zwischen Flash und Pro → einfaches A/B-Testing
  3. Rate Limits ändern sich nicht — Flash bleibt bei den Standard-Limits (60 Requests/Minute für Pay-as-you-go)
💡 Swiss-AI-Initiative-Projekte aufgepasst: Gemini 3.5 Flash unterstützt MCP (Model Context Protocol) mit 83,6 % Score. Wenn Ihr Projekt MCP-Tools nutzt, ist Flash die beste Wahl im Juni 2026.

Gemini 3.5 Pro kommt im Juni — was Startups jetzt tun sollten

Google hat Gemini 3.5 Pro für Juni 2026 angekündigt. Pro bringt 2M-Token-Context (doppelt so viel wie Flash), Deep Think Reasoning und bessere Long-Context-Retrieval. Sundar Pichai sagte bei I/O: „It’s already being used internally, and we look forward to rolling it out next month.”

Strategie für Schweizer Startups:

  1. Heute auf 3.5 Flash wechseln, wenn Coding/Agents zentral sind
  2. Pro-Model-Card abwarten (kommt vermutlich Mitte Juni als Google-Blog-Post)
  3. A/B-Testing einbauen: Flash für Speed, Pro für Quality — dann per Task-Typ routen
  4. Budget-Puffer einplanen: Pro wird teurer als Flash, vermutlich CHF 3–4 Input / CHF 15–18 Output

Fazit: Flash ist kein „Budget-Modell” mehr — sondern das neue Standardmodell

Googles Strategie ist klar: Gemini 3.5 Flash soll die Mitte des Marktes erobern — stark genug für produktive Agent-Workflows, schnell genug für Echtzeit-Apps, günstig genug für Startups. Die Preiserhöhung (3x vs. Gemini 3 Flash) ist Google’s Signal: „Flash ist jetzt das Hauptmodell, nicht die Spar-Option.”

Für Schweizer Startups, die ein AI-gestütztes MVP oder eine investor-ready Website bauen, lohnt sich die Migration — aber nur, wenn Sie vorher die Task-Verteilung analysieren. Wenn 70 % Ihrer API-Calls Code-Generierung oder Agent-Workflows sind, spart 3.5 Flash Geld. Wenn 70 % Reasoning-Heavy-Tasks sind, bleibt Claude oder GPT die bessere Wahl.

Drei konkrete Schritte für Juni 2026:

  1. API-Logs der letzten 30 Tage analysieren — Task-Typ, Token-Verbrauch, Fehlerrate
  2. A/B-Test mit 10 % Traffic auf 3.5 Flash — Qualität + Latenz + Kosten messen
  3. Budget-Szenario für 3.5 Pro rechnen — kommt im Juni, wird teurer, aber stärker

Google hat mit Gemini 3.5 Flash ein Modell gebaut, das für viele Schweizer Startups die wirtschaftlichste Wahl ist — wenn man weiss, wofür man es einsetzt. Die nächsten vier Wochen (bis 3.5 Pro landet) sind die richtige Zeit, um das herauszufinden.

(Quellen: Google I/O 2026 Keynote 19. Mai 2026, Gemini 3.5 Flash Model Card Google DeepMind 1. Juni 2026, TechCrunch 19. Mai 2026, Gemini API Changelog Juni 2026)

Teilen:
Benjamin Wagner, Gründer von loaded.

Benjamin Wagner

Gründer & Lead Developer bei loaded. Baut ultraschnelle, KI-optimierte Websites für Schweizer KMU seit 2024. Entwickler von OpenHermit.

Mehr über Benjamin →

Kostenloses Strategiegespräch buchen.

30 Minuten — unverbindlich, kein Verkaufsgespräch. Wir analysieren Ihre Situation und zeigen, was möglich ist.

MoDiMiDoFrSaSo
Verfügbare Zeiten werden geladen...