Google hat am 19. Mai 2026 bei der I/O-Konferenz Gemini 3.5 Flash angekündigt — seit 1. Juni ist es Standard in allen Google-AI-Produkten. Die neue Flash-Version schlägt den Vorgänger Gemini 3.1 Pro bei Coding- und Agent-Benchmarks, kostet aber dreimal mehr als der alte Flash. Für Schweizer Startups, die gerade ein MVP, eine investor-ready Website oder eine AI-gestützte Produktinfrastruktur planen, ändert sich die Kostenkalkulation merklich. Flash-Preise verdreifacht — für Startups, die jetzt eine investor-ready Website oder ein MVP brauchen, ist das relevant: API-Budgets müssen neu kalkuliert werden, besonders wenn Agent-Workflows zentral sind.
CHF 1.35 / 8.10
Neue Flash-Preise pro M Tokens (Input/Output)
76,2 %
Terminal-Bench 2.1 Score (schlägt 3.1 Pro mit 70,3 %)
4x schneller
Output-Tokens/Sek. vs. andere Frontier-Modelle
Gemini 3.5 Flash schlägt Gemini 3.1 Pro — aber kostet dreimal mehr
Google positioniert Gemini 3.5 Flash nicht mehr als „günstiges Einstiegsmodell”, sondern als Standard-Tier für Agent- und Coding-Workflows. Laut der offiziellen Ankündigung vom 19. Mai 2026 übertrifft 3.5 Flash den bisherigen Pro-Tier in drei zentralen Kategorien:
| Benchmark | Gemini 3.5 Flash | Gemini 3.1 Pro | Bedeutung |
|---|---|---|---|
| Terminal-Bench 2.1 | 76,2 % | 70,3 % | Agent-Tasks + Terminal-Operationen |
| MCP Atlas | 83,6 % | 78,2 % | Model Context Protocol Tool-Use |
| CharXiv Reasoning | 84,2 % | – | Multimodales Chart- und Bildverständnis |
| GDPval-AA | 1656 Elo | – | Agent-Evaluierungsmetrik (reale Tasks) |
Die neue Preisstruktur: CHF 1.35 Input / CHF 8.10 Output pro Million Tokens (ca. $1.50 / $9.00 zum aktuellen Wechselkurs). Das ist dreimal mehr als Gemini 3 Flash (CHF 0.45 / CHF 2.70), aber rund 40 % günstiger als Gemini 3.1 Pro (CHF 2.25 / CHF 13.50).
Für Startups bedeutet das: Flash ist nicht mehr die Spar-Option, sondern das neue Standardmodell für agentic workflows. Wenn Ihr MVP auf Code-Generierung, Browser-Agents oder multimodalen Workflows basiert, rechnet sich 3.5 Flash trotz Preiserhöhung — weil die Alternative (3.1 Pro oder Claude/GPT) teurer ist.
Wann lohnt sich der Wechsel für Schweizer Startups?
Die Entscheidung hängt davon ab, welche Tasks Ihr MVP hauptsächlich abdeckt. Hier die Praxis-Matrix:
Wechseln Sie auf Gemini 3.5 Flash, wenn:
- Ihr MVP hauptsächlich Code generiert (Terminal-Bench +8,4 % vs. 3.1 Pro)
- Sie Agent-Workflows bauen, die Tools orchestrieren (MCP Atlas +6,8 %)
- Multimodale Analyse (Bild + Video + Text) zentral ist
- Sie aktuell Gemini 3 Flash nutzen und mehr Power brauchen
Bleiben Sie vorerst bei 3.1 Pro / Claude / GPT, wenn:
- Ihr MVP primär Wissensfragen beantwortet (GPQA-Lücke zu Claude/GPT bleibt)
- Long-Context-Retrieval (>128k Tokens) kritisch ist
- Sie auf Google 3.5 Pro warten wollen (angekündigt für Juni 2026, 2M-Token-Context)
Achtung: Google 3.5 Pro kommt im Juni 2026
Sundar Pichai kündigte bei der I/O-Keynote an: „Give us until next month to get it to you." Gemini 3.5 Pro bringt 2M-Token-Context (doppelt so viel wie Flash), Deep Think Reasoning und stärkere Long-Context-Retrieval. Wenn Ihr MVP auf grosse Dokumenten-Analysen setzt, lohnt sich eventuell Abwarten.
Preisvergleich: Was kostet ein Startup-MVP mit Gemini 3.5 Flash?
Schweizer Startups sollten die Total Cost of Ownership pro Task-Typ rechnen, nicht nur die Token-Preise vergleichen. Hier die wichtigsten Anbieter im Vergleich (Stand Juni 2026):
| Anbieter | Modell | Input (CHF/M) | Output (CHF/M) | Context | Best for |
|---|---|---|---|---|---|
| Gemini 3.5 Flash | 1.35 | 8.10 | 1M | Agent-Tasks, Coding, Multimodal | |
| Gemini 3.1 Pro | 2.25 | 13.50 | 2M | Wissens-Tasks, lange Dokumente | |
| Anthropic | Claude Opus 4.7 | 4.50 | 22.50 | 200k | Reasoning, Qualität über alles |
| OpenAI | GPT-5.5 Instant | ~3.60 | ~10.80 | 128k | General Purpose, breites Tooling |
Rechenbeispiel: MVP mit 100k Agent-Calls pro Monat
Annahme: 1’500 Input-Tokens + 500 Output-Tokens pro Call
- Gemini 3.5 Flash: (100’000 × 1’500 / 1M × CHF 1.35) + (100’000 × 500 / 1M × CHF 8.10) = CHF 607.50/Monat
- Claude Opus 4.7: (100’000 × 1’500 / 1M × CHF 4.50) + (100’000 × 500 / 1M × CHF 22.50) = CHF 1’800/Monat
- Einsparung mit Flash: CHF 1’192.50/Monat (ca. CHF 14’300/Jahr)
Für Seed-Stage-Startups, die ein AI-gestütztes MVP bauen, ist das der Unterschied zwischen 3 und 8 Monaten Runway bei gleicher Funktionalität.
Unsere Empfehlung für Schweizer Startups
Wechseln Sie auf Gemini 3.5 Flash, wenn Coding und Agent-Tasks dominieren. Warten Sie auf 3.5 Pro (Juni 2026), wenn Long-Context-Retrieval oder Deep Think zentral sind. Bleiben Sie bei Claude/GPT, wenn höchste Reasoning-Qualität wichtiger ist als Kosten.
Praktische Entscheidungshilfe: Welches Modell für welchen Startup-Use-Case?
| Use Case | Empfohlenes Modell | Warum |
|---|---|---|
| Code-Generierung (React, Python, APIs) | Gemini 3.5 Flash | Terminal-Bench 76,2 %, 4x schneller, CHF 1.35/M |
| Agent-Workflows (MCP, Tools, Browser) | Gemini 3.5 Flash | MCP Atlas 83,6 %, beste Tool-Use im Juni 2026 |
| Multimodale Analyse (Bild + Text) | Gemini 3.5 Flash | CharXiv 84,2 %, natives Multimodal-Verständnis |
| Long-Context (>500k Tokens) | Gemini 3.1 Pro | 2M Context, bessere Retrieval bei langen Docs |
| Höchste Reasoning-Qualität | Claude Opus 4.7 | Frontier-Model, dafür 2,7x teurer |
Für die meisten Schweizer Seed-Stage-Startups ist Gemini 3.5 Flash ab Juni 2026 die wirtschaftlichste Wahl — wenn der Use-Case Agent- oder Coding-lastig ist. Für Reasoning-Heavy-MVPs (z. B. Rechtsberatung, Medical Diagnostics, komplexe Finanzanalyse) bleibt Claude Opus 4.7 oder GPT-5.5 die bessere Wahl, trotz höherer Kosten.
Was ändert sich bei der Migration von Flash 3.x auf 3.5?
Wenn Sie aktuell Gemini 3 Flash oder 3.1 Pro im Stack haben, läuft die Migration meist in einer Stunde. Google hat die SDKs kompatibel gehalten, Sie ändern nur den Model-String von gemini-3.1-pro-preview auf gemini-3.5-flash.
Drei Punkte, die Startups beachten sollten:
- Context Caching bleibt gleich — wenn Sie grosse System-Prompts cachen, funktioniert das weiter
- Thinking Config (Reasoning-Modi) sind identisch zwischen Flash und Pro → einfaches A/B-Testing
- Rate Limits ändern sich nicht — Flash bleibt bei den Standard-Limits (60 Requests/Minute für Pay-as-you-go)
Gemini 3.5 Pro kommt im Juni — was Startups jetzt tun sollten
Google hat Gemini 3.5 Pro für Juni 2026 angekündigt. Pro bringt 2M-Token-Context (doppelt so viel wie Flash), Deep Think Reasoning und bessere Long-Context-Retrieval. Sundar Pichai sagte bei I/O: „It’s already being used internally, and we look forward to rolling it out next month.”
Strategie für Schweizer Startups:
- Heute auf 3.5 Flash wechseln, wenn Coding/Agents zentral sind
- Pro-Model-Card abwarten (kommt vermutlich Mitte Juni als Google-Blog-Post)
- A/B-Testing einbauen: Flash für Speed, Pro für Quality — dann per Task-Typ routen
- Budget-Puffer einplanen: Pro wird teurer als Flash, vermutlich CHF 3–4 Input / CHF 15–18 Output
Fazit: Flash ist kein „Budget-Modell” mehr — sondern das neue Standardmodell
Googles Strategie ist klar: Gemini 3.5 Flash soll die Mitte des Marktes erobern — stark genug für produktive Agent-Workflows, schnell genug für Echtzeit-Apps, günstig genug für Startups. Die Preiserhöhung (3x vs. Gemini 3 Flash) ist Google’s Signal: „Flash ist jetzt das Hauptmodell, nicht die Spar-Option.”
Für Schweizer Startups, die ein AI-gestütztes MVP oder eine investor-ready Website bauen, lohnt sich die Migration — aber nur, wenn Sie vorher die Task-Verteilung analysieren. Wenn 70 % Ihrer API-Calls Code-Generierung oder Agent-Workflows sind, spart 3.5 Flash Geld. Wenn 70 % Reasoning-Heavy-Tasks sind, bleibt Claude oder GPT die bessere Wahl.
Drei konkrete Schritte für Juni 2026:
- API-Logs der letzten 30 Tage analysieren — Task-Typ, Token-Verbrauch, Fehlerrate
- A/B-Test mit 10 % Traffic auf 3.5 Flash — Qualität + Latenz + Kosten messen
- Budget-Szenario für 3.5 Pro rechnen — kommt im Juni, wird teurer, aber stärker
Google hat mit Gemini 3.5 Flash ein Modell gebaut, das für viele Schweizer Startups die wirtschaftlichste Wahl ist — wenn man weiss, wofür man es einsetzt. Die nächsten vier Wochen (bis 3.5 Pro landet) sind die richtige Zeit, um das herauszufinden.
(Quellen: Google I/O 2026 Keynote 19. Mai 2026, Gemini 3.5 Flash Model Card Google DeepMind 1. Juni 2026, TechCrunch 19. Mai 2026, Gemini API Changelog Juni 2026)