Gemini 3.5 Pro verzögert: Was Schweizer Startups jetzt über Googles AI-Versprechen wissen müssen

| loaded.ch | 9 Min. Lesezeit
ki-agenten tech-schweiz startup webentwicklung
Teilen:

Am 19. Mai 2026 stand Sundar Pichai auf der Google I/O-Bühne und versprach: «Wir arbeiten hart an Gemini 3.5 Pro. Es wird bereits intern genutzt, und wir freuen uns darauf, es nächsten Monat zu lancieren.» Heute ist der 16. Juni, und das Modell ist nirgends zu sehen — kein Model Card, kein API-Endpoint, keine Benchmarks. Für Schweizer Startups, die gerade ihre AI-Architektur für MVPs oder Produktlaunches planen, ist die Botschaft klar: Warten auf Google ist keine Strategie. Wer heute baut, baut mit dem, was lieferbar ist — nicht mit dem, was versprochen wurde. App-Entwicklung und MVP-Builds erfordern Technologie-Entscheidungen, die halten, nicht Roadmaps, die rutschen.

19. Mai

I/O-Versprechen: «nächsten Monat»

16. Juni

Heute: noch kein Launch

51 %

Polymarket: Launch 30. Juni

Was Google am 19. Mai versprochen hat — und was Mitte Juni fehlt

Sundar Pichais «nächsten Monat»-Aussage war die einzige offizielle Timeline. Google lieferte Gemini 3.5 Flash am selben Tag — vollständig dokumentiert, API-ready, mit Benchmarks. Flash schlägt das letztjährige Gemini 3.1 Pro bei Terminal-Bench 2.1 (76,2 % vs. 70,3 %), MCP Atlas (83,6 % vs. 78,2 %) und Finance Agent v2 (57,9 % vs. 43,0 %). Das sind genau die Kategorien, die für agentic coding und Workflow-Automatisierung zählen — also für Startups, die AI-gestützte Produkte bauen.

Gemini 3.5 Pro dagegen: intern genutzt, öffentlich unsichtbar. Kein Datum, keine Preise, keine finale Benchmark-Tabelle. Die Tech-Community reagierte mit hörbarem Stöhnen, als Pichai die Verzögerung verkündete — dokumentiert in mehreren I/O-Berichten. Prediction-Markets wie Polymarket zeigen heute (16. Juni) eine 51-%-Wahrscheinlichkeit für einen Launch am 30. Juni und 20 % für gar keinen Juni-Release (Quelle: Polymarket, 15. Juni 2026).

Das Signal: Flash ist die Antwort, die Google heute liefern kann. Pro ist die Antwort, die Google liefern möchte — irgendwann.

💡 Schweizer Startups, die jetzt AI-Features für Investor-Demos oder Beta-Launches bauen, können sich 4–6 Wochen Wartezeit nicht leisten. Die richtige Frage ist nicht «Wann kommt Pro?», sondern «Was nutze ich heute, das in vier Wochen immer noch läuft?»

Wo Gemini 3.5 Flash stark ist — und wo die Pro-Lücke klafft

Google positioniert Flash als «strongest agentic and coding model yet» und die Benchmarks bestätigen das für bestimmte Kategorien. Terminal-Bench 2.1, GDPval-AA (1656 Elo) und MCP Atlas messen genau die Fähigkeiten, die AI-Agenten im Terminal, bei Tool-Calls und in Multi-Step-Workflows brauchen. Flash führt hier — vor Claude Opus 4.7 und GPT-5.5.

Aber: Flash fällt bei hartem Reasoning zurück. Auf ARC-AGI-2 (abstraktes Problemlösen) und Humanity’s Last Exam (frontier reasoning) liegt Flash hinter GPT-5.5 (84,6 % auf ARC-AGI-2) und vermutlich auch hinter Claude Opus 4.7. Google dokumentiert selbst, dass Flash «ungefähr zehn Punkte» hinter Pro bei Coding-Tasks liegt, die tiefere Problemanalyse erfordern (Quelle: Google Blog, 19. Mai 2026).

Die Lücke, die Pro füllen soll:

BenchmarkWas es misstFlash-Schwäche
ARC-AGI-2Abstraktes Pattern-MatchingGPT-5.5 führt mit 84,6 %
Humanity’s Last ExamFrontier-Reasoning (Mathe, Physik, Bio)Keine Flash-Zahlen publiziert
Long-Context-Recall (128k+)Informationsretrieval bei sehr langen Eingaben3.1 Pro führt mit 7,6 Punkten Vorsprung

Für Schweizer Startups bedeutet das: Wenn Ihr MVP komplexe, mehrstufige Analyse erfordert (z.B. Rechtsberatung, wissenschaftliche Datenauswertung, Deep-Code-Refactoring), ist Flash nicht das richtige Werkzeug — und Pro existiert noch nicht. In dem Fall sind Claude Opus 4.7 oder GPT-5.5 die produktionsreifen Alternativen.

Warum «Warten auf Pro» für Startups keine Option ist

Drei Gründe, warum wartende Startups verlieren:

1. Entwicklungszeit ist teurer als API-Kosten

Ein Schweizer Startup mit zwei Entwicklern kostet CHF 50’000–80’000 pro Monat (Gehalt + Sozialleistungen + Infrastruktur). Vier Wochen Wartezeit = CHF 16’000–26’000 verbrannte Kosten. Gemini 3.5 Flash kostet CHF 13.50 (Input) bis CHF 81 (Output) pro Million Tokens. Selbst wenn Pro doppelt so gut wäre — die eingesparte Entwicklerzeit rechtfertigt den Start mit Flash oder einem Konkurrenzmodell.

2. Vendor Lock-in ist das grössere Risiko als Modellwahl

Das grösste Architektur-Risiko ist nicht «haben wir das beste Modell gewählt?», sondern «können wir wechseln, wenn sich die Prioritäten verschieben?». Startups, die direkt gegen OpenAI- oder Google-APIs coden, binden sich an proprietäre Response-Formate, Tool-Call-Schemas und Prompt-Engineering-Patterns. Wenn Pro dann doch enttäuscht (oder teurer wird als erwartet), kostet der Wechsel Wochen Refactoring.

Architektur-Regel für Schweizer Startups

Bauen Sie mit Adapter-Mustern. Kapseln Sie LLM-Calls hinter einer eigenen Abstraktion, die Model-ID, Temperature und System-Prompts zentral verwaltet. Dann kostet der Wechsel von Gemini zu Claude oder GPT-5.5 eine Konfigurationsänderung, nicht ein Code-Rewrite. Das gilt für React Native Apps genauso wie für Next.js-Backends — schlechte Architektur heute kostet Sie sechs Monate später die Agilität.

3. Benchmarks ≠ Produktionsrealität

Googles interne Tests zeigen, dass Flash «ungefähr zehn Punkte» hinter Pro liegt. Aber: diese Zahl stammt aus synthetischen Benchmarks, nicht aus echten Startup-Workflows. Ein Schweizer Fintech-Startup, das Transaktionen klassifiziert, braucht schnelle Tool-Calls und hohe Throughput-Raten — genau Flashs Stärke. Ein Deep-Tech-Spin-off, das wissenschaftliche Paper analysiert, braucht lange Kontexte und abstraktes Reasoning — Pros versprochenes Terrain.

Die Entscheidung fällt nicht bei «Flash vs. Pro», sondern bei «Was muss mein Produkt heute können, und welches verfügbare Modell liefert das?»

Gemini 3.5 Flash vs. Claude Opus 4.7 vs. GPT-5.5: Die Schweizer Startup-Perspektive

Hier ist die Realität Mitte Juni 2026:

ModellVerfügbarkeitStärkeKosten (CHF/M Tokens, Input/Output)Für wen?
Gemini 3.5 Flash✅ GA seit 19. MaiAgentic coding, Tool-Calls, schnelle Antworten (4× Throughput)~13.50 / ~81Startups, die schnelle Agent-Loops brauchen (Chatbots, Workflow-Automation, MVP-Prototypen)
Gemini 3.5 Pro❌ «Juni», kein Datum(Versprochen) Frontier reasoning, 2M-Token-Kontext, Deep Think(Erwartet) ~45–135 / ~135–540Noch nicht wählbar
Claude Opus 4.7✅ GANuanciertes Reasoning, Long-Form-Writing, komplexe Code-Refactorings~45 / ~225Startups mit komplexen, mehrstufigen Anforderungen (Rechtsanalyse, wissenschaftliche Auswertung)
GPT-5.5 Instant✅ GAMultimodales Reasoning, breite Tool-Integration, schnell~9 / ~27Startups im OpenAI-Ecosystem (Cursor, GitHub Copilot, Azure-Infra)

Wenn Sie heute ein MVP bauen und weder Claude noch GPT im Einsatz haben: starten Sie mit Gemini 3.5 Flash für schnelle Iterationen und wechseln Sie zu Claude Opus 4.7, sobald Reasoning-Qualität wichtiger wird als Geschwindigkeit. Wenn Pro dann Ende Juni erscheint und überzeugt, wechseln Sie erneut — aber Sie haben vier Wochen Produktentwicklung gewonnen statt verloren.

Was die Verzögerung über Googles AI-Strategie verrät

Drei strukturelle Signale:

Flash zuerst, Pro später — historisch lancierte Google immer Pro vor Flash (Gemini 3 Pro am 18. November 2025, 3 Flash am 17. Dezember; 3.1 Pro am 19. Februar 2026, 3.1 Flash danach). Mit 3.5 kehrt Google die Reihenfolge um. Das deutet darauf hin, dass Flash das Modell ist, das Google jetzt skalieren kann, während Pro noch interne Qualitäts-Gates nicht besteht.

Polymarket sagt: 20 % Chance, dass Pro im Juni gar nicht kommt — Prediction-Markets aggregieren Informationen aus Hunderten von informierten Tradern. Eine 1-in-5-Chance für «kein Juni-Launch» ist bei einem expliziten CEO-Versprechen hoch. Das spiegelt die Erfahrung der Community: Frontier-Modelle rutschen oft (Quelle: Polymarket, 15. Juni 2026).

Gemini CLI wird am 18. Juni zu Antigravity CLI — Google migriert am 18. Juni die Developer-Tools weg von «Gemini CLI» zu «Antigravity CLI», einer breiteren Multi-Agent-Plattform. Das Timing deutet darauf hin, dass Google den Gemini-Brand weniger eng an einzelne Modell-Releases koppeln will — ein Zeichen dafür, dass die «Gemini 3.5 Pro as Hero Launch»-Story intern nicht mehr hält (Quelle: Google Developers Blog, Mai 2026).

So wählen Schweizer Startups ihren AI-Stack richtig

Fünf Entscheidungsregeln, die halten:

1. Vendor-Agnostik vor Vendor-Optimierung

Nutzen Sie Abstraktionsschichten (z.B. LiteLLM, LangChain mit austauschbaren Providern oder eigene Adapter). Direkte API-Integration spart heute zwei Stunden, kostet später zwei Wochen.

2. Messen Sie Ihre eigene Metrik

Terminal-Bench und ARC-AGI-2 messen, was Google und OpenAI messen wollen. Ihre Metrik ist: «Wie viele meiner User-Anfragen beantwortet das Modell korrekt im ersten Versuch?» Bauen Sie einen 50-Sample-Eval-Set aus echten Produktions-Prompts und testen Sie jedes Modell dagegen. Das schlägt jeden Benchmark.

3. Kosten pro erfolgreiche Antwort, nicht pro Token

Ein Modell, das CHF 0.10 pro Million Tokens kostet, aber 30 % Ihrer Anfragen falsch beantwortet, ist teurer als ein Modell für CHF 0.30, das 95 % korrekt trifft. Rechnen Sie «Cost per Successful Response», nicht «Cost per Token».

4. Shipping beats perfection

Ein MVP mit Gemini Flash, das nächste Woche live ist, schlägt ein MVP mit Gemini Pro, das in vier Wochen vielleicht perfekt ist. Startups sterben nicht an suboptimalen Modellwahlen — sie sterben an Untätigkeit.

5. Planen Sie Migrations-Fenster ein

Wenn Sie wissen, dass Pro (oder Claude Opus 5.0, oder GPT-6) in vier Wochen kommt, bauen Sie heute mit Flash oder GPT-5.5, aber reservieren Sie eine Woche in Ihrem Sprint-Plan für Model-Migration. Dann testen Sie Pro am Launch-Tag, vergleichen gegen Ihre Eval-Daten, und wechseln nur, wenn es messbar besser ist.

💡 Für Schweizer Startups, die jetzt AI-gestützte Apps entwickeln — egal ob React Native für Mobile, Next.js für Web oder Python-Backends — ist die Frage nicht «Gemini oder Claude?», sondern «Wie baue ich, dass ich nächsten Monat wechseln kann, ohne alles neu zu schreiben?» Die Antwort ist immer Architektur, nicht Modelwahl.

Gemini 3.5 Pro wird kommen — aber Ihr Launch wartet nicht darauf

Mitte Juni ist klar: Google hat Gemini 3.5 Pro nicht im Griff. Flash ist stark, aber lückenhaft. Claude Opus 4.7 und GPT-5.5 sind verfügbar, produktionsreif und dokumentiert. Für Schweizer Startups, die heute Investor-Demos, Beta-Launches oder MVP-Releases planen, ist die Konsequenz einfach: Wählen Sie das Modell, das heute liefert, bauen Sie vendor-agnostic, und testen Sie Pro, sobald es erscheint — nicht vorher.

Die Teams, die im Juli mit fertigen Produkten vor Investoren stehen, haben nicht auf Googles Versprechen gewartet. Sie haben mit dem gebaut, was funktioniert. Und wenn Pro dann doch überzeugt? Dann migrieren sie in einer Woche — weil sie von Anfang an dafür gebaut haben.

Benötigen Sie Unterstützung bei der Architektur-Entscheidung für Ihre AI-gestützte App oder Ihr MVP? App-Entwicklung Schweiz hilft Startups, die richtige Balance zwischen Speed-to-Market und technischer Zukunftssicherheit zu finden — ohne auf Vaporware zu warten.

Teilen:
Benjamin Wagner, Gründer von loaded.

Benjamin Wagner

Gründer & Lead Developer bei loaded. Baut ultraschnelle, KI-optimierte Websites für Schweizer KMU seit 2024. Entwickler von OpenHermit.

Mehr über Benjamin →

Kostenloses Strategiegespräch buchen.

30 Minuten — unverbindlich, kein Verkaufsgespräch. Wir analysieren Ihre Situation und zeigen, was möglich ist.

MoDiMiDoFrSaSo
Verfügbare Zeiten werden geladen...