Künstliche Intelligenz
13.06.2024, 10:11 Uhr
Google setzt neue Massstäbe in der KI
Gemini kann nun mit bis zu zwei Millionen Token umgehen. Das entspricht bis zu 120 Minuten Video.
(Quelle: EMGenie)
Im November 2022 hat OpenAI ChatGPT veröffentlicht. Dies führte nicht nur zum Siegeszug der KI für jedermann, sondern auch zu massiven Umstrukturierungen bei Google. Der Suchmaschinen-Spezialist sah sich einer massiven Bedrohung seines Geschäftsmodells ausgesetzt.
In Folge startete Google die Gemini-Ära: Die Entwicklung von grossen Sprachmodellen (LLMs) und spezialisierten kleinen Sprachmodellen (Small Language Models), die auf dem Endgerät wie Smartphones laufen können und keine Verbindung zum Internet benötigen.
Gemini ist multimodal, kann also mit Text, Bildern, Sound und Videos umgehen und mehrsprachig. Besonders bemerkenswert ist, dass das Gemini 1.5 Pro-Modell bis zu zwei Millionen Tokens verarbeiten kann, was die Bearbeitung umfangreicher Dokumente und bis zu 120 Minuten langer Videos ermöglicht. So lässt sich nach dem Laden eines Videos zum Beispiel fragen: "Wann kommt der rote Ball ins Bild?". Gemini gibt dann die Sekunde an, wo der Ball auftaucht.
Enterprise-Ready Funktionen
Google hat grosse Anstrengungen unternommen, um sicherzustellen, dass Gemini nicht nur leistungsstark, sondern auch zuverlässig und sicher für den geschäftlichen Einsatz ist. Beispielsweise hat Google die Gemini-Modelle in seine Cloud-Dienste integriert, was es Unternehmen ermöglicht, die fortschrittlichen KI-Fähigkeiten direkt in ihre Arbeitsabläufe einzubinden. Dabei werden die Daten nur verschlüsselt übertragen.
Ein weiterer Punkt ist die Echtzeit-Fähigkeit: Für Visual Inspection etwa von produzierten Bauteilen oder Lebensmitteln muss das LLM in der Lage sein, extrem schnell zu arbeiten. Auch das soll Gemini leisten können.
Darüber hinaus bietet Gemini durch Hyperpersonalisierung die höchstmögliche Individualisierung, indem es spezifische Bedürfnisse und Vorlieben der Nutzer erkennt und darauf reagiert.
Integration und Zusammenarbeit
Google hat zudem bekannt gegeben, dass seine Cloud-Plattform nun auch Modelle anderer Hersteller unterstützt. Dies fördert eine offene und kollaborative Umgebung, in der verschiedene KI-Modelle gemeinsam genutzt und integriert werden können, um die bestmöglichen Lösungen zu erzielen. Zu den Partnern zählen führende KI-Unternehmen wie Mistral, Douglas, Bosch und Anthropic.
Ein weiterer wichtiger Fortschritt von Gemini ist die Verringerung von Halluzinationen, also der Produktion von fehlerhaften oder ungenauen Antworten durch die KI. Dies wird durch fortschrittliche Techniken wie Grounding erreicht, die sicherstellen, dass die generierten Informationen auf verlässlichen Daten basieren. Darüber hinaus hat Gemini seine Fähigkeiten in logischem Denken und Argumentation verbessert.