CTA - Eine Initiative der Österreich Werbung
google_io.png©Roman Egger

artikel

16. Mai 2024

Latest News von der Google I/O Konferenz

Künstliche Intelligenz

Digitalisierung

Entdecke die neuesten Durchbrüche in der KI-Technologie, vorgestellt auf der Google I/O: Google Gemini transformiert Deine Interaktion mit digitalen Medien durch erweiterte Multimodalität und intelligente Assistenten. Erfahre mehr über die Zukunft der Google KI Technologien.

Google I/O – Heuer ganz im Zeichen der KI

Nach der Präsentation von OpenAI diesen Montag geht es Schlag auf Schlag. Bei der diesjährigen Entwicklerkonferenz von Google (I/O) am Dienstag, war der Fokus ebenfalls klar auf KI gelegt und ich möchte heute einen kurzen Überblick über die unterschiedlichen KI-Entwicklungen von Google geben.

Googles neueste KI-Technologie wurde in alle zwei Milliarden!! Nutzerprodukte von Google integriert und ist nun auch in der Version Gemini 1.5 Pro über Workspace Labs verfügbar (mehr dazu am Ende des Beitags).

Multimodale KI-Intelligenz und erweiterte Kontextverarbeitung

Gemini zeichnet sich, wie eigentlich auch alle anderen neuen Sprachmodelle, durch seine multimodale Fähigkeit aus, die es ermöglicht, gleichzeitig Text, Bild und Ton zu verarbeiten und zu verstehen. Dies ermöglicht eine tiefere und nuanciertere Interaktion mit digitalen Inhalten. Die aktuelle Version, Gemini 1.5 Pro, erweitert das Kontextfenster auf beeindruckende zwei Millionen Tokens. Das Kontextfenster des am Montag von OpenAI vorgestellten GPT-4o liegt noch bei 128k Tokens und ist somit um ein vielfaches kleiner. Diese technologische Fortentwicklung erlaubt es Gemini, umfangreiche Datenmengen wie lange Dokumente oder umfangreiche E-Mail-Korrespondenzen zu verarbeiten und daraus relevante Informationen zu extrahieren.

Ein weiteres Highlight ist die Einführung von Gemini 1.5 Flash, einer schlankeren Version des Modells, die sich durch schnelle Reaktionszeiten und Kosteneffizienz auszeichnet. Diese Version ist besonders geeignet für den Einsatz in großem Maßstab, ohne dabei die Fähigkeiten im multimodalen Reasoning zu beeinträchtigen.

Neue Wege in der Suche und Verarbeitung digitaler Inhalte

Gemini revolutioniert auch die Art und Weise, wie Nutzer mit digitalen Inhalten interagieren. Durch das neue Feature Ask Photos kann beispielsweise eine tiefere und kontextbezogene Suche in Fotogalerien durchgeführt werden. Nutzer können spezifische Anfragen stellen, wie die Entwicklung bestimmter Fähigkeiten oder Ereignisse in Bildern zu sehen, und erhalten eine zusammengefasste Darstellung der relevanten Bilder und Informationen. In dem Beispiel unten wurde nach Nationalparks gefragt, die man in der Vergangenheit besucht hat. Ask Photos, erkennt alle Nationalparkfotos und filtert diese gezielt heraus.

1715849423723.png

Für Geschäftsanwendungen bietet Gemini jetzt die Möglichkeit, Anfragen direkt in das Suchfeld einzugeben und schnell Antworten zu erhalten, die beispielsweise Angebote nach Preis und Verfügbarkeit vergleichen. Diese Funktion ist ein Beispiel dafür, wie KI die Effizienz in der Verwaltung von Geschäftsprozessen steigern kann. Dies könnte für den Tourismus ein spannender Anwendungsfall werden, den es weiter zu beobachten gilt

Generative Video- und Suchtechnologie

Ein weiteres beeindruckendes Feature ist das neue generative Videomodell Veo, das hochauflösende Videos aus Text-, Bild- oder Videovorgaben erstellen kann. Diese Technologie eröffnet neue Möglichkeiten für Content-Erstellung und -Bearbeitung, indem sie Benutzereingaben in detaillierte visuelle Darstellungen umwandelt.

;

Zudem hat Google seine Suchtechnologie weiterentwickelt, um komplexe Anfragen schneller und effizienter zu bearbeiten. Die so genannten AI Overviews ermöglichen es, umfangreiche Fragen und ihre Unterfragen in Sekundenschnelle zu beantworten.

KI-Agenten und personalisierte Assistenten

Ein zukunftsweisender Aspekt von Gemini sind die AI Agents, intelligente Systeme, die nicht nur auf Anweisungen reagieren, sondern auch eigenständig planen, erinnern und mehrschrittige Aufgaben ausführen können. Die Entwicklung von Project Astra zielt darauf ab, einen universellen KI-Agenten zu schaffen, der im täglichen Leben wirklich hilfreich ist.

;

Wie kann man Gemini im Workspace nutzen?

Eine schrittweise Anleitung zur Nutzung von Gemini in Google Workspace

1. Aktivierung von Gemini: Nutzer müssen Gemini zunächst in ihren Google Workspace-Einstellungen aktivieren. Dies geschieht durch den Zugriff auf Workspace Labs und das Auswählen von Gemini 1.5 Pro.

1715849423728.png

2. Verwendung von Ask Photos: Nach der Aktivierung kann der Nutzer die verbesserte Suchfunktion in Google Fotos nutzen, indem er spezifische Anfragen stellt, zum Beispiel nach der Entwicklung bestimmter Fähigkeiten oder Ereignisse in Bildern.

3. Einsatz von AI Overviews: Bei komplexen Suchanfragen können Nutzer die gesamte Frage mit allen Teilfragen in das Suchfeld eingeben. Gemini analysiert die Anfrage und liefert eine umfassende Übersicht als Antwort. Durch die Integration von Gemini in den täglichen Workflow können Nutzer eine erhebliche Steigerung der Effizienz und eine Verbesserung der Informationsbeschaffung erleben.

4. Generative Videos erstellen: Nutzer, die an der Erstellung von Inhalten interessiert sind, können das Veo-Modell nutzen, um aus einfachen Textbeschreibungen hochwertige Videos zu generieren. Dies wird in den Einstellungen unter dem Reiter für generative Tools eingestellt.

5. Anpassung von Gemini für persönliche Bedürfnisse: Eine der innovativsten Funktionen ist die Möglichkeit, individuelle Expertensysteme, sogenannte Gems, zu erstellen. Nutzer können spezifische Anweisungen oder Informationen eingeben, die sie regelmäßig benötigen, und Gemini erstellt daraufhin ein personalisiertes Modell, das diese Anforderungen erfüllt.

6. Integration von Gemini in mobile Anwendungen: Für Nutzer, die häufig unterwegs sind, bietet die mobile Version von Gemini eine nahtlose Integration. Fragen können direkt in das Suchfeld der App eingegeben werden, was den Informationszugriff erheblich vereinfacht.

7. Erweiterte Nutzung von AI Agents: Für komplexe Aufgabenstellungen können die AI Agents aktiviert werden, um mehrschrittige Prozesse zu planen und durchzuführen. Dies ist besonders nützlich in Szenarien, wo vorausschauende Logistik und Entscheidungsfindung gefragt sind, wie etwa bei der Planung einer Geschäftsreise oder der Organisation von Events.

Durch die kontinuierliche Weiterentwicklung und Verbesserung seiner KI-Technologien zeigt Google, wie die Einbindung intelligenter Systeme in alltägliche Anwendungen nicht nur die Nutzererfahrung verbessern, sondern auch neue Möglichkeiten in der digitalen Interaktion und Content-Erstellung eröffnen kann.

Ich werde diese Entwicklungen weiter im Auge behalten und testen um demnächst mehr darüber berichten zu können.

Weiterlesen?

Einfach registrieren

Jetzt kostenfrei registrieren, um diesen und weitere spannende Inhalte zu lesen.

Das Passwort muss aus mindestens 8 Zeichen bestehen, einem Großbuchstaben, einem Kleinbuchstaben, einer Zahl und einem Sonderzeichen.

Du hast schon einen Account?

Anmelden

Mit der Registrierung stimme ich zu, dass ich die Nutzungsbedingungen und die Datenschutzrichtilinien gelesen und akzeptiert habe.

Ähnliches

Das könnte dir auch gefallen

Achtung: Ungespeicherte Änderungen

Bitte sichere deinen Beitrag als Entwurf, da ungespeicherte Änderungen nicht wiederhergestellt werden können, wenn du die Seite verlässt.