Gemini gibt dir Podcast-Style-Zusammenfassungen deiner Dokumente
Mit Canvas und Audio Overview kannst du dank Gemini deine Dokumente auf ganz neue Art und Weise nutzen und bearbeiten – und Code ebenfalls. Eine Audiozusammenfassung von Dokumenten oder per Prompt geschriebene Vorträge sind nur zwei Optionen.

Schon wieder gibt es ein großes Gemini Update von Google. Erst kürzlich stellte das Unternehmen Gemini 2.0 Robotics und Gemini 2.0 Flash Experimental Features wie die Native Image Generation vor. Dazu kamen neue smarte Funktionen, die zum Beispiel deine KI-Suche anhand der Suchhistorie personalisieren oder die AI-Assistenz durch Gems auf den neuesten Stand bringt. Jetzt liefert Google Canvas und Audio Overviews, die deine Dokumentbearbeitung mit KI Support optimieren. Damit kannst du ganz alltägliche Aufgaben im Handumdrehen lösen und Dokumente in neuer Form rezipieren – zum Beispiel als Podcast.
Gemini denkt mit:
So werden Googles smarte Features zur persönlichen Assistenz

So funktionieren die Audio Overviews von Google Gemini
Gemini 2.0 ist laut Google das „beste KI-Modell“ der Welt. Dem würden OpenAI, Meta und Co. womöglich widersprechen. Doch eine Fülle an Nutzungsszenarien für die vielen Google Gemini User bietet das Unternehmen allemal. Die neuesten Lösungen stellt der Senior Director für das Product Management der Gemini App, Dave Citron, auf dem Google Blog The Keyword vor.
Auf Threads ansehen
Dabei handelt es sich um Canvas und die Audio Overviews. Vor allem das letztere Feature dürfte vielen Usern gut zupasskommen. Zuvor schon in NotebookLLM verfügbar, ist es jetzt für Gemini eingeführt worden. Mit Audio Overviews können die Nutzer:innen Dokumente, Slides und sogar Reports von Geminis Deep Research Feature in Audioformate, quasi Podcasts, umwandeln. Zwei AI Hosts diskutieren darin dann die Ergebnisse oder Erkenntnisse. Sie fassen zusammen und ziehen Parallelen, ähnlich wie in Podcasts mit zwei Hosts.
Das Feature wird global für Gemini und Gemini Advanced Subscriber ausgerollt, zunächst nur auf Englisch. Bald sollen weitere Sprachen folgen. Wer Dokumente hochlädt und dann über den Vorschlagsbereich – im Web oder in der Gemini App – eine Audio Overview erstellt, kann diese auch herunterladen oder direkt teilen. Auf dieses neue Feature verweist der Google CEO Sundar Pichai auf Threads ebenso wie auf Canvas.
Auf Threads ansehen
Canvas zur Dokumentbearbeitung und zum noch einfacheren Coding verwenden
Canvas is a new interactive space within Gemini designed to make creating, refining and sharing your work easy,
erklärt Dave Citron. So können User diesen Bereich in ihrer Prompt Bar nutzen, um Dokumente oder Code zu kreieren oder zu bearbeiten. So lassen sich beispielsweise Drafts für benötigte Inhalte erstellen. Du brauchst noch eine Vorlage für deinen nächsten Vortrag mit einer bestimmten Länge? Gemini kann via Canvas eine Vorlage erstellen, die du dann anhand der Tipps der KI noch bearbeiten kannst. Länge, Tonalität und andere Faktoren können Nutzer:innen anpassen. Auch Essays, Pressemitteilungen, Blog Posts und andere Inhalte können so ganz einfach den nötigen Feinschliff erhalten. Die Dokumente können dann direkt zu Google Docs exportiert werden.
Außerdem können Entwickler:innen oder auch jene, die keine großen Vorkenntnisse haben, mit Canvas Coding Content direkt in Prototypen für Apps, Web Apps, Python-Skripte, Games und Co. übertragen. Code-Erklärungen, Code-Generierung und das Debugging von Code gehören zu den Optionen, die Canvas bietet. Du kannst zudem TML/React Codes und andere Prototypen direkt in einer visuellen Preview prüfen. Und wenn du den passenden HTML Code noch nicht zur Hand hast, kannst du Gemini um die Generierung bitten. Für Veränderungen kann die KI ebenfalls Hinweise geben. So soll Canvas den gesamten Coding-Prozess erleichtern. Das Feature wird für Gemini und Gemini Advanced Subscriber weltweit und in allen in der Gemini App verfügbaren Sprachen ausgerollt. In der Prompt Bar ist es direkt zu testen.
Dabei erinnert Googles Canvas für Gemini an die gleichnamige Option von OpenAI, die automatischen Coding und Writing Support parallel zu ChatGPT bietet und jetzt frei verfügbar ist.
t3n Skills x Digital Bash
Webinar: KI
