Google I/O 2024: het Gemini-tijdperk in search - AI zal tekeningen, video's en muziek maken en waarschuwen voor telefoonoplichters
Via: Viktor Tsyrfa | 15.05.2024, 10:21
Tijdens de huidige Google I/O-conferentie liet de zoekgigant zien dat het niet van plan is om zijn leiderschap in de introductie van kunstmatige intelligentie op te geven. AI zal nauwer worden geïntegreerd in Google Foto's, Google Camera, Gmail, zoeken en andere apps en Gemini zal de primaire persoonlijke assistent worden waarmee kan worden gecommuniceerd via tekst, spraak en camera.
Google I/O 2024: hoogtepunten
- Gemini wordt nu de belangrijkste assistent in Android. Geen woord over het lot van Google Assistant, maar we kennen allemaal Google's gewoonten.
- Afbeeldingen maken - volgens de gedetailleerde beschrijving zal Gemini afbeeldingen maken van zelfs niet-bestaande objecten. Je kunt ook prachtige bijschriften maken.
- Video's genereren aan de hand van een beschrijving. Video kan worden uitgebreid tot de gewenste duur. Een veelbelovend hulpmiddel voor bloggers om gratis themavideo's te maken.
- Music AI Sandbox - een tool om aan de hand van een tekstbeschrijving een muzieksample te genereren of de ingevoerde audiotrack te verwerken.
- Google Photo zal nu de volledige context van foto's analyseren. Het zal niet alleen mogelijk zijn om foto's te doorzoeken aan de hand van de beschrijving van wat erop is genomen, maar ook om thematische selecties te maken, bijvoorbeeld voortgang van workouts gedurende het jaar, etc.
- API Gemini 1.5 Pro is een taalmodel dat 1 Mn tokens zal leveren om zoekopdrachten te verwerken, conversatiegeschiedenis te onthouden en rekening te houden met de grootste context onder concurrenten. Het aantal beschikbare tokens wordt in de zomer verdubbeld. Gemini 1.5 Flash - Snelle AI API voor bijna real-time resultaten.
- AI voor leren zal leerstof systematiseren en uitleggen, inclusief alledaagse voorbeelden.
- Circle to search - de chip die werd aangekondigd in de Galaxy S24 Ultra en vervolgens zijn weg vond naar de Google Pixel, zal binnenkort op alle Android-smartphones verschijnen. Ter herinnering: het is voldoende om een object op het scherm te omcirkelen zodat Google kan bepalen wat daar precies wordt afgebeeld en een zoekopdracht naar dat object kan starten.
- Diepe contextanalyse. Als je Gemini bijvoorbeeld vraagt om een reis te organiseren, zal het niet alleen een ticket kopen, maar ook een verblijfplaats voorstellen en het weerbericht controleren. Of als je schoenen bestelt, kan het je maat aanpassen op basis van je Gmail correspondentie.
- Gemini kan niet alleen via tekst of spraak worden aangesproken, maar ook via een camera. In de demonstratievideo legt Gemini uit wat het object in het frame aan het doen was, analyseert softwarecode on the fly en legt uit wat het doet, lost puzzels op, onthoudt waar het object dat eerder in het frame te zien was, zich bevond.
- Het Gemini-tijdperk van zoeken. Zoeken zal niet alleen onmiddellijk AI-gegenereerde fragmenten en antwoorden produceren, zoeken zal nu ook plannen en taken kunnen maken. Je zult in staat zijn om complexe zoekopdrachten in te voeren, en dan zal Gemini een route uitstippelen, de beoordeling van een etablissement controleren, of een menu voor de week samenstellen als dat nodig is, en meteen een lijst maken van aankopen en plaatsen om ze te doen.
- Gmail zal nu een overzicht van e-mails geven en het zal mogelijk zijn om meerdere e-mails te combineren en samen een overzicht van e-mails te maken. AI zal ook in staat zijn om alle afzenders van die e-mails te beantwoorden, taken aan je agenda toe te voegen of zelfs een Google Sheets-tabel te maken van alle soortgelijke aanbiedingen die in de mail zijn binnengekomen.
- Voor teamwerk zal Gemini al je chats analyseren, informatie zoeken en analyseren en de juiste collega's antwoorden, zelfs als je niet weet in welke chat de juiste discussie plaatsvindt.
- Je kunt Gemini een PDF-bestand tot 1500 pagina's laten analyseren en om een korte vertaling vragen. Of een video van maximaal 1 uur lang, en Gemini zal alle fragmenten analyseren en, indien nodig, precies dat segment tonen dat de gebruiker nodig heeft.
- Gemini kan worden gevraagd waarom een bepaald mechanisme niet werkt, zoals een DJ-console of een camera, en de AI zal een antwoord geven over hoe het te repareren. Om dit te doen herkent de AI het mechanisme in het frame, het model ervan en de actie die de gebruiker probeert uit te voeren, gebruikt deze gegevens om een zoekopdracht uit te voeren, analyseert deze en haalt er precies de benodigde informatie uit.
- AI voor programmeurs genereert code volgens de beschrijving van de taak, creëert een database met foto's van objecten en zoekt naar fouten.
- Bescherming tegen frauduleuze gesprekken. AI analyseert je gesprekken in realtime en als de gesprekspartner zich verdacht gedraagt en bijvoorbeeld om je bankgegevens vraagt, geeft hij een geluidssignaal en een waarschuwing over mogelijke fraude.
- De kunstmatige intelligentie zal 35 talen ondersteunen en het grootste contextuele venster van alle concurrenten hebben.
Dit jaar reageerde Sundar Pichai op de humor over de Google I/O-presentatie van vorig jaar en kwam meteen met de statistiek dat het acroniem "AI" 120 keer werd uitgesproken tijdens de bijna 2 uur durende presentatie. En daarna nog een keer.
Bron: Google I/O