Google I/O 2024: Gemini-æraen i søk - AI vil lage tegninger, videoer og musikk, og advare mot telefonsvindlere

Av: Viktor Tsyrfa | 15.05.2024, 10:21

På den pågående Google I/O-konferansen demonstrerte søkegiganten at de ikke har tenkt å gi fra seg lederskapet i innføringen av kunstig intelligens. AI vil bli tettere integrert i Google Foto, Google Camera, Gmail, søk og andre apper, og Gemini vil bli den primære personlige assistenten som man kan kommunisere med via tekst, stemme og kamera.

Google I/O 2024: høydepunkter

Gemini vil nå bli den ledende assistenten i Android. Ingen ord om skjebnen til Google Assistant, men vi kjenner alle Googles vaner.
Bildegenerering - ifølge den detaljerte beskrivelsen vil Gemini lage bilder av til og med ikke-eksisterende objekter. Du kan også lage vakre bildetekster.
Videogenerering etter beskrivelse. Videoen kan utvides til ønsket varighet. Et veldig lovende verktøy for bloggere for å få gratis videoinnslag med tema.
Music AI Sandbox - et verktøy for å generere et musikkeksempel ved hjelp av tekstbeskrivelse eller behandle lydsporet.
Google Foto vil nå analysere den fulle konteksten til bilder. Det vil ikke bare være mulig å søke i bilder etter beskrivelsen av hva som er tatt på dem, men også å gjøre tematiske valg, for eksempel fremgang fra treningsøkter i løpet av året osv.
API Gemini 1.5 Pro er en språkmodell som vil gi 1 million tokens for å behandle spørsmål, huske samtalehistorikk og ta hensyn til den største konteksten blant konkurrentene. Antallet tilgjengelige tokens vil bli doblet i løpet av sommeren. Gemini 1.5 Flash - Rask AI-API for resultater i nær sanntid.
AI for læring vil systematisere og forklare læringsmateriale, inkludert eksempler fra hverdagen.
Circle to search - brikken som ble kunngjort i Galaxy S24 Ultra, som deretter fant veien til Google Pixel, vil snart vises på alle Android smarttelefoner. Som en påminnelse er det nok å sirkle rundt et objekt på skjermen for at Google skal bestemme hva som er avbildet der og starte et søk etter det objektet.
Dyp kontekstanalyse. Hvis du for eksempel ber Gemini om å organisere en tur, vil den ikke bare kjøpe en billett, men vil også foreslå et sted å bo og sjekke værmeldingen. Eller når du bestiller sko, vil den kunne justere størrelsen din ut fra Gmail-korrespondansen din.
Gemini kan spørres ikke bare med tekst eller stemme, men også med kamera. I demonstrasjonsvideoen forklarte Gemini hva objektet i rammen gjorde, analyserer programvarekode på farten og forklarer hva den gjør, løser gåter, husker hvor objektet som ble sett i rammen før var.
Gemini-æraen for søk. Ikke bare vil søk umiddelbart produsere AI-genererte utdrag og svar, søk vil nå også kunne lage planer og oppgaver. Du vil kunne legge inn komplekse spørsmål, og Gemini vil da plotte en rute, sjekke et etablissements rangering eller lage en meny for uken hvis det er nødvendig, og umiddelbart lage en liste over kjøp og steder å gjøre dem.
Gmail vil nå gi en oversikt over e-poster, og det vil være mulig å kombinere flere e-poster og gjøre en oversikt over e-poster sammen. AI vil også kunne svare alle avsenderne av disse e-postene, legge til oppgaver i kalenderen din eller til og med lage en Google Sheets-tabell over alle lignende tilbud som har kommet i posten.
Når det gjelder teamarbeid, analyserer Gemini alle jobbchattene dine, søker og analyserer informasjon i dem og svarer til de riktige kollegene, selv om du ikke vet hvilken chat den aktuelle diskusjonen foregår i.
Gemini kan få tilsendt en PDF-fil på opptil 1500 sider for analyse og be om en kort oversettelse. Eller en video på opptil 1 time, og Gemini vil analysere alle fragmentene og om nødvendig vise nøyaktig det segmentet brukeren trenger.
Gemini kan bli spurt om hvorfor en bestemt mekanisme ikke fungerer, for eksempel en DJ-pult eller et kamera, og den kunstige intelligensen vil gi et svar på hvordan det kan fikses. For å gjøre dette gjenkjenner den kunstige intelligensen mekanismen i bildet, dens modell og handlingen brukeren prøver å utføre, bruker disse dataene til å gjøre et søk, analyserer dem og trekker ut nøyaktig den nødvendige informasjonen.
AI for programmerere genererer kode i henhold til beskrivelsen av oppgaven, oppretter en database med bilder av objekter og søker etter feil.
Beskyttelse mot falske samtaler. AI analyserer samtalene dine i sanntid, og hvis samtalepartneren oppfører seg mistenkelig, for eksempel ber om bankopplysningene dine, vil den produsere et lydsignal og en advarsel om mulig svindel.
Den kunstige intelligensen vil støtte 35 språk og vil ha det største kontekstuelle vinduet av alle konkurrentene.

I år svarte Sundar Pichai på humoren rundt fjorårets Google I/O-presentasjon og kom umiddelbart med statistikken om at akronymet "AI" ble ytret 120 ganger i løpet av den nesten to timer lange presentasjonen. Og så én gang til.

Kilde: Google I/O

Google I/O Kunngjøringer