Google I/O 2024 : l'ère des Gémeaux dans la recherche - L'IA créera des dessins, des vidéos et de la musique, et mettra en garde contre les escrocs au téléphone
Par: Viktor Tsyrfa | 15.05.2024, 09:21
Lors de l'actuelle conférence Google I/O, le géant de la recherche a démontré qu'il n'avait pas l'intention de renoncer à sa position de leader dans l'introduction de l'intelligence artificielle. L'IA sera plus étroitement intégrée dans Google Photos, Google Camera, Gmail, la recherche et d'autres applications, et Gemini deviendra le principal assistant personnel avec lequel on pourra communiquer par le texte, la voix et l'appareil photo.
Google I/O 2024 : faits marquants
- Gemini deviendra l'assistant principal d'Android. Rien n'est dit sur le sort de Google Assistant, mais nous connaissons tous les habitudes de Google.
- Génération d'images - selon la description détaillée, Gemini créera des images d'objets même inexistants. Vous pouvez également créer de belles légendes.
- Génération de vidéos par description. La vidéo peut être prolongée jusqu'à la durée souhaitée. Un outil très prometteur pour les blogueurs afin d'obtenir des encarts vidéo thématiques gratuits.
- Music AI Sandbox - un outil pour générer un échantillon de musique à partir d'une description textuelle ou pour traiter la piste audio d'entrée.
- Google Photo analysera désormais le contexte complet des photos. Il sera possible non seulement de rechercher des images par la description de ce qui y est pris, mais aussi de faire des sélections thématiques, par exemple, les progrès des séances d'entraînement au cours de l'année, etc.
- API Gemini 1.5 Pro est un modèle de langage qui fournira 1 million de jetons pour traiter les requêtes, mémoriser l'historique des conversations et prendre en compte le contexte le plus large parmi les concurrents. Le nombre de jetons disponibles sera doublé au cours de l'été. Gemini 1.5 Flash - API d'IA rapide pour des résultats en temps quasi réel.
- L'IA pour l'apprentissage systématisera et expliquera le matériel d'apprentissage, y compris les exemples de la vie quotidienne.
- Circle to search - la puce annoncée dans le Galaxy S24 Ultra, qui a ensuite fait son entrée dans le Google Pixel, fera bientôt son apparition sur tous les smartphones Android. Pour rappel, il suffit d'entourer un objet à l'écran pour que Google détermine ce qui y est représenté exactement et lance une recherche sur cet objet.
- Analyse approfondie du contexte. Par exemple, si vous demandez à Gemini d'organiser un voyage, il ne se contentera pas d'acheter un billet, mais suggérera également un lieu d'hébergement et vérifiera les prévisions météorologiques. Ou encore, lorsque vous commandez des chaussures, il sera capable d'ajuster votre taille à partir de votre correspondance Gmail.
- Gemini peut être interrogé non seulement par texte ou par voix, mais aussi par caméra. Dans la vidéo de démonstration, Gemini explique ce que fait l'objet dans le cadre, analyse le code d'un logiciel à la volée et explique ce qu'il fait, résout des énigmes, se souvient de l'endroit où se trouvait l'objet vu précédemment dans le cadre.
- L'ère Gemini de la recherche. Non seulement la recherche produira immédiatement des extraits et des réponses générés par l'IA, mais elle sera désormais capable d'élaborer des plans et des tâches. Vous pourrez saisir des requêtes complexes, puis Gemini tracera un itinéraire, vérifiera l'évaluation d'un établissement ou créera un menu pour la semaine si nécessaire, en dressant immédiatement une liste des achats et des lieux où les effectuer.
- Gmail fournira désormais un relevé des courriels, et il sera possible de combiner plusieurs courriels et de faire un relevé des courriels ensemble. L'IA pourra également répondre à tous les expéditeurs de ces courriels, ajouter des tâches à votre calendrier ou même créer un tableau Google Sheets de toutes les offres similaires reçues par courrier.
- Pour le travail en équipe, Gemini analysera tous vos chats de travail, recherchera et analysera les informations qu'ils contiennent et répondra aux bons collègues, même si vous ne savez pas dans quel chat se déroule la bonne discussion.
- Il est possible d'envoyer à Gemini un fichier PDF pouvant contenir jusqu'à 1 500 pages à analyser et de demander une brève traduction. Ou encore une vidéo d'une heure maximum, dont Gemini analysera tous les fragments et, si nécessaire, montrera exactement le segment dont l'utilisateur a besoin.
- Il est possible de demander à Gemini pourquoi un certain mécanisme ne fonctionne pas, comme une console de DJ ou une caméra, et l'IA donnera une réponse sur la manière de le réparer. Pour ce faire, l'IA reconnaît le mécanisme dans le cadre, son modèle, l'action que l'utilisateur essaie de faire, utilise ces données pour effectuer une recherche, les analyse et en extrait exactement les informations nécessaires.
- L'IA pour les programmeurs générera du code en fonction de la description de la tâche, créera une base de données de photos d'objets et recherchera les erreurs.
- Protection contre les appels frauduleux. L'IA analysera vos conversations en temps réel, et si l'interlocuteur a un comportement suspect, par exemple s'il vous demande vos coordonnées bancaires, elle émettra un signal sonore et un avertissement concernant une éventuelle fraude.
- L'intelligence artificielle prendra en charge 35 langues et disposera de la plus grande fenêtre contextuelle de tous les concurrents.
Cette année, Sundar Pichai a répondu à l'humour suscité par la présentation de Google I/O de l'année dernière et a immédiatement fourni la statistique selon laquelle l'acronyme "AI" a été prononcé 120 fois au cours de la présentation de près de deux heures. Et encore une fois.
Source : Google I/O