Google enrichit Gemini : l’assistant IA peut désormais traiter des fichiers audio

Par L'équipe rédaction Neety

Publié le septembre 16, 2025

Google enrichit Gemini : l’assistant IA peut désormais traiter des fichiers audio

Google continue d’améliorer son assistant IA Gemini en ajoutant une fonctionnalité très attendue : la capacité d’importer et de traiter des fichiers audio. Cette nouvelle option élargit les capacités multimodales de Gemini, permettant une utilisation plus étendue pour les utilisateurs mobiles et web. Découvrez comment cette mise à jour pourrait transformer vos pratiques de transcription et d’analyse sonore.

À retenir : les 3 informations de l’article

  • Google a intégré la possibilité d’importer des fichiers audio dans son application Gemini, notamment les formats MP3, M4A et WAV.
  • Cette fonction est disponible sur Android, iOS et le web, et permet de transcrire et résumer le contenu audio.
  • Les utilisateurs peuvent importer jusqu’à dix fichiers par requête, avec des limites de durée en fonction des abonnements.

Une avancée vers la multimodalité avec l’importation audio

Gemini, l’assistant IA de Google, a été conçu dès le départ pour être multimodal, capable de manipuler du texte, des images, des vidéos et des sons. Avec l’ajout de l’importation de fichiers audio, Google comble une lacune majeure, rendant l’analyse d’enregistrements vocaux possible. Les utilisateurs peuvent désormais télécharger des fichiers audio courants tels que MP3, M4A et WAV pour les transcrire et en extraire les points essentiels.

Utilisation simplifiée et accessible sur plusieurs plateformes

La nouvelle fonctionnalité de Gemini est disponible sur Android, iOS et le web, rendant l’outil accessible à une large base d’utilisateurs. Pour importer un fichier, il suffit d’ouvrir l’application, de cliquer sur « + » et de sélectionner « Ajouter un fichier ». Gemini se charge ensuite de transcrire le contenu, d’identifier les locuteurs, et de générer un résumé ou un rapport détaillé selon les besoins.

Options et limitations selon l’abonnement

Les utilisateurs gratuits peuvent importer des fichiers audio jusqu’à dix minutes par fichier, tandis que les abonnés aux plans AI Pro ou Ultra bénéficient d’une capacité étendue jusqu’à trois heures par fichier. Cette flexibilité offre aux professionnels la possibilité de traiter des conférences ou des podcasts entiers. Chaque utilisateur peut envoyer jusqu’à dix fichiers par requête, ce qui permet de gérer efficacement de grands volumes d’enregistrements.

Google face à la concurrence du marché de la transcription

Le marché de la transcription automatique est déjà occupé par plusieurs solutions spécialisées, souvent payantes. Selon Grand View Research, ce secteur pesait plus de 1,6 milliard de dollars en 2023 et pourrait dépasser les 5 milliards d’ici 2030. L’entrée de Google avec Gemini pourrait intensifier la concurrence et éventuellement influencer les prix, rendant ces services plus accessibles à un plus grand nombre d’utilisateurs.

Google est une entreprise technologique américaine fondée en 1998 par Larry Page et Sergey Brin. Elle est connue pour son moteur de recherche, mais s’est diversifiée dans divers domaines technologiques, y compris l’intelligence artificielle, avec des produits et services tels que Google Assistant et Google Cloud. Gemini représente une avancée dans la stratégie de Google visant à intégrer l’IA dans ses offres pour améliorer l’efficacité et l’accessibilité des solutions numériques.

lrbeh