エピソード

  • L'IA aujourd'hui épisode du 2025-04-11
    2025/04/11
    Bonjour et bienvenue dans le podcast de l'IA par l’IA qui vous permet de rester à la page ! Aujourd’hui : sécurité des protocoles, défis de l'IA générative, et innovations technologiques. C’est parti !Commençons par le Model Context Protocol, ou MCP, qui fait face à des défis de sécurité. Ce protocole, conçu pour permettre aux systèmes alimentés par des modèles de langage d'accéder à divers outils, est vulnérable aux attaques par injection de commandes. Des problèmes comme le "Rug Pull" et le "Tool Shadowing" permettent à des outils malveillants de détourner des clés API ou de redéfinir des appels à des serveurs de confiance. Les utilisateurs doivent être vigilants et les interfaces doivent alerter sur les changements dans les descriptions d'outils pour éviter ces pièges.Passons maintenant aux modèles d'IA générative. Bien qu'ils soient souvent utilisés pour des tâches simples, comme générer du code, ils peuvent manquer de profondeur et de compréhension. Par exemple, un modèle peut produire un code fonctionnel mais non optimal, en omettant des solutions plus élégantes comme l'utilisation de fonctions intégrées. Cela soulève des questions sur la qualité du code et l'impact à long terme sur les développeurs qui s'appuient sur ces outils.En parlant de grandes entreprises, Amazon a récemment cessé de prendre en charge le traitement local des voix sur ses appareils Echo, envoyant désormais tous les enregistrements audio à ses serveurs. Bien qu'Amazon assure ne pas conserver ces enregistrements, des précédents montrent que la confiance est fragile. Cela soulève des préoccupations sur la vie privée et le respect des lois comme le RGPD.Du côté de Google, une étude révèle une dégradation de la qualité des résultats de recherche, un phénomène attribué à l'augmentation de contenus générés par IA. Ces contenus de faible qualité exploitent les algorithmes de Google, rendant les recherches moins pertinentes. Certains suggèrent que Google pourrait volontairement réduire la qualité pour augmenter les revenus publicitaires.Enfin, arXiv, une plateforme de partage d'articles scientifiques, recrute des développeurs pour améliorer son site. arXiv joue un rôle clé dans la diffusion rapide des connaissances scientifiques, et l'intégration de nouvelles fonctionnalités pourrait renforcer cette mission.Voilà qui conclut notre épisode d’aujourd’hui. Merci de nous avoir rejoints, et n’oubliez pas de vous abonner pour ne manquer aucune de nos discussions passionnantes. À très bientôt dans L'IA Aujourd’hui !

    Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

    続きを読む 一部表示
    3 分
  • L'IA aujourd'hui épisode du 2025-04-10
    2025/04/10
    Bonjour et bienvenue dans le podcast de l'IA par l’IA qui vous permet de rester à la page ! Aujourd’hui : Google et l'IA générative, la compression des modèles d'IA, et les avancées en géospatial. C’est parti !Commençons par Google, qui a récemment rappelé aux éditeurs de sites web que la création massive de contenu via l'intelligence artificielle est considérée comme du spam, sauf si elle est originale et apporte une réelle valeur ajoutée. Pourtant, l'algorithme Discover de Google met en avant des sites générés par IA, dont certains diffusent des rumeurs et des fausses informations. Parmi les 3 500 sites identifiés, une quarantaine ont été promus par Discover, générant des revenus publicitaires conséquents. Ces pratiques vont à l'encontre des règles de Google, qui a commencé à pénaliser certains sites après un reportage de France 2. Environ 50 % des documents indexés par Google sont considérés comme du spam, ce qui soulève des critiques sur le respect de ses propres règles.Passons maintenant à Multiverse Computing, qui a annoncé la sortie de deux nouveaux modèles compressés par leur technologie CompactifAI : Llama 3.1-8B et Llama 3.3-70B. Ces modèles ont été compressés à 80 %, réduisant les paramètres de 60 % par rapport aux originaux. Cette compression permet une efficacité énergétique accrue de 84 %, une inférence 40 % plus rapide, et une réduction des coûts de 50 %, tout en maintenant une précision quasi intacte. CompactifAI utilise des réseaux de tenseurs inspirés par la physique quantique, permettant de réduire la taille des modèles jusqu'à 93 % avec une perte de précision minimale. Ces modèles sont déjà utilisés par de grandes banques et entreprises, et sont disponibles via API sur la plateforme CompactifAI.Enchaînons avec les modèles de langage de grande taille (LLM) et leur application dans les systèmes RAG, ou génération augmentée par récupération. Ces systèmes connectent les modèles à des sources d'information externes, augmentant leur fiabilité. Une comparaison entre LLaMA 4 Scout de Meta et GPT-4o d'OpenAI a montré des comportements distincts. LLaMA 4 génère des réponses même avec un contexte insuffisant, tandis que GPT-4o préfère ne pas répondre sans contexte pertinent. Cette différence souligne l'importance de l'ancrage factuel dans les systèmes RAG.Enfin, Google Research a introduit de nouveaux modèles de base géospatiaux dans le cadre du projet Geospatial Reasoning. Ces modèles utilisent l'IA générative pour résoudre des problèmes géospatiaux, utiles dans des domaines comme la santé publique et la résilience climatique. Les modèles, tels que le Population Dynamics Foundation Model, ont été testés par plus de deux cents organisations et seront étendus à d'autres pays. Google explore également comment l'IA générative peut réduire le coût et le temps nécessaires pour combiner les capacités géospatiales, avec des modèles comme Gemini capables de gérer des données complexes.Voilà qui conclut notre épisode d’aujourd’hui. Merci de nous avoir rejoints, et n’oubliez pas de vous abonner pour ne manquer aucune de nos discussions passionnantes. À très bientôt dans L'IA Aujourd’hui !

    Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

    続きを読む 一部表示
    4 分
  • L'IA aujourd'hui épisode du 2025-04-09
    2025/04/09
    Bonjour et bienvenue dans le podcast de l'IA par l’IA qui vous permet de rester à la page ! Aujourd’hui : les avancées de Llama 4, l'intégrité scientifique face à l'IA, les défis de la documentation générée par l'IA, et l'impact de l'IA sur l'évaluation par les pairs. C’est parti !Commençons par le modèle Llama 4 de Meta, qui marque une nouvelle étape dans le développement des modèles d'intelligence artificielle. Avec ses capacités multimodales, Llama 4 peut traiter des entrées textuelles et visuelles, bien qu'il ne génère que des sorties textuelles. Le modèle Behemoth, en cours de formation, impressionne par ses 2 trillions de paramètres, dont 288 milliards sont actifs. L'architecture Mixture-of-Experts (MoE) améliore l'efficacité, mais nécessite des ressources matérielles considérables, dépassant les capacités des GPU traditionnels. Les modèles comme Scout et Maverick se distinguent par leur capacité à traiter conjointement texte et image, bien que Maverick ait montré des performances variables sur certains benchmarks de codage.Passons maintenant à l'intégrité scientifique. L'Office français de l'intégrité scientifique (Ofis) organise un colloque le 15 avril 2025 pour discuter des enjeux liés à l'IA générative dans la recherche. L'IA générative, capable de créer du contenu original, soulève des questions sur l'élaboration de projets et la publication des résultats. L'Ofis a également publié la version française du Code de conduite européen pour l'intégrité en recherche, fournissant des lignes directrices pour des pratiques éthiques rigoureuses. Des webinaires et ateliers sont proposés pour renforcer les compétences des référents à l'intégrité scientifique.En parlant de documentation, les documents générés par l'IA posent des problèmes de qualité et de responsabilité. Souvent comparés à des fichiers README mal rédigés, ils manquent de vision stratégique et de contexte. Les LLMs peuvent inventer des informations, rendant difficile la détection d'erreurs. Bien que l'IA puisse assister les rédacteurs techniques, elle ne peut pas les remplacer, car la documentation nécessite une compréhension approfondie et une responsabilité que seules les personnes peuvent offrir.Enfin, l'évaluation par les pairs évolue avec l'IA. Des systèmes comme Paper-Wizard permettent une pré-évaluation rapide des manuscrits, en moins de dix minutes. Bien que cela offre rapidité et efficacité, des services traditionnels comme ceux d'American Journal Experts garantissent une expertise humaine approfondie. Le concept de "reviewed preprints" gagne en popularité, assurant une diffusion rapide des résultats tout en maintenant une qualité scientifique. L'IA dans le peer review doit être utilisée avec prudence pour préserver l'intégrité des publications.Voilà qui conclut notre épisode d’aujourd’hui. Merci de nous avoir rejoints, et n’oubliez pas de vous abonner pour ne manquer aucune de nos discussions passionnantes. À très bientôt dans L'IA Aujourd’hui !

    Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

    続きを読む 一部表示
    3 分
  • L'IA aujourd'hui épisode du 2025-04-08
    2025/04/08
    Bonjour et bienvenue dans le podcast de l'IA par l’IA qui vous permet de rester à la page ! Aujourd’hui : l'impact de l'IA sur l'éducation, les nouveaux modèles de Meta, et les outils de recherche approfondie. C’est parti !Commençons par l'éducation et l'IA. L'émergence de ChatGPT et l'essor de l'IA générative suscitent des débats sur leur rôle dans l'enseignement supérieur. Bien que certains experts voient l'IA comme une révolution éducative, d'autres soulignent les dangers de remplacer les enseignants humains. L'éducation ne se limite pas à transmettre des connaissances, elle est aussi sociale et interactive. Les enseignants servent de modèles et leur présence est cruciale pour l'apprentissage des compétences. Les universités devraient investir dans des classes plus petites et des enseignants passionnés plutôt que de se tourner vers des solutions IA douteuses. L'IA peut assister, mais ne doit pas remplacer l'humain dans l'éducation.Passons maintenant à Meta, qui a récemment dévoilé deux nouveaux modèles multimodaux : Llama 4 Scout et Llama 4 Maverick. Ces modèles, disponibles sur llama.com et Hugging Face, sont intégrés dans les produits Meta AI. Llama 4 Scout, avec ses 17 milliards de paramètres actifs, est conçu pour des tâches complexes comme la synthèse de documents. Il surpasse ses prédécesseurs et concurrents sur plusieurs benchmarks. Llama 4 Maverick, quant à lui, est destiné à des usages haut de gamme avec 128 experts et 400 milliards de paramètres au total. Il rivalise avec des modèles plus grands pour le raisonnement et le codage. Meta met l'accent sur l'ouverture pour stimuler l'innovation, et ces modèles sont publiés sous des conditions ouvertes.Enfin, intéressons-nous aux outils de recherche approfondie, une nouvelle génération d'IA capable de mener des investigations complètes sur des sujets complexes. Contrairement aux chatbots standards, ces outils parcourent diverses sources et adaptent leurs stratégies en temps réel pour fournir des rapports structurés et cités. Par exemple, pour planifier un voyage en Europe, un outil de recherche approfondie vérifierait les horaires de train, explorerait les forums de voyageurs et comparerait les coûts, offrant un itinéraire complet et détaillé. Ces outils montrent une autonomie en décomposant les tâches et en documentant leur raisonnement, ce qui les rend précieux pour la recherche professionnelle et académique.Voilà qui conclut notre épisode d’aujourd’hui. Merci de nous avoir rejoints, et n’oubliez pas de vous abonner pour ne manquer aucune de nos discussions passionnantes. À très bientôt dans L'IA Aujourd’hui !

    Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

    続きを読む 一部表示
    3 分
  • L'IA aujourd'hui épisode du 2025-04-07
    2025/04/07
    Bonjour et bienvenue dans le podcast de l'IA par l’IA qui vous permet de rester à la page ! Aujourd’hui : traitement des transcriptions vidéo avec des modèles de langage, défis de Wikimedia face aux robots de scraping, perspectives sur le marché des LLM, et innovations en interfaces cérébrales. C’est parti !Commençons par Federico Viticci, qui a récemment exploré l'utilisation de l'outil en ligne de commande LLM de Simon Willison pour traiter les transcriptions de vidéos YouTube sur macOS. Cet outil permet d'interagir avec des modèles de langage hébergés dans le cloud, comme Claude et Gemini, directement depuis le terminal. Viticci a créé un raccourci sur son Mac pour reformater les transcriptions de vidéos sans modifier le contenu original. Il a constaté que Claude suivait mieux les instructions détaillées, bien que l'API d'Anthropic puisse être coûteuse. En revanche, Gemini 2.5 Pro, gratuit pendant sa phase expérimentale, offre une grande fenêtre de contexte, idéale pour traiter de grandes quantités de texte. Cependant, Viticci a rencontré des limites de taux d'API et espère une disponibilité générale pour Gemini 2.5 Pro.Passons maintenant à Wikimedia, qui fait face à une augmentation exponentielle des requêtes automatisées pour son contenu, principalement alimentée par des robots de scraping. Depuis janvier 2024, la bande passante utilisée pour télécharger du contenu multimédia a augmenté de 50 %. Environ 65 % du trafic le plus coûteux provient de robots, ce qui impose une charge significative sur l'infrastructure de Wikimedia. Cette situation a été illustrée lors du décès de Jimmy Carter en décembre 2024, où sa page Wikipédia a enregistré plus de 2,8 millions de vues en une journée. La Fondation Wikimedia doit gérer ces pics de trafic tout en maintenant l'accès pour les utilisateurs humains.En parlant de l'avenir des modèles de langage, John-David Lovelock de Gartner Research prévoit une "extinction" des fournisseurs de LLM, estimant que le marché ne pourrait soutenir que trois grands acteurs. Il souligne que chaque dollar dépensé pour les LLM est retiré d'un autre budget, ce qui n'est pas favorable, étant donné que de nombreux projets d'IA échouent. Malgré cela, Lovelock reste optimiste quant à l'intégration de l'IA générative dans divers appareils et logiciels, bien que cela dépende de la volonté des entreprises d'écouter les exigences du marché.Enfin, une avancée en interfaces cérébrales permet de traduire les pensées en discours intelligible en temps quasi réel. Ce système repose sur un modèle d'IA qui décode l'activité électrique du cortex sensorimoteur du cerveau. Cette technologie pourrait transformer la communication pour les personnes atteintes de handicaps sévères, bien que des questions éthiques et de sécurité subsistent. Des chercheurs de l'université de Duke travaillent également sur des implants cérébraux capables de décoder les signaux cérébraux en paroles, ouvrant la voie à de nouvelles formes de communication.Voilà qui conclut notre épisode d’aujourd’hui. Merci de nous avoir rejoints, et n’oubliez pas de vous abonner pour ne manquer aucune de nos discussions passionnantes. À très bientôt dans L'IA Aujourd’hui !

    Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

    続きを読む 一部表示
    3 分
  • L'IA aujourd'hui épisode du 2025-04-06
    2025/04/06
    Bonjour et bienvenue dans le podcast de l'IA par l’IA qui vous permet de rester à la page ! Aujourd’hui : l'usage innovant des modèles de langage pour traiter des transcriptions, les prévisions sur le marché des LLM, et les avancées des outils de recherche approfondie. C’est parti !Commençons par Federico Viticci, qui a récemment exploré l'utilisation de l'outil en ligne de commande LLM de Simon Willison pour traiter les transcriptions de vidéos YouTube sur macOS. Cet outil permet d'interagir avec des modèles de langage de grande taille comme Claude et Gemini directement depuis le terminal. Viticci a créé un raccourci sur son Mac pour reformater les transcriptions et éliminer les tics verbaux. Bien que Claude suive mieux les instructions, l'API d'Anthropic peut être coûteuse. En revanche, Gemini 2.5 Pro, bien qu'expérimental, est gratuit et offre une grande fenêtre de contexte. Cependant, Viticci a rencontré des problèmes de surcharge avec l'API de Gemini. Il espère que Google annoncera bientôt la disponibilité générale et les tarifs pour Gemini 2.5 Pro, ce qui pourrait améliorer la stabilité pour ces tâches longues.Passons maintenant aux prévisions de Gartner sur le marché des modèles de langage de grande taille. John-David Lovelock, analyste distingué, prévoit une "extinction" des fournisseurs de LLM, estimant qu'il n'y a de place que pour trois grands acteurs. Il souligne que le soutien financier à OpenAI provient de capitaux à risque, souvent sans retour sur investissement clair. Lovelock reste cependant optimiste quant à l'avenir des IA génératives, prévoyant leur intégration dans tous les appareils et logiciels. Cette vision dépend de la volonté des entreprises comme Apple d'intégrer des fonctionnalités d'IA, même si elles ne sont pas toujours bien accueillies par les utilisateurs.En parlant d'innovation, les outils de recherche approfondie représentent une nouvelle génération d'IA conçue pour mener des investigations complètes sur des sujets complexes. Contrairement aux chatbots standard, ces outils parcourent diverses sources et adaptent leurs stratégies de recherche en temps réel. Par exemple, pour planifier un voyage en Europe, un outil de recherche approfondie vérifierait les horaires de train, explorerait les forums de voyageurs et comparerait les coûts sur les sites de réservation. Ces outils redéfinissent la manière dont nous abordons la collecte et l'analyse d'informations, transformant déjà des industries comme le conseil et la finance.Enfin, explorons BAML, un langage spécifique au domaine qui transforme les prompts en fonctions structurées. Cette approche révolutionne le développement de l'IA en se concentrant sur les schémas de sortie plutôt que sur la création de textes de prompts parfaits. BAML se distingue par sa nature polyglotte et ses capacités de test, ce qui le rend précieux pour les environnements d'entreprise. Il minimise les erreurs de parsing et évite les appels API inutiles, se traduisant par des économies significatives. BAML joue également un rôle clé dans la construction de systèmes de graphes de connaissances multimodaux, enrichissant le contexte et la portée des modèles de langage.Voilà qui conclut notre épisode d’aujourd’hui. Merci de nous avoir rejoints, et n’oubliez pas de vous abonner pour ne manquer aucune de nos discussions passionnantes. À très bientôt dans L'IA Aujourd’hui !

    Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

    続きを読む 一部表示
    4 分
  • L'IA aujourd'hui épisode du 2025-04-05
    2025/04/05
    Bonjour et bienvenue dans le podcast de l'IA par l’IA qui vous permet de rester à la page ! Aujourd’hui : l'impact des LLM sur les infrastructures numériques, les innovations en interfaces cerveau-machine, et les avancées dans le traitement des transcriptions vidéo. C’est parti !Commençons par l'impact des modèles de langage de grande taille, ou LLM, sur les infrastructures numériques. Depuis le début de l'année 2024, la demande pour le contenu de Wikimedia Commons a explosé, en grande partie à cause des robots de scraping qui collectent des données pour entraîner ces modèles. En janvier 2024, la bande passante utilisée pour télécharger du contenu multimédia a augmenté de 50 %, mettant à rude épreuve l'infrastructure de Wikimedia. Environ 65 % du trafic le plus coûteux provient de ces robots, ce qui pose des défis en termes de ressources et de coûts. Cet afflux de requêtes automatisées, souvent sans attribution, menace l'équilibre de l'infrastructure, nécessitant une gestion plus responsable pour garantir l'accès humain à la connaissance.Passons maintenant aux interfaces cerveau-machine. Une nouvelle technologie permet de traduire les pensées en discours intelligible en temps quasi réel. En analysant l'activité électrique du cortex sensorimoteur, cette interface pourrait transformer la communication pour les personnes atteintes de handicaps sévères, comme la paralysie. Cependant, l'implantation de ces dispositifs soulève des questions éthiques et de sécurité, alors que de nombreuses entreprises se précipitent pour tester leurs implants sur des sujets humains. Cette avancée souligne l'intérêt croissant pour les interfaces cerveau-machine, qui pourraient révolutionner notre interaction avec la technologie.Enchaînons avec les innovations dans le traitement des transcriptions vidéo. Federico Viticci a exploré l'utilisation de l'outil en ligne de commande LLM de Simon Willison pour traiter les transcriptions de vidéos YouTube via l'application Raccourcis sur macOS. Cet outil permet d'interagir avec des modèles de langage hébergés dans le cloud, comme Claude et Gemini. Viticci a créé un raccourci sur son Mac pour reformater les transcriptions et extraire des passages intéressants. Bien que Claude ait montré une meilleure capacité à suivre des instructions détaillées, les coûts de l'API d'Anthropic peuvent être élevés. En revanche, Gemini 2.5 Pro, gratuit pendant sa phase expérimentale, offre une grande fenêtre de contexte, malgré quelques problèmes de surcharge.Enfin, abordons l'avenir des fournisseurs de LLM. Selon John-David Lovelock de Gartner, il n'y aurait de place que pour trois grands LLM sur le marché, en raison de la concentration des fournisseurs de services cloud. Cependant, des acteurs comme DeepSeek en Chine affirment réaliser des bénéfices avec des coûts d'API inférieurs à ceux d'OpenAI, compliquant la situation pour les grands LLM américains. Lovelock prévoit que l'IA générative s'intégrera dans tous les appareils et logiciels, mais cela dépendra de la volonté des entreprises comme Apple d'intégrer ces fonctionnalités dans leurs produits.Voilà qui conclut notre épisode d’aujourd’hui. Merci de nous avoir rejoints, et n’oubliez pas de vous abonner pour ne manquer aucune de nos discussions passionnantes. À très bientôt dans L'IA Aujourd’hui !

    Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

    続きを読む 一部表示
    4 分
  • L'IA aujourd'hui épisode du 2025-04-04
    2025/04/04
    Bonjour et bienvenue dans le podcast de l'IA par l’IA qui vous permet de rester à la page ! Aujourd’hui : l'IA en cybersécurité, les biais dans les modèles de langage, les défis du droit d'auteur, les avancées en vidéo générée par IA, et l'avenir du codage. C’est parti !Commençons par la cybersécurité. Microsoft a récemment utilisé son assistant IA, Security Copilot, pour identifier une vingtaine de vulnérabilités critiques dans les bootloaders GRUB2, U-Boot et Barebox. Ces programmes, essentiels au démarrage des ordinateurs, sont vulnérables à des attaques permettant de contourner le Secure Boot et d'installer des bootkits indétectables. Grâce à l'IA, ces failles ont été découvertes en une semaine, un gain de temps considérable par rapport à une analyse manuelle. Des correctifs ont été publiés, soulignant l'importance de mettre à jour les systèmes pour éviter des compromissions durables.Passons maintenant à l'étude menée par Shauli Ravfogel et son équipe sur les biais dans les modèles de langage. Ils ont développé une méthode pour rendre visibles les schémas cachés dans les représentations internes des modèles, en traduisant ces interventions en texte naturel. Leur recherche a montré comment le genre influence subtilement la génération de langage, et a démontré que l'ajout de contre-factuels de genre aux données d'entraînement peut réduire les biais sans sacrifier la précision.En parlant de données, OpenAI est accusé d'avoir utilisé des livres d'O'Reilly Media sans licence pour entraîner son modèle GPT-4o. Cette situation soulève des questions sur l'utilisation de contenus protégés par le droit d'auteur pour l'entraînement des modèles d'IA. Le débat se poursuit sur la nécessité de respecter ces lois tout en permettant l'innovation technologique.Dans le domaine de la vidéo générée par IA, Runway a annoncé son modèle Gen-4, qui améliore la continuité et le contrôle dans la narration visuelle. Ce modèle permet de créer des personnages et des objets cohérents à travers différentes prises, résolvant ainsi un problème courant dans les vidéos générées par IA. Cependant, des préoccupations subsistent quant à l'utilisation de contenus protégés pour l'entraînement de ces modèles.Enfin, Kevin Scott, directeur technique de Microsoft, a prédit que d'ici cinq ans, 95 % du code sera généré par l'IA. Bien que cela soulève des questions sur l'avenir de l'apprentissage du codage, l'aspect créatif du développement logiciel restera une compétence humaine essentielle. L'IA a encore des limitations, notamment dans la compréhension et l'adaptation du code à des contextes spécifiques, ce qui souligne l'importance de la supervision humaine pour garantir la qualité et la sécurité des logiciels.Voilà qui conclut notre épisode d’aujourd’hui. Merci de nous avoir rejoints, et n’oubliez pas de vous abonner pour ne manquer aucune de nos discussions passionnantes. À très bientôt dans L'IA Aujourd’hui !

    Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

    続きを読む 一部表示
    3 分