Apple clarifie : OpenELM n’alimente pas Apple Intelligence, mais sert uniquement la recherche
La firme de Cupertino dément les accusations la concernant : elle n’utilise pas les sous-titres YouTube pour entraîner ses modèles d’IA.
Une enquête a révélé cette semaine que des ténors du secteur de la tech ; Anthropic (propriétaire du chatbot Claude), NVIDIA et Apple ; ont entraîné leurs différents modèles d’IA avec des sous-titres de vidéos YouTube. Ainsi, plus de 170 000 vidéos (dont certaines de gros créateurs comme Mr. Beast ou MKBHD) auraient servi à l’entraînement d’OpenELM, une famille de LLM en open source d’Apple dévoilée en avril dernier.
Toutefois, Apple contredit ces accusations et a affirmé auprès de 9to5Google qu’OpenELM n’alimente aucune de ses fonctionnalités d’intelligence artificielle ou d’apprentissage automatique, y compris Apple Intelligence.
OpenELM : un outil exclusivement dédié à la recherche
Selon Apple, OpenELM existe uniquement dans le but de stimuler la recherche et le développement des modèles linguistiques open source. Les scientifiques de la firme à la pomme le qualifient d’ailleurs de « modèle de langage ouvert à la pointe de la technologie ». La société insiste bien : cette initiative s’inscrit dans une démarche purement scientifique et non commerciale et OpenELM ne sera jamais utilisé dans ses produits destinés au grand public.
Dans un souci de transparence et de collaboration, le géant technologique a choisi de publier ce modèle en open source, le rendant ainsi largement accessible à la communauté scientifique. Les chercheurs intéressés peuvent notamment le consulter sur le site dédié à l’apprentissage automatique d’Apple où elle donne également le lien direct vers le projet sur GitHub.
Ainsi, le dataset des sous-titres YouTube ne serait absolument pas impliqué dans le développement d’Apple Intelligence. L’entreprise a toujours affirmé que ses modèles étaient entraînés sur « des données sous licence, incluant des données sélectionnées pour améliorer des fonctionnalités spécifiques, ainsi que des données disponibles publiquement collectées par notre web-crawler ».
OpenELM 2.0, c’est déjà terminé ?
Apple a tenu à préciser auprès de 9to5Google qu’elle n’envisage aucunement de développer de nouvelles itérations du modèle OpenELM. Cette mise au point intervient dans un contexte particulier, faisant suite à un article de Wired qui évoquait l’utilisation par plusieurs entreprises, dont Apple, du dataset YouTube Subtitles. Ce dernier fait partie d’une collection plus vaste baptisée The Pile, constituée par l’organisation à but non lucratif EleutherAI.
La société semble vouloir maintenir une nette séparation entre ses initiatives de recherche ouverte et ses développements propriétaires. La cessation du développement d’OpenELM après la révélation de cette pratique soulève tout de même des interrogations. Faut-il y voir un aveu implicite de la part d’Apple que l’utilisation de ces données était problématique ? Ou bien s’agit-il simplement d’une décision stratégique pour éviter de futures controverses ? Un mystère qui sera certainement difficile à résoudre.
- Apple affirme qu’OpenELM n’alimente aucune de ses fonctionnalités d’IA ou d’apprentissage automatique.
- Ce modèle est destiné uniquement à la recherche et a été développé à but scientifique.
- L’entreprise a déclaré qu’elle ne prévoit pas de développer de nouvelles versions d’OpenELM.