Apple
Apple a vraiment entraîné ses IA illégalement ?
Apple avait pourtant montré une autre image en décembre.
Un nouveau rapport de Wired nous apprend une nouvelle étonnante aujourd’hui. Apple a présenté Apple Intelligence le 10 juin dernier, qui inclut un partenariat avec OpenAI (ChatGpt), mais pas que. La firme à la pomme fait également appel à ses propres LLM pour certaines fonctionnalités.
En décembre 2023, on apprenait qu’Apple envisageait d’entrer dans le marché de l’intelligence artificielle de manière propre. Le New York Times annonçait en effet que Cupertino aurait entamé des négociations avec des éditeurs et des agences de presse afin d’alimenter son système d’IA générative. Cela semblait être une initiative louable, d’autant plus que Google ou Microsoft ne l’ont pas fait.
Le rapport de Wired affirme aujourd’hui qu’Apple et d’autres grandes entreprises auraient bafoué les droits d’auteurs de certains créateurs, afin d’entraîner leur LLM. Cela inclut le contenu du plus gros YouTuber tech américain : MKBHD.
Ce que dit le rapport
Voici ce que dit le rapport de Wired :
Une enquête menée par Proof News a révélé que certaines des entreprises d’intelligence artificielle les plus riches au monde ont utilisé des éléments provenant de milliers de vidéos YouTube pour former des IA. Ces entreprises ont agi ainsi en dépit des règles de YouTube interdisant la collecte de contenus sur la plateforme sans autorisation.
Notre enquête a révélé que les sous-titres de 173 536 vidéos YouTube, récupérés sur plus de 48 000 chaînes, ont été utilisés par des poids lourds de la Silicon Valley, notamment Anthropic, Nvidia, Apple et Salesforce. […] L’ensemble de données fait partie d’une compilation publiée par l’association à but non lucratif, appelée Pile
Explications
Le rapport précise ensuite que les données utilisées proviennent du site Pile, un organisme à but non lucratif. Pile propose des données publiques accessibles à tous. L’outil est très utilisé par les universitaires et les développeurs.
Avec Pile, Apple et les autres semblent avoir trouvé une solution pour contourner les problèmes légaux liés aux droits d’auteurs. Même si dans les faits, les données proviennent de Pile et non de YouTube directement, il s’agit in fine de la même chose. La solution de contournement choisie par les Apple pourrait pas perdurer dans le temps vu ce que cela implique. La firme a refusé de réagir aux demandes d’informations de 9to5mac à propos de cette affaire. Quand Apple reste silencieuse, c’est souvent aveux de culpabilité.
Apple avait pourtant montré une autre image en décembre 2023, quand on apprenait qu’elle signait des contrats avec des grands éditeurs afin d’entraîner ses IA. On imagine qu’entraîner ses IA légalement en demandant l’autorisation à chaque fois n’est pas aussi efficace que le contraire. En réalité, tout le monde le fait, mais il vaut mieux éviter de s’ériger en défenseur des droits d’auteurs si on envisage ce type de solution.