Concurrence

Google dévoile son nouveau générateur d’image, de quoi est-il capable ?

Est ce que Google fait mieux que OpenAI ?

Il y a

le

© Imagen 2 / Google

La semaine dernière, Google a fait l’une de ses plus grandes annonces en matière d’intelligence artificielle. Elle a en effet présenté Gémini, qu’elle a d’ailleurs qualifié comme étant plus puissante que GPT-4 d’OpenAI, qui était jusqu’ici considérée comme l’IA générative la plus performante du marché. Les allégations d’Alphabet restent cependant à prouver, car elles se basent sur des tests qui ne reflètent pas complètement l’utilisation réelle que les gens vont en faire. On avait d’ailleurs appris suite à l’annonce que Google avait truqué certaines démonstrations pour faire croire que Gémini était capable de plus qu’il ne l’est réellement.

Dans la continuité de cette annonce, la firme de Moutain View a dévoilé hier un autre de ses modèles d’IA, qui tout comme Gémini, a été développé par la branche DeepMind de la firme. Il s’agit cette fois-ci d’Imagen 2, qui est capable, tout comme Dall-E d’OpenAI, de générer une image à partir d’un texte. Cette annonce de Google survient peu de temps après que Snapchat ait également annoncé la possibilité de générer des images grâce à du texte directement depuis son application.

Mais dans le cas de Google, Imagen 2 est pour le moment destiné aux développeurs, nous ne pouvons donc malheureusement pas l’essayer. Voyons quand même de quoi l’outil est capable.

Est-ce que Imagen 2 fait mieux que les autres ?

Dans son communiqué d’annonce, Google nous dit que « Les technologies de conversion texte-image rencontrent souvent des difficultés pour restituer correctement le texte. » Ce qui est parfaitement vrai, à moins d’avoir acquis une certaine expérience, il est difficile d’obtenir le rendu souhaité dès la première image.

Voici deux images réalisées avec Imagen 2, accompagnée chacune du texte (le prompt) qui a permis de les générer:

© Imagen 2 – Google

La première image ici montre un dentifrice posé sur un meuble de salle de bain, juste à côté d’un lavabo. Voici le texte qui a permis de générer cette image :

  • Prompt original : A tube of toothpaste with the words “CYMBAL” written on it, on a bathroom counter, advertisement.
  • Prompt traduit : Un tube de dentifrice avec les mots « CYMBAL » écrits dessus, sur un comptoir de salle de bain, publicité.

La seconde image montre quant à elle un petit déjeuner. À son tour, le texte qui a permis de la générer :

  • Prompt original : A cup of strawberry yogurt with the word “Delicious” written on its side, sitting on a wooden tabletop. Next to the cup of yogurt is a plate with toast and a glass of orange juice.
  • Prompt traduit : Une coupe de yaourt aux fraises avec le mot « Délicieux » écrit sur le côté, posé sur une table en bois. À côté de la tasse de yaourt, il y a une assiette avec du pain grillé et un verre de jus d’orange.

Le rendu des images est excellent et correspond bien aux prompts. Mais on ne sait pas si elles ont été générées du premier coup ou pas. Si c’est le cas, alors chapeau Google, Imagen 2 fait mieux que les autres. Mais si il a fallu de nombreuses tentatives pour obtenir ces résultats, alors il n’y a rien d’exceptionnel comparé à la concurrence.

i-nfo.fr - App officielle iPhon.fr
Par : Keleops AG
4.4 / 5
606 avis
Cliquez pour commenter

Sur le même sujet

Quitter la version mobile