Ce système transforme les mots en images

Les chercheurs du groupe de recherche en intelligence artificielle OpenAI ont créé un nouveau système capable de produire une image complète à partir dune simple phrase écrite dans un texte.

Les images peuvent être n’importe quoi, n’importe quel animal, immeuble ou humain. Pour le moment, cette invention n’existe qu’en anglais.

Sommaire :

L’invention révolutionnaire DALL-E 2

Baptisée DALL-E 2, la deuxième génération de l’IA de conversion de texte en image est capable de créer des images et des œuvres d’art réalistes à une résolution plus élevée que son prédécesseur.

Ce système est également capable d’ajouter des objets dans des images existantes, ou même de fournir différents points de vue sur une image existante.

L’OpenAI ne mettra pas le système sur le marché public pour le moment.

Mais le système a des limites qui ont été imposées par les développeurs. Afin d’éviter la haine et l’incitation à la violence, ces derniers ont imposé des restrictions sur le champ d’application de l’IA.

Le système ne pourra pas non plus être utilisé pour diffuser des informations erronées.

OpenAI a entraîné le modèle à l’aide d’images et a éliminé certains éléments choquants, limitant ainsi sa capacité à produire du contenu offensant.

LOrs de son premier teste en janvier 2021, les premières illustrations ont été dévoilées.

On y retrouvait des images diverses et variées afin de montrer que le système pouvait retranscrire n’importe quel texte en image. On y trouvait un mannequin en chemise de flanelle, l’illustration d’un radis promenant un chien et un émoji bébé pingouin.

Sur le site web de DALL-E 2, il est possible de personnaliser cette expression pour produire des images “à la volée”, notamment en remplaçant l’astronaute par un ours en peluche et le cheval par un ballon de basket, et en les montrant sous forme de dessin au crayon ou de peinture “pop art” à la Andy Warhol.

LIRE AUSSI  L'application Signal explose après la controverse sur WhatsApp

Comment fonctionne ce système ?

Mais ce n’est pas tout, le système permet également de produire plusieurs versions du texte avec plusieurs images, en fonction de l’envie et du bon vouloir du client.

Le système est capable de remplir automatiquement les détails, comme les ombres, lorsqu’un objet est ajouté, ou même de modifier l’arrière-plan pour qu’il corresponde, si un objet est déplacé ou supprimé.

Le système existe grâce à un processus appelé “diffusion”, qui commence par un motif de points aléatoires et modifie progressivement ce motif en direction d’une image lorsqu’il reconnaît des aspects spécifiques de cette image.

DALL-E 2 est construit sur un système de vision par ordinateur appelé CLIP, développé par OpenAI et annoncé l’année dernière.

Prafulla Dhariwal, un chercheur travaillant sur le système, a déclaré :

“DALL-E 1 a simplement pris notre approche GPT-3 du langage et l’a appliquée à la production d’une image : nous avons comprimé les images en une série de mots et nous avons simplement appris à prédire ce qui vient ensuite”.

Malheureusement, ce processus limitait le réalisme des images, car il ne capturait pas toujours les qualités que les humains jugeaient les plus nécessaires.

CLIP regarde une image et en résume le contenu de la même manière qu’un humain le ferait, et ils ont inversé ce processus.

FAQ

Qu'est-ce que DALL-e AI ?

Développé par OpenAI, DALL-E est un programme d'IA entraîné à générer des images à partir de descriptions textuelles. Il a été lancé en janvier 2021, mais la deuxième génération du système d'intelligence artificielle, DALL-E 2, est en préparation.

LIRE AUSSI  Le changement climatique est à la mode sur Tinder

L'IA peut-elle créer des images ?

DALL-E 2 est un nouvel algorithme de réseau neuronal qui crée une image à partir d'une courte phrase ou d'une expression que vous fournissez. Le programme, qui a été annoncé par le laboratoire de recherche en intelligence artificielle OpenAI en avril 2022, n'a pas été rendu public.

 

Votez ! post
Total
0
Shares
Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Previous Post

Instagram, toutes les nouvelles fonctionnalités du géant de la photo

Next Post

Les meilleurs objets technologiques de 2022

Related Posts