Intelligence Artificielle

J'ai créé mon propre générateur d'images IA et maintenant je m'inquiète

Juil 10, 2024

Vous vous souvenez de l'époque où Prisma était l'application d'édition d'images «IA» ultime? Oui, nous avons certainement parcouru un long chemin depuis. Avec l’essor des générateurs d’images IA basés sur des invites tels que DALL-E et Midjourney, la création d’art et de deepfakes est pratiquement accessible à tous.

Mais il y a des limites, n'est-ce pas ? Après la nouveauté initiale consistant à demander à Midjourney d'imaginer des invites variées et de voir ce qu'il génère, tout devient plutôt ennuyeux. Ou du moins, c'est le cas pour moi.

Énergie narcissique ?

Écoutez, je suis introverti, ce qui veut dire que je n'aime pas beaucoup sortir. Mais tu sais ce que j'aime ? Avoir des photos de moi dans des endroits où je n'irais probablement jamais; bon sang, des endroits où je ne peux pas aller non plus.

Naturellement, je voulais demander à des outils d'IA de créer des images de moi dans des situations et des lieux différents. Cependant, je ne voulais pas non plus télécharger des images de moi sur des sites Web aléatoires dans l'espoir que les résultats seraient bons ; et c'est à ce moment-là que j'ai entendu parler de Dreambooth.

Que les jeux commencent…

Il s’avère que des gens vraiment intelligents ont apporté au grand public des choses comme la diffusion stable. De plus, d'autres ont collaboré avec eux et ont permis à toute personne faisant preuve d'un peu de patience de créer ses propres modèles de diffusion stable et de les exécuter entièrement en ligne.

notebook google colab pour dreambooth avec diffusion stable

Ainsi, même si j'ai un MacBook Air M1 qui n'est en aucun cas destiné à être utilisé comme machine de formation pour un modèle de génération d'images d'apprentissage en profondeur, je peux exécuter un ordinateur portable Google Colab et faire tout cela sur les serveurs de Google — gratuitement !

Tout ce dont j'avais vraiment besoin, c'était alors de quelques photos de moi, et c'est tout.

Entraîner mon générateur d'images IA

Former votre propre générateur d’images n’est pas difficile du tout. Il existe un certain nombre de guides disponibles en ligne si vous avez besoin d'aide, et tout est fondamentalement très simple. Il vous suffit d'ouvrir le bloc-notes Colab, de télécharger vos photos et de commencer à entraîner le modèle. Tout cela se produit assez rapidement.

Lire  12 meilleurs générateurs de headshots IA que vous devriez essayer en 2024

D'accord, soyons honnêtes, la formation à l'encodeur de texte se déroule assez rapidement, en 5 minutes. Cependant, la formation d’UNet avec les paramètres définis par défaut prend un temps assez long – près de 15 à 20 minutes. Cependant, étant donné que nous entraînons actuellement un modèle d'IA à reconnaître et à pouvoir dessiner mon visage, 20 minutes ne semblent pas trop longues.

entraîner l'unet pour le fast-dreamboot

Pendant la formation, il existe de nombreuses façons de personnaliser le degré de formation de votre modèle, et ce que j'ai compris en lisant les expériences de nombreuses personnes en ligne, c'est qu'il n'y a pas de véritable « taille unique ». tous »stratégie ici. Cependant, pour les cas d'utilisation de base, les valeurs par défaut semblaient très bien fonctionner pour la plupart des gens, et je les ai également conservées. En partie parce que je ne comprenais pas vraiment ce que signifiaient la plupart des choses, et en partie parce que je ne pouvais tout simplement pas essayer d'entraîner plusieurs modèles avec différents paramètres d'entraînement pour voir ce qui aboutissait aux meilleurs résultats.

Après tout, je cherchais simplement un générateur d’images IA amusant qui puisse créer des images à moitié décentes de moi.

Dépasse les attentes

Je ne suis pas un expert en IA, loin de là. Cependant, je comprends que former un modèle de diffusion stable sur un ordinateur portable Google Colab avec 8 jpeg de moi-même recadrés à 512 × 512 pixels n'aboutira pas vraiment à quelque chose d'extraordinaire.

Comme j’avais tort.

Lors de ma première tentative d'utilisation du modèle que j'ai formé, j'ai commencé avec une simple invite indiquant « akshay ». Voici l'image qui a été générée.

J'ai créé mon propre générateur d'images IA et maintenant je m'inquiète

Pas génial, n'est-ce pas ? Mais ce n’est pas si mal non plus, non ?

Mais ensuite j'ai commencé à jouer avec certains des paramètres disponibles dans l'interface utilisateur. Il existe plusieurs méthodes d'échantillonnage, des étapes d'échantillonnage, une échelle CFG, des scripts et bien plus encore. Il est temps de devenir un peu fou en expérimentant différentes invites et configurations pour le modèle.

De toute évidence, les résultats de ces images ne sont pas parfaits, et quiconque m'a vu peut probablement dire que ce ne sont pas « mes » images. Cependant, ils sont assez proches ; et je n'ai même pas entraîné le modèle avec un soin particulier.

Lire  OpenAI lance GPT-4, une IA multimodale avec prise en charge d'images

Si je devais suivre les innombrables guides sur Reddit et ailleurs sur Internet qui expliquent comment améliorer l'entraînement et obtenir de meilleurs résultats avec Dreambooth et Stable Diffusion, ces images auraient pu s'avérer encore plus réalistes (et sans doute plus effrayantes).

Ce générateur d'images IA est terriblement bon

Vous voyez, je suis tout à fait favorable aux améliorations de la technologie de l’IA. En tant que journaliste technologique, j'ai suivi le domaine en constante évolution et en amélioration de l'IA destinée aux consommateurs au cours des deux dernières années, et pour la plupart, je suis profondément impressionné et optimiste.

Cependant, voir quelque chose comme Dreambooth en action m'amène à m'interroger sur les manières contraires à l'éthique avec lesquelles les outils basés sur l'IA et le ML sont facilement accessibles à pratiquement toute personne ayant accès à un ordinateur et à Internet.

Il ne fait aucun doute qu’il existe de nombreux mauvais acteurs dans le monde. Bien qu'il existe certainement des cas d'utilisation innocents d'une technologie aussi facilement accessible, s'il y a une chose que j'ai apprise au cours de mes années de reportage sur la technologie, c'est que mettre un produit entre les mains de millions de personnes entraînera sans aucun doute de nombreux résultats indésirables. . Au mieux, quelque chose d’inattendu, et au pire, quelque chose de carrément dégoûtant.

Avoir la capacité de créer des images deepfakes d'à peu près n'importe qui tant que vous pouvez obtenir 5 à 10 photos de leur visage, c'est incroyablement dangereux s'il est mal utilisé. Pensez à la désinformation, aux fausses déclarations et même à la vengeance pornographique : les deepfakes peuvent être utilisés de toutes ces manières problématiques.

Des sauvegardes ? Quelles sauvegardes ?

Il ne s'agit pas seulement de Dreambooth. En eux-mêmes, et bien utilisés, Dreambooth et Stable Diffusion sont des outils incroyables qui nous permettent d’expérimenter ce que l’IA peut faire. Mais il n’existe aucune réelle protection contre cette technologie par rapport à ce que j’ai expérimenté jusqu’à présent. Bien sûr, cela ne vous permettra pas de générer de la nudité pure et simple dans les images; du moins par défaut. Cependant, il existe de nombreuses extensions qui vous permettront également de contourner ce filtre et de créer à peu près tout ce que vous pouvez imaginer, en fonction de l'identité de chacun.

Lire  Pourquoi dépenser en gadgets d'IA alors que ces applications d'IA peuvent tout faire

Même sans de telles extensions, vous pouvez facilement obtenir des outils comme celui-ci pour créer un large éventail d’images de personnes potentiellement dérangeantes et peu recommandables.

De plus, avec un PC suffisamment puissant, chacun peut entraîner ses propres modèles d'IA sans aucune garantie et sur la base des données d'entraînement qu'il souhaite utiliser – ce qui signifie que le modèle entraîné créera des images qui peuvent être accablantes et nuisibles au-delà de l'imagination.

Les deepfakes n’ont rien de nouveau. En fait, il existe une vaste mine de vidéos et de médias deepfakes en ligne. Cependant, jusqu’à un passé récent, la création de deepfakes était limitée à un nombre relativement restreint (bien qu’encore important) de personnes qui existaient à la croisée des « personnes disposant d’un matériel performant » et du « savoir-faire technique ».

Désormais, avec l'accès à des unités de calcul GPU gratuites (à usage limité) sur Google Colab et la disponibilité d'outils comme fast-dreambooth qui vous permettent de former et d'utiliser des modèles d'IA sur les serveurs de Google, ce nombre de personnes augmentera de façon exponentielle. C’est probablement déjà le cas – cela me fait peur, et cela devrait l’être aussi pour vous.

Que pouvons-nous faire?

C'est la question que nous devrions nous poser à ce stade. Des outils comme DALL-E, Midjourney et, oui, Dreambooth et Stable Diffusion, sont certainement impressionnants lorsqu'ils sont utilisés avec la décence humaine. L’IA s’améliore à pas de géant – vous pouvez probablement le constater en regardant l’explosion des nouvelles liées à l’IA au cours des deux derniers mois.

Il s’agit donc d’un point crucial où nous devons trouver des moyens de garantir que l’IA soit utilisée de manière éthique. Comment pouvons-nous procéder est une question à laquelle je ne suis pas sûr d'avoir la réponse, mais je sais qu'après avoir utilisé le générateur d'images IA fast-dreambooth et après avoir vu ses capacités, j'ai peur de sa qualité. , sans même trop essayer.

Laisser un Commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *