Janus-Pro-7b de Deepseek est devenu un concurrent notable dans le paysage de la génération d'images AI, en particulier contre des modèles établis comme Dall-E 3 d'Openai et la diffusion stable de l'AI d'Openai. Voici comment il se compare à différentes dimensions:
Metrics de performance
** Précision globale: Janus-Pro-7b a atteint une précision globale impressionnante de 80% dans les tâches de texte à l'image, dépassant les 67% de Dall-E 3 et 74% de la diffusion stable. Cette métrique reflète la capacité du modèle à générer des sorties qui s'alignent étroitement avec les invites utilisateur sur diverses tâches [2] [4].
** Précision unique d'un objet: en générant des objets individuels à partir d'invites simples, Janus-Pro-7b a obtenu 99%, par rapport à 96% de Dall-E 3. Cela suggère que Janus-PRO excelle à la représentation précise des éléments spécifiques demandés par les utilisateurs [2].
** Alignement positionnel et d'attribut: Janus-Pro-7b fonctionne également bien dans l'alignement positionnel (90% contre 83% de Dall-E 3) et la couleur / l'alignement des attributs (79% pour la couleur contre 43% de Dall-E 3) Â Indiquant qu'il est préférable de placer correctement les objets et de faire correspondre les couleurs avec précision dans les images générées [2].
Gestion des invites complexes
Janus-Pro-7b démontre de fortes capacités dans la gestion des invites denses, score 84.19 sur le banc de banc DPG, qui évalue la capacité du modèle à interpréter et à générer des images à partir de descriptions complexes. Dall-E 3 suit de près avec un score de 83,50 ** [2] [4]. Cette capacité est cruciale pour les utilisateurs qui ont besoin d'une génération d'images détaillée et nuancée.
Flexibilité créative vs réalisme
Bien que Janus-Pro et Dall-E 3 soient conçus pour une flexibilité créative, ils répondent à des besoins légèrement différents. Dall-E 3 est noté pour ses visuels imaginatifs et abstraits, ce qui le rend adapté aux applications artistiques. En revanche, Janus-Pro-7b a tendance à produire des images plus réalistes, ce qui peut plaire aux utilisateurs à la recherche de photoréalisme [8]. Cependant, il aurait du mal à générer efficacement des chiffres humains, ce qui pourrait limiter son applicabilité dans certains contextes [2].
Coût et accessibilité
Les modèles de Deepseek sont présentés comme étant développés à une fraction du coût par rapport aux homologues occidentaux comme OpenAI. Cette approche rentable peut rendre Janus-Pro plus accessible aux développeurs et aux entreprises qui cherchent à intégrer la génération d'images d'IA sans engager des dépenses significatives [6] [4]. De plus, Janus-Pro est disponible dans un modèle open source, permettant des opportunités d'utilisation et de personnalisation plus larges [3].
Conclusion
En résumé, Janus-Pro-7b de Deepseek présente une alternative convaincante aux générateurs d'images d'IA existants comme Dall-E 3 et une diffusion stable. Avec des mesures de performance supérieures en matière de précision et de manipulation rapide, ainsi que sa nature rentable, il se positionne comme un concurrent fort sur le marché de la génération d'images d'IA. Cependant, les utilisateurs potentiels devraient prendre en compte ses limites dans la génération de chiffres humains lors de l'évaluation de son aptitude à des applications spécifiques.
Citations:
[1] https://www.livescience.com/technology/artificial-intelligence/deepseek-stuns-tech-industry-with-new-ai-image-generator-that-beats-openaisais-dall-e-3
[2] https://www.prompthub.us/blog/deepseek-janus-pro-7b-model-overview-and-how-it-ranks-against-dall-e-3
[3] https://janusai.pro
[4] https://www.androidauthority.com/deepseek-janus-pro-vs-competition-3521619/
[5] https://huggingface.co/deepseek-ai/janus-pro-7b
[6] https://www.tomsguide.com/ai/deepseeks-new-ai-imager-generator-is-here-to-pake-on-midjourney-et-dall-e-what-we-know
[7] https://fal.ai/models/fal-ai/janus
[8] https://www.the-next-tech.com/artificial-intelligence/janus-pro-7b-vs-dall-e-3/
[9] https://www.youtube.com/watch?v=rng-mvun_fq