Deepseek Janus-Pro-7B ir kļuvis par ievērojamu konkurentu AI attēlu paaudzes ainavā, īpaši pret tādiem izveidotiem modeļiem kā Openai Dall-E 3 un Stability AI stabilā difūzija. Lūk, kā tas ir salīdzināts dažādās dimensijās:
Veiktspējas metrika
** Kopējā precizitāte: Janus-Pro-7b ir sasniedzis iespaidīgu kopējo precizitāti 80% no teksta līdz attēla uzdevumiem, pārspējot Dall-E 3 67% un stabila difūzijas 74%. Šī metrika atspoguļo modeļa spēju ģenerēt izvades, kas cieši saskan ar lietotāju uzvednēm dažādos uzdevumos [2] [4].
** Viena objekta precizitāte: ģenerējot atsevišķus objektus no vienkāršām uzvednēm, Janus-Pro-7b ieguva 99%, salīdzinot ar Dall-E 3 96%. Tas liek domāt, ka Janus-Pro precīzi attēlo īpašus vienumus, ko pieprasa lietotāji [2].
** Pozicionālā un atribūtu izlīdzināšana: Janus-Pro-7b arī labi darbojas pozicionālā izlīdzināšanā (90% pret Dall-E 3 83%) un krāsu/atribūtu izlīdzināšanu (79% krāsu pret Dall-E 3 43%) â Norādot, ka labāk ir pareizi novietot objektus un precīzi saskaņot krāsas ģenerētos attēlos [2].
Kompleksu uzvednes apstrāde
Janus-Pro-7b demonstrē spēcīgas spējas pārvaldīt blīvas uzvednes, vērtējot 84.19 uz DPG-bench etalonu, kurā novērtēta modeļa spēja interpretēt un ģenerēt attēlus no sarežģītiem aprakstiem. Dall-E 3 cieši seko ar rezultātu 83,50 ** [2] [4]. Šī spēja ir būtiska lietotājiem, kuriem nepieciešama detalizēta un niansēta attēlu ģenerēšana.
Radoša elastība pret reālismu
Kaut arī gan Janus-Pro, gan Dall-E 3 ir paredzēti radošai elastībai, tie rūpējas par nedaudz atšķirīgām vajadzībām. Dall-E 3 tiek atzīmēts ar tā iztēles un abstraktiem vizuāliem attēliem, padarot to piemērotu mākslinieciskām lietojumiem. Turpretī Janus-Pro-7B ir tendence radīt reālistiskākus attēlus, kas var patikt lietotājiem, kuri meklē fotoreālismu [8]. Tomēr, kā ziņots, tas cīnās ar cilvēku figūru efektīvu radīšanu, kas varētu ierobežot tā piemērojamību noteiktos kontekstos [2].
Izmaksas un pieejamība
Tiek uzskatīts, ka DeepSeek modeļi tiek izstrādāti par nelielu daļu no izmaksām, salīdzinot ar rietumu kolēģiem, piemēram, Openai. Šī rentabla pieeja var padarīt Janus-Pro pieejamāku izstrādātājiem un uzņēmumiem, kas vēlas integrēt AI attēlu ģenerēšanu, neradot ievērojamus izdevumus [6] [4]. Turklāt Janus-Pro ir pieejams atvērtā pirmkoda modelī, ļaujot plašāk izmantot un pielāgot iespējas [3].
Secinājums
Rezumējot, Deepseek Janus-Pro-7B ir pārliecinoša alternatīva esošajiem AI attēlu ģeneratoriem, piemēram, Dall-E 3 un stabila difūzija. Ar izcilu veiktspējas metriku precizitātē un ātrā apstrādē līdztekus tā rentablajam raksturu, tas sevi pozicionē kā spēcīgu sāncensi AI attēlu ģenerēšanas tirgū. Tomēr potenciālajiem lietotājiem jāapsver tā ierobežojumi cilvēku skaitļu radīšanā, novērtējot tā piemērotību īpašām lietojumprogrammām.
Atsauces:
.
[2] https://www.prompthub.us/blog/deepseek-janus-pro-7b-model-overview-and-how-it-ranks-against-dall-e-3
[3] https://janusai.pro
.
[5] https://huggingface.co/deepseek-ai/janus-pro-7b
[6.]
[7] https://fal.ai/models/fal-ai/janus
[8] https://www.the-next-tech.com/articial-intelligence/janus-pro-7b-vs-dall-e-3/
[9] https://www.youtube.com/watch?v=rng-mvun_fq