Janus-Pro-7b, ko izstrādājis DeepSeek, parāda izteiktu pieeju blīvu uzvedņu apstrādei, salīdzinot ar citiem modeļiem, piemēram, Dall-E 3. Šī modeļa arhitektūras un apmācības metodes ievērojami veicina tā augstāko sniegumu sarežģītu instrukciju interpretācijā.
DECOUPED arhitektūra
Viena no galvenajām Janus-Pro iezīmēm ir tās atsaistītā arhitektūra, kas atdala vizuālās izpratnes un teksta līdz attēla uzdevumus. Šis dizains ļauj specializētiem kodētājiem, kurus var precīzi pielāgot attiecīgajiem uzdevumiem, uzlabojot gan precizitāti, gan koherenci izvades ģenerēšanā. Turpretī tādi modeļi kā Dall-E 3 abiem uzdevumiem izmanto vienu kodētāju, kas var izraisīt konfliktus un samazināt veiktspēju, strādājot ar sarežģītām uzvednēm [1] [2].apmācība ar blīvām uzvednēm
Janus-Pro apmācības metodika koncentrējas uz blīvām aprakstošām uzvednēm, izmantojot vienotu autoregresīvu transformatoru, kas apstrādā multimodālas funkciju secības. Šī pieeja uzsver augstas kvalitātes sintētisko datu izmantošanu līdztekus reālās pasaules datiem, ļaujot modelim specializēties attēlu ģenerēšanā no sarežģītiem tekstuāliem aprakstiem bez trokšņa, kas bieži sastopams dažādās datu kopās [2] [4]. Tas ir pretstatā Dall-E 3, kas lielāka ir paļaujas uz reālās pasaules datiem, kas var ieviest neatbilstības izejas kvalitātē [2] [5].Veiktspējas metrika
Etalona testos, piemēram, DPG-Bench, kas novērtē spēju ģenerēt attēlus no sarežģītām uzvednēm, Janus-Pro ieguva kopējo punktu skaitu 84,19, nedaudz pārspējot Dall-E 3 rezultātu 83,50. Notably, Janus-Pro excelled in metrics like attribute alignment (89.4% vs. 88.39%) and relation handling (89.32% vs. 90.58%), indicating its strength in accurately interpreting the relationships and attributes described in dense prompts[1][3 ].Secinājums
Janus-Pro novatoriskā atsaistītā arhitektūra un koncentrēta apmācība uz blīvām uzvednēm ļauj tai efektīvāk apstrādāt sarežģītus attēlu ģenerēšanas uzdevumus nekā tradicionālie modeļi, piemēram, Dall-E 3., izmantojot sintētiskos datus un specializētus kodētājus, Janus-Pro uzlabo savu spēju radīt saskaņotus un vizuāli Pievilcīgas izejas no sarežģītām instrukcijām, multimodālo AI iespēju iestatīšana jauna standarta iestatīšana.Atsauces:
[1.]
[2] https://aman.ai/primers/ai/deepseek-janus-pro/
[3] https://arxiv.org/html/2501.17811v1
[4] https://aipapersacademy.com/janus-pro/
[5] https://www.datacamp.com/blog/janus-pro
[6.]
.
[8] https://www.linkedin.com/pulse/introduction-depseek-janus-pro-lionel-sim-j6oac