Home Arrow Icon Knowledge base Arrow Icon Global Arrow Icon كيف يتعامل Janus-Pro مع مطالبات كثيفة بشكل مختلف عن النماذج الأخرى


كيف يتعامل Janus-Pro مع مطالبات كثيفة بشكل مختلف عن النماذج الأخرى


Janus-Pro-7B ، الذي تم تطويره بواسطة Deepseek ، يوضح نهجًا واضحًا للتعامل مع مطالبات كثيفة مقارنةً بنماذج أخرى مثل Dall-E 3. تساهم أساليب هذا النموذج في الهندسة المعمارية والتدريب بشكل كبير في أدائها المتفوق في تفسير التعليمات المعقدة.

الهندسة المعمارية

واحدة من الميزات الرئيسية لجانوس-برو هي بنيةها المنفصلة ، والتي تفصل مهام الفهم البصري وتوليد النص إلى صورة. يسمح هذا التصميم بتشفير متخصص يمكن ضبطه على مهامها ، مما يعزز كل من الدقة والتماسك في توليد الإنتاج. في المقابل ، تستخدم نماذج مثل Dall-E 3 تشفيرًا واحدًا لكلا المهمتين ، مما قد يؤدي إلى تعارضات وتقليل الأداء عند التعامل مع مطالبات معقدة [1] [2].

التدريب بمطالبات كثيفة

تركز منهجية التدريب على Janus-Pro على مطالبات وصفية كثيفة ، باستخدام محول تعريفي تلقائي موحد يعالج تسلسل الميزات متعددة الوسائط. يؤكد هذا النهج على استخدام البيانات الاصطناعية عالية الجودة إلى جانب البيانات الواقعية ، مما يتيح النموذج من التخصص في توليد الصور من أوصاف نصية معقدة دون الضوضاء التي غالباً ما تكون موجودة في مجموعات البيانات المتنوعة [2] [4]. يتناقض هذا مع Dall-E 3 ، الذي يعتمد بشكل كبير على البيانات الواقعية التي قد تقدم تناقضات في جودة الإخراج [2] [5].

مقاييس الأداء

في الاختبارات القياسية مثل DPG-BENCY ، والتي تقيم القدرة على إنشاء صور من مطالبات معقدة ، حقق Janus-Pro درجة إجمالية قدرها 84.19 ، تفوق قليلاً على درجة Dall-E 3 البالغة 83.50. والجدير بالذكر ، تفوق Janus-Pro في مقاييس مثل محاذاة السمات (89.4 ٪ مقابل 88.39 ٪) ومعالجة العلاقات (89.32 ٪ مقابل 90.58 ٪) ، مما يشير إلى قوتها في تفسير العلاقات والسمات الموصوفة بدقة في المطالبات الكثيفة [1] [3] ].

خاتمة

يتيح لها بنية Janus-Pro المبتكرة المنفصلة والتدريب المركّز على المطالبات الكثيفة التعامل مع مهام توليد الصور المعقدة بشكل أكثر فعالية من النماذج التقليدية مثل Dall-E 3. من خلال الاستفادة جذوع المخرجات من تعليمات معقدة ، وضع معيار جديد في إمكانيات الذكاء الاصطناعي متعدد الوسائط.

الاستشهادات:
[1] https://www.prompthub.us/blog/deepseek-janus-7b-model-overview-and-how-it-ranks-against-dall-e-3
[2] https://aman.ai/primers/ai/deepseek-janus-pro/
[3] https://arxiv.org/html/2501.17811v1
[4] https://aipapersacademy.com/janus-pro/
[5] https://www.datacamp.com/blog/janus-pro
[6] https://stackoverflow.com/questions/45448368/should-i-use-janusgraph-as-main-database-to-sal-my-data-for-a-new project
[7 "
[8] https://www.linkedin.com/pulse/introduction-deepseek-janus-pro-lionel-sim-j6oac