Janus-Pro-7b ของ Deepseek ได้กลายเป็นคู่แข่งที่โดดเด่นในภูมิทัศน์การสร้างภาพ AI โดยเฉพาะอย่างยิ่งกับโมเดลที่จัดตั้งขึ้นเช่น Dall-E 3 ของ Openai และการแพร่กระจายที่มั่นคงของ AI นี่คือวิธีเปรียบเทียบในมิติต่าง ๆ :
ตัวชี้วัดประสิทธิภาพ
** ความแม่นยำโดยรวม: Janus-Pro-7b ได้รับความแม่นยำโดยรวมที่น่าประทับใจ 80% ในงานข้อความต่อภาพซึ่งเหนือกว่า 67% ของ Dall-E 3 และการแพร่กระจายที่มั่นคง 74% ตัวชี้วัดนี้สะท้อนให้เห็นถึงความสามารถของโมเดลในการสร้างเอาต์พุตที่สอดคล้องอย่างใกล้ชิดกับการแจ้งเตือนผู้ใช้ในงานที่หลากหลาย [2] [4]
** ความแม่นยำของวัตถุเดี่ยว: ในการสร้างวัตถุแต่ละชิ้นจากพรอมต์ง่าย ๆ Janus-Pro-7b ได้คะแนน 99%เมื่อเทียบกับ 96%ของ Dall-e 3 สิ่งนี้ชี้ให้เห็นว่า JANUS-PRO เก่งในการวาดรายการเฉพาะที่ร้องขอโดยผู้ใช้ [2]
** การจัดตำแหน่งตำแหน่งและแอตทริบิวต์: JANUS-PRO-7B ยังทำงานได้ดีในการจัดตำแหน่งตำแหน่ง (90% เทียบกับ 83% ของ Dall-E 3) และการจัดตำแหน่งสี/แอตทริบิวต์ (79% สำหรับสีเทียบกับ Dall-E 3's 43%) ระบุว่ามันจะดีกว่าในการวางวัตถุอย่างถูกต้องและจับคู่สีอย่างถูกต้องในภาพที่สร้างขึ้น [2]
การจัดการพรอมต์ที่ซับซ้อน
JANUS-PRO-7B แสดงให้เห็นถึงความสามารถที่แข็งแกร่งในการจัดการพรอมต์หนาแน่นคะแนน 84.19 บนเกณฑ์มาตรฐาน DPG-Bench ซึ่งประเมินความสามารถของโมเดลในการตีความและสร้างภาพจากคำอธิบายที่ซับซ้อน Dall-E 3 ติดตามอย่างใกล้ชิดด้วยคะแนน 83.50 ** [2] [4] ความสามารถนี้มีความสำคัญสำหรับผู้ใช้ที่ต้องการการสร้างภาพที่มีรายละเอียดและเหมาะสม
ความยืดหยุ่นสร้างสรรค์กับความสมจริง
ในขณะที่ทั้ง Janus-Pro และ Dall-e 3 ได้รับการออกแบบมาเพื่อความยืดหยุ่นอย่างสร้างสรรค์ แต่ก็ตอบสนองความต้องการที่แตกต่างกันเล็กน้อย Dall-E 3 ถูกบันทึกไว้สำหรับภาพจินตนาการและนามธรรมทำให้เหมาะสำหรับการใช้งานศิลปะ ในทางตรงกันข้าม JANUS-PRO-7B มีแนวโน้มที่จะสร้างภาพที่สมจริงมากขึ้นซึ่งอาจดึงดูดผู้ใช้ที่มองหาการถ่ายภาพด้วยแสง [8] อย่างไรก็ตามมีรายงานว่ามีการดิ้นรนกับการสร้างตัวเลขมนุษย์อย่างมีประสิทธิภาพซึ่งอาจ จำกัด การบังคับใช้ในบริบทบางอย่าง [2]
ค่าใช้จ่ายและการเข้าถึง
โมเดลของ Deepseek ได้รับการขนานนามว่ามีการพัฒนาในราคาเพียงเล็กน้อยเมื่อเทียบกับคู่ตะวันตกเช่น OpenAI วิธีการที่คุ้มค่านี้อาจทำให้ JANUS-PRO สามารถเข้าถึงได้มากขึ้นสำหรับนักพัฒนาและธุรกิจที่ต้องการรวมการสร้างภาพ AI โดยไม่ต้องเสียค่าใช้จ่ายที่สำคัญ [6] [4] นอกจากนี้ Janus-Pro ยังมีอยู่ภายใต้โมเดลโอเพ่นซอร์สเพื่อให้สามารถใช้งานได้และโอกาสในการปรับแต่งที่กว้างขึ้น [3]
บทสรุป
โดยสรุป Janus-Pro-7b ของ Deepseek นำเสนอทางเลือกที่น่าสนใจสำหรับเครื่องกำเนิดภาพ AI ที่มีอยู่เช่น Dall-E 3 และการแพร่กระจายที่มั่นคง ด้วยตัวชี้วัดประสิทธิภาพที่เหนือกว่าในความแม่นยำและการจัดการที่รวดเร็วควบคู่ไปกับธรรมชาติที่มีประสิทธิภาพมันจึงวางตำแหน่งตัวเองเป็นคู่แข่งที่แข็งแกร่งในตลาดการสร้างภาพ AI อย่างไรก็ตามผู้ใช้ที่มีศักยภาพควรพิจารณาข้อ จำกัด ในการสร้างตัวเลขมนุษย์เมื่อประเมินความเหมาะสมสำหรับแอปพลิเคชันเฉพาะ
การอ้างอิง:
[1] https://www.livescience.com/technology/artificial-intelligence/deepseek-stuns-tech-industry-with-new-ai-iMage-enerator-that-beats-openais-dall-e-3
[2] https://www.prompthub.us/blog/deepseek-janus-pro-7b-model-overview-and-how-it-ranks-against-dall-e-3
[3] https://janusai.pro
[4] https://www.androidauthority.com/deepseek-janus-pro-vs-competition-3521619/
[5] https://huggingface.co/deepseek-ai/janus-pro-7b
[6] https://www.tomsguide.com/ai/deepseeks-new-ai-imager-enerator-is-here-to-take-on-midjourney-and-dall-e-we-we-wnow
[7] https://fal.ai/models/fal-ai/janus
[8] https://www.the-next-tech.com/artificial-intelligence/janus-pro-7b-vs-dall-e-3/
[9] https://www.youtube.com/watch?v=RNG-MVUN_FQ