ERNIE-ViLG 2.0 הוא מודל טקסט לתמונה המציע ביצועים טובים יותר מ-DALL-E-2 ו-Stable Diffusion, שניים מהמודלים הפופולריים ביותר של טקסט לתמונה הזמינים כיום. הדגם החדש תוכנן והוכשר על ידי צוות חוקרים מ-Baidu (חברת טכנולוגיה רב-לאומית סינית), והתוצאות עוצרות נשימה.
הסרטון למטה מציג את ד”ר אלן ד. תומפסון, יוטיובר ומומחה עולמי ב-AI, מנסה לבדוק ולהשוות את היכולות של 3 פלטפורמות עיקריות של טקסט לתמונה: DALL-E-2 , Stable defusion ו ERNIE-ViLG 2.0.
מודל זה פתוח לכולם לשימוש, רק נכנסים כותבים את התיארו הרצוי ולוחצים על generate image.