נדמה שכל כמה ימים כלי AI חדש מתווסף בדרכו לשנות את העולם. בסוף השבוע הכריזה Midjourney, הכלי לייצור תמונות מטקסט, על הגרסה החמישית של התוכנה. הגרסה החדשה מהווה קפיצת מדרגה ביכולת של התוכנה לייצר תמונות פוטו-ריאליסטיות, לייצר מרקמים שונים בצורה ריאליסטית יותר, והיא אפילו פתרה את אחת הבעיות הגדולות של התוכנה - היא מציירת בני אדם עם חמש אצבעות בידיים.
Midjourney v5 it's awesome.
— Javi Lopez ⛩️ (@javilopen) March 18, 2023
If someone had told us a year ago that from a mere text description an AI (like #midjourney) would be able to generate images like this, we wouldn't have believed it.
It's an extraordinary paradigm shift! pic.twitter.com/7kOjvd8wO4
גרסה החדשה זמינה כבר עכשיו למשתמשי Midjourney משלמים, והיא נמצאת גרסת האלפא שלה. ההתמקדות בגרסה החדשה סובבת סביב היכולת של התוכנה לייצר סגנונות שונים ומגוונים יותר, ולספק יותר אפשרויות למשתמשים. אבל את עיקר תשומת הלב רשמה ההשתפרות ביכולת של Midjourney לייצר תמונות פוטו-ריאליסטיות, עם טקסטורות מדויקות יותר, כולל הטקסטורה של עור אנושי. בנוסף, התוכנה יכולה לייצר עכשיו בני אדם נכונים יותר מבחינה אנטומית, ובכך פתרה את בעיית הציור של ידיים או רגליים מעוותות.
הגרסה החדשה אמורה לפתור גם בעיה של קומפוזיציה. עד כה, Midjourney סיפקה קומפוזיציות שנראו לא טבעיות או ללא קשר בין האובייקטים השונים בפריים, במיוחד בתמונות שכללו אובייקטים רבים. עכשיו, המפתחים של התוכנה טוענים שיש שיפור משמעותי בתוצרים החדשים. התמונות מרגישות טבעיות יותר, והאובייקטים מרגישים מונחים במקומם ולא מפוזרים או מתנגשים אחד בשני.
Midjourney v5 is here! (for real this time, lol)
— Nick St. Pierre (@nickfloats) March 15, 2023
Here are some side-by-sides of my prompts, v4 vs v5, as well as some new prompts and crowd shots. I'll add more to this as I experiment.
pic.twitter.com/qSEZWQBXou
חלק מהמשתמשים שניסו את התוכנה החדשה מדווחים שהיא מייצרת תמונות חדות יותר ומדויקות יותר. "זה כמו להרכיב משקפיים", אמרה משתמשת אחת בטוויטר. שיפור נוסף שמלהיב את המשתמשים היא היכולת של Midjourney לייצר תמונות בגדלים שונים. רבים מהמשתמשים שניסו את התוכנה בימים האחרונים טוענים שהיא מספקת ביצועים מרשימים יותר בהרבה מהמתחרה הגדולה שלה, Dall-E של חברת OpenAI, שהיתה הראשונה לפרוץ ככלי ליצירת תמונות מטקסטים.