Midjourney מול DALL·E 3: איזה מחולל תמונות טוב יותר?

DALL·E 3 ו-Midjourney הם שניים ממחוללי אמנות הבינה המלאכותית הטובים ביותר שתוכלו להשתמש בהם כרגע. שניהם יכולים לקבל הנחיית טקסט וליצור סדרה של תמונות תואמות, לא משנה עד כמה הבקשה שלכם מוזרה או פרועה. DALL·E 3 הוא כנראה הפשוט ביותר להתחיל איתו, בעוד Midjourney, למרות היותו קצת מוזר לשימוש, מציע כמה מהתכונות החזקות ביותר.

אני משתמש כבר תקופה ארוכה בשני מחוללי התמונות הללו, הן באופן מקצועי והן באופן אישי, מאז שיצאו, ויש לי הרבה מה לפרוק. אז בואו נצלול פנימה.

איך פועלים DALL·E 3 ו-Midjourney?

גם DALL·E 3 וגם Midjourney אומנו על מיליוני או מיליארדי שילובי טקסט-תמונה, מה שמאפשר להם להבין מושגים כגון כלבים, כובעי נוצות או תאורה באווירה חשוכה. כך הם יכולים לנתח מה מתבקש מהם ליצור עם הנחיה כמו “ציור שמן אימפרסיוניסטי של גבר רוכב על סוס דרך יער של עצי מייפל”.

כשזה מגיע ליצירת תמונות בפועל, הם משתמשים בתהליך שנקרא דיפוזיה. הם מתחילים בשדה רעש אקראי ולאחר מכן, לאורך מספר שלבים, עורכים אותו כך שיתאים יותר לפרשנות שלהם להנחיה שלכם. זו הסיבה שאתם יכולים לקבל תוצאות שונות בכל פעם, גם אם תנסו את אותה הנחיה פעם שנייה: האקראיות של ״הזרע״ (Seed) ההתחלתי יכולה לשנות לחלוטין את התוצאה הסופית. אם לתאר את התהליך במונחים פשוטים, זה כמו להסתכל למעלה לשמים מעוננים, למצוא ענן שנראה כמו כלב, ואז להיות מסוגל להקיש באצבעות לגרום לענן להראות יותר ויותר כמו כלב אמיתי. ברור שיש הרבה מעבר לזה, אבל זו דרך לא רעה לחשוב על הדברים.

זה ששני המודלים משתמשים בטכניקה דומה ליצירת תמונות, לא אומר שאתם תקבלו תוצאות דומות גם מ-DALL·E וגם מ-Midjourney. האופן שבו כל מודל מפרש את ההנחיה שלכם, המשקל שהוא מטיל על הפרמטרים השונים, הנתונים עליהם הוכשרו והדיסיפלינות של החברות האחראיות לפיתוח שלהם, כולם משפיעים באופן מסיבי על איך תראה התמונה.

כך DALL·E 3 פירש את ההנחיה שלי:

A man riding a horse through a maple forest in the style of an impressionist painting.
DALL·E 3 בתוך ChatGPT - דוגמא ליצירת תמונה

וכך נראית התוצאה מ-Midjourney:

Midjourney - דוגמא ליצירת תמונה

כפי שאפשר לראות, DALL·E 3 עשה עבודה טובה בפירוש ההנחיה והצגת התמונה, אם כי במקרה זה, התפוקה של Midjourney נראית הרבה יותר כמו ציור אימפרסיוניסטי אמיתי.

אני אצלול הרבה יותר לעומק ההבדלים תוך כדי תנועה, אז אל תיקחו את התוצאות האלה כניצחון עבור אף אחד מהשניים כרגע.

DALL·E 3 לעומת Midjourney במבט חטוף

DALL·E 3 ו-Midjourney עושים דברים דומים, אבל יש כמה הבדלים גדולים ביניהם. לחסרי הסבלנות להלן תקציר של ההבדלים העיקירים, אך תמשיכו לקרוא לקבלת פירוט מפורט יותר.

breakdown. 

DALL·E 3Midjourney
איכות⭐⭐⭐⭐⭐
תמונות בינה מלאכותית נהדרות ומדויקות באופן שעוקבות אחר ההנחיה.
⭐⭐⭐⭐
תמונות בינה מלאכותית מהטובות שניתן למצוא, אך לעיתים מחמיצה חלקים מהותיים בהנחיה.
קלות השימוש⭐⭐⭐⭐⭐
מהפשוטים ביותר לתפעול – דיאלוג עם צ׳אטבוט
⭐⭐
מסורבל לשימוש, עקומת לימוד תלולה
שליטה ועוצמה
אפשרויות מוגבלות מאוד מעבר לבקשה בצ’אט להפעיל שוב הנחיה קצת שונה
⭐⭐⭐⭐⭐
אפשרויות הנחיה ועריכה מהטובות שקיימות בתחום
עלותחינם למשתמשים דרך Bing, או בעלות חודשית של 20$ למנויים על ChatGPT Plus.תשלום החל מ-10$ לחודש.

DALL·E 3 קל יותר לשימוש

DALL·E 3 זמין דרך ChatGPT, Bing Image Creator, Microsoft Paint ושירותים אחרים באמצעות ה-API שלו. כולם מציעים חוויה דומה בגדול, אם כי ChatGPT הוא האפשרות הרשמית וגם הכי נוח לשימוש, אז אתמקד בעיקר בו לצורך השוואה זו. עם זאת, אתם צריכים להיות מנויים על ChatGPT Plus כדי לגשת אליו. אז אם אין לכם מנוי, תבדקו את אחת האפשרויות החינמיות האחרות.

למרות שישנן מספר דרכים לגשת ל-DALL·E 3, כולן פועלות במידה רבה אותו הדבר, וכולן פשוטות ביותר: אתם פשוט מבקשים מ-DALL·E 3 ליצור עבורכם תמונה – ככה קל.

DALL-E 3 ב-ChatGPT מייצר שתי תמונות של זאב רץ ביער

Midjourney, לעומת זאת, מוזר לשימוש כבר מההתחלה. אין לו אפליקציית אינטרנט. במקום זאת, עליכם לגשת אליו דרך Discord, אפליקציית צ’אט. זה לא מסובך להירשם לחשבון Discord ולהצטרף לשרת של Midjourney, אבל זו עדיין דרך מוזרה לגשת למחולל תמונות בינה מלאכותית.

Midjourney מייצר תמונות של זאב רץ ביער

אי הנוחות לשימוש בא לידי ביטוי גם בממשק ההנחיה של Midjourney. במקום לקבל ממשק הגיוני ונחמד, עליכם להנחות את Midjourney Discord Bot על ידי הקלדת /imagine /<your prompt> בהודעה ישירה או בערוץ ציבורי. וזה עוד לפני שהתחלנו להסתכל על הפרמטרים החריגים ותכונות הרמיקס השונות בהן תוכלו להשתמש כדי לשלוט טוב יותר בתוצאות שתקבלו.

אפשרויות עריכה ב-Midjourney

אז למען האמת, אם אתם מחפשים רק לנסות מחולל תמונות, DALL·E 3 הוא הרבה יותר פשוט להתחיל איתו.

Midjourney הרבה יותר עוצמתי

למרות הסרבול שלו, מידג’רני עדיין מספק הרבה יותר אפשרויות. הוא כנראה מחולל תמונות הבינה המלאכותית החזק ביותר שזמין כרגע, לפחות אם אינכם מוכנים לאמן מודל מותאם אישית שלכם.

נתחיל עם הפרמטרים. יש כאן מדריך מלא. בעיקרון יש להקליד -- ואחריה הפקודה הרלוונטית, תוכלו לשלוט בדברים כמו יחס הגובה-רוחב של התמונות שלכם, שליטה בסגנון, איכות, ואפילו יצירה של ״אריחים״ חוזרים עבור תבניות.

ויש גם כלים שמאפשרים לכם לשדרג, לגוון ולערוך את התמונות שלכם. לאחר הפעלת הנחיה, מוצגות בפניכם שתי קבוצות של ארבעה לחצנים: U1, U2, U3 ו-U4, אשר משדרגים את התמונה המתאימה לרוחב של 1024px, ו-V1, V2, V3 ו-V4, אשר מריצים מחדש את הנחיה ליצירת וריאציות נוספות על סמך התמונה המתאימה.

אפשרויות הגדלה והפעלה מחדש ב-Midjourney

לאחר שתגדילו את התמונה, תוכלו להגדיל אותה שוב לרוחב של 2048 פיקסלים – או אפילו לרוחב של 4096 פיקסלים באמצעות הלחצנים Upscale (2x) או Upscale (4x). אתם יכולים ליצור וריאציות נוספות שתואמות היטב את תמונת ההתחלה עם Vary (Subtle) עדין, או עם Vary (Strong) חזק. אפשר אפילו לשנות חלקים ספציפיים של התמונה באמצעות Vary (Region).

עריכת רק חלק מתמונה ב-Midjourney

הלחצנים Zoom Out ו-Pan (החצים הכחולים) מאפשרים לכם להרחיב את היצירה שלכם מעבר לגבולותיה. הפעילו את מצב Remix mode, וכך תקבלו אפילו יותר שליטה, כך שתוכלו לשנות את ההנחיה שלכם בכל פעם שתעשו וריאציות.

אפשרות זום אאוט ב-Midjourney

וזה עוד לפני שבכלל דיברנו על תכונות כמו שימוש בתמונה אחרת לצורך הנחיה או מיזוג (Blend) כמה תמונות יחד, המאפשרת לכם לשלב את “הקונספט והאסתטיקה” של מספר תמונות שאתם מעלים.

הזאב בתמונה הופך כעת לכלב ב-Midjourney

DALL·E 3 לא מתקרב אפילו למגוון התכונות הללו. אמנם תקבלו קצת שליטה על יחס הגובה-רוחב, אבל כל השאר מסתמך רק על כך ש-ChatGPT יפעיל מחדש הנחיה קצת אחרת. אפילו הכלי של Bing שמשתמשים ב-DALL·E 3 לא נותנים לכם הרבה יותר אפשרויות. היחידים שיש לציין הם ש-Image Creator המאפשר לכם לייבא את התמונה שלכם ישירות ל-Microsoft Designer, ו-Paint מאפשר לכם ליצור תמונות באפליקציה, כך שתוכלו לערוך אותן (או לפחות לצייר מעל הדף).

כשתשתמשו ב-ChatGPT כדי לבקש עריכות, הוא פשוט יוצר תמונות חדשות עם הנחיה חדשה.

DALL-E 3 משנה את התמונה כאשר מתבקשים לערוך

למרבה הפלא, דווקא DALL·E 2 מתקרב ל-Midjourney ביכולות העריכה. גירסה זו לפחות מאפשרת לכם לבצע inpaint (שינוי ועריכה של החלקים הפנימיים של תמונה) ו-outpaint (הוספת תוכן מעבר לגבולות התמונה). מודל זה לא כל כך טוב ביכולות שלו, אבל יש לכם קצת יותר שליטה.

DALL·E 3 וגם Midjourney יוצרים תמונות בינה מלאכותית נהדרות

עם כל ההשוואה הנ״ל, גם DALL·E 3 וגם Midjourney מסוגלים ליצור תמונות מדהימות. DALL·E 3 מהיר וקל יותר לשימוש, אך יש לכם פחות שליטה על התוצאות. Midjourney הוא קצת מוזר לשימוש ולא עקבי לפעמים, אבל יש לכם הרבה יותר שליטה על איך הדברים נראים.

ובכל זאת, יש כמה הבדלים שכדאי לשים לב אליהם. DALL·E 3 שמשתלב בתוך ChatGPT, עושה עבודה נהדרת בפירוש הנחיות. הוא מתמודד טוב יותר עם הנחיות קצרות וגם ארוכות ומסובכות יותר.

זה לא ש-Midjourney מתבלבל לעתים קרובות, אבל הוא דורש הרבה יותר ניווט ופקודות. גיליתי לעיתים, שבמקום לכתוב תיאורים ארוכים עדיף להנחות אותו עם סדרה של מילות מפתח.

שימוש בצירוף של מילות מפתח להנחיה ב-Midjourney

כמו כן, בגלל שיש לו כלי עריכה טובים, אפשר להסתפק בתוצאה הראשונה ולאחר מכן להשתמש ברמיקס, וריאציות וכלים אחרים כדי ליצור תמונה סופית שתהיו מרצים ממנה.

המחיר תלוי בצרכים שלכם

התמחור של DALL·E 3 הוא סופר פשוט: הוא עולה $20 לחודש כחלק ממנוי ChatGPT Plus, או שניתן לגשת אליו בחינם כחלק מכלים שונים של מיקרוסופט, אם כי חלק מהם ישאירו סימן מים על התמונות שלכם. ככל הידוע, אין מגבלה לכמות התמונות שניתן ליצור בכל יום או חודש עם DALL·E 3, אבל יש להניח שמגבלות כלשהן קיימות כדי למנוע מאנשים ליצור תמונות ללא הפסקה.

ל- Midjourney אין אפשרות חינמית, אבל התוכנית הבסיסית מתחילה ב-$10 לחודש ומאפשרת לכם כ-200 דקות של זמן GPU. וזה, כמובן, המקום שבו הדברים נהיים מעורפלים. Midjourney טוענים שזה מאפשר לכם כ-200 הנחיות בחודש, אבל זה תלוי לחלוטין במה אתם מבקשים ממנו לעשות. אם אתם יוצרים המון וריאציות ומגדילים את כולן לגודל המקסימלי, אתה ״תשרפו״ את שעות ה-GPU האלה מהר יותר מאשר אם תיצרו הרבה תמונות ברזולוציה נמוכה.

Midjourney תימחור

וכדי להפוך את הדברים למורכבים יותר, החל מהתוכנית הסטנדרטית של $30 לחודש, תקבלו יותר שעות להנחיות בזמן עיבוד מהיר, אבל אתם יכולים ליצור תמונות ללא הגבלה במצב Relax – שפועל רק כשיש כוח עיבוד GPU פנוי.

בהתחשב בכל התכונות הנוספות ששתי האפליקציות מביאות, אני מאוד נמנע מלשפוט בין DALL·E 3 ל-Midjourney על סמך המחיר בלבד. אם זה עונה על הצרכים שלכם, תוכנית Midjourney ב-$10 לחודש היא כנראה האיזון הטוב ביותר בין תכונות ומחיר, ותוכלו להשתמש ב-DALL·E 3 בחינם דרך Bing Image Creator, או תמורת $20 לחודש כחלק מ-ChatGPT Plus – אשר מספקות לכם את התכונות המתקדמות במחולל התוכן של ChatGPT.

מעוניינים למצוא את השילוב המנצח תבקרו בסקירה שם רשימת: כלי בינה מלאכותית הטובים ביותר ליצירת תמונות.

השימוש המסחרי הוא מסובך

במידה ואתם מתכננים להשתמש ב-DALL·E 3 או ב-Midjourney לשימוש מסחרי, הדברים מסתבכים מעט. שני המודלים מאפשרים שימוש מסחרי (למעט השימוש ב-DALL·E 3 דרך Microsoft), אבל ההיבטים המשפטיים המלאים לא באמת נבחנו לעומק עד כה.

בפסק דין בפברואר 2023, משרד זכויות היוצרים האמריקני החליט שלא ניתן לספק זכויות יוצרים על תמונות שנוצרו באמצעות Midjourney, בנוסף למחוללי תמונות AI אחרים. זה בעיקרון אומר שיש לכם מעט בסיס לטיעון במידה שמישהו לוקח את התמונות שלכם ומשתמש בהן בדרכים שאתם לא מעוניינים. מבחינה טכנית, שימוש בתמונה של מישהו אחר נוגד את תנאי השירות של Midjourney, אבל זה לא בדיוק הגנה משפטית חזקה אם אתם מנסים לבנות מותג או ליצור עיצובי דמויות באמצעות האפליקציה. המקסימום ש-Midjourney עשוי לעשות הוא לחסום את מי שלקח את התמונות שלכם.

מנקודת מבט טכנית, סביר להניח שאמליץ על Midjourney במידה וחשבת על יצירת רווחים מיצירות הבינה המלאכותית שלכם, פשוט כי המודל שלו מאפשרים לכם יותר חופש. DALL·E 3 פשוט יחסום אתכם מיד מליצור כמות גדולה מאוד של תוכן, כולל תמונות של אישי ציבור.

Midjourney הוא מוזר

מכיוון שניסיתי להשוות בין DALL·E 3 לבין Midjourney בצורה הגיונית ככל האפשר, יש עוד קטעים מוזרים עם Midjourney שלא הספקתי לגעת בהם. שלושה מהעיקריים שיש לשים לב אליהם הם:

  • למעט תוכנית Pro בעלות של $60 לחודש עם מצב Stealth Mode מופעל, כל התמונות שלכם מתפרסמות אוטומטית בגלריית החברים של Midjourney, שם כל אחד יכול לראות אותן, להוריד אותן ולהעתיק את ההנחיות שלכם.
  • כל הגדרה ותכונה מטופלת באמצעות פקודות לבוט של Discord. וזה תמיד יהיה מוזר.
  • בנוסף למודלים הסטנדרטיים, ל-Midjourney יש מודל ספציפי שמיועד ליצירות אנימה בשם Niji שתוכלו להפעיל על ידי הוספת --niji 5 לסוף הנחיה או על ידי הקלדת /settings ובחירה במודל זה במקום המודל V5.

מסמכי העזרה של Midjourney ממש טובים, ומעולם לא נתקלתי בקשיים אמיתיים עם Midjourney, אבל מדגיש שהשימוש בו מוזר ומסורבל יחסית לאפליקציה טיפוסית יותר. יש שמועות שהם מפתחים אפליקציית ייעודית חדשה, אז אני מחכה בהתרגשות לנסות אותה.

DALL·E או Midjourney: באיזה כדאי להשתמש?

הבחירה בין DALL·E 3 ל-Midjourney צריכה להיות פשוטה יחסית עבור רוב האנשים:

אם אתם רוצים את מחולל תמונות הבינה המלאכותית הטוב ביותר שזמין כרגע, מעוניינים לכוונן, לערוך ולחדד את התמונות שלכם, ואין לכם בעיה להתרגל לכל המוזרויות שלו, Midjourney היא בחירה מצוינת.

אם אתה רוצים את האפשרות הקלה שמפיקה באופן מהימן תוצאות מעולות, DALL·E 3 הוא מה שאתם צריכים.

לחלופין, אתם מוזמנים לבדוק את המדריך המלא עם רשימת: כלי בינה מלאכותית הטובים ביותר ליצירת תמונות.

גילוי נאות:

תוכן המאמר נכתב לאחר מאמץ ומחקר על מנת לספק את התוכן האמין ביותר שניתן. כמו כן התוכן מתייחס למידע שקיים בעת שעודכן לאחרונה בתאריך: 26/12/2023, ולכן עשויים להיות שינויים ואי התאמות שחלו מאז.
כמו כן, כל המאמרים המסקרים מוצרים או שירותים כלשהם הינם מוצרים שרכשתי והתנסתי בהם בעצמי. בחלק מהמקרים אני אקשר לאתרי המוצרים באמצעות קישור שיתופי (Affiliate), שיתוף פעולה זה מאפשר לי לעיתים לספק לכם הגולשים הטבות מיוחדות ובתמורה אני מתוגמל באופן חלקי ואינו משפיע על העלות הסופית.
תודה על שיתוף הפעולה. ומקווה שהפקתם את המיטב מקריאה זו.

הגדילו את התנועה האורגנית שלכם עם SurferSEO
Jasper ai - ניסיון חינם

אולי יעניין אותך לקרוא…

כיצד להשתמש ב-ChatGPT למסחר אלקטרוני

כיצד להשתמש ב-ChatGPT למסחר אלקטרוני: 10 רעיונות גאוניים לצמיחה בלתי ניתנת לעצירה

ברוכים הבאים למדריך שלי על איך להשתמש ב-ChatGPT למסחר אלקטרוני! מכירות במסחר האלקטרוני צפויות להגיע לסכום מדהים של 5.8 טריליון…
המשך קריאה כיצד להשתמש ב-ChatGPT למסחר אלקטרוני: 10 רעיונות גאוניים לצמיחה בלתי ניתנת לעצירה