|

Imagen 3 מחולל התמונות של גוגל – האם הוא הטוב ביותר?

Imagen 3 מחולל התמונות של גוגל - האם הוא הטוב ביותר?

חמישה חודשים לאחר ההכרזה הראשונית שלו ב-Google I/O 2024, מחולל התמונות Imagen 3 של גוגל – זמין סוף סוף ב-Gemini.

אחד השיפורים העיקריים של מודל Imagen 3 הוא יכולתו המשופרת להבין הנחיות. שיפור זה מאפשר למודל ליצור מגוון רחב של סגנונות חזותיים ולתפוס פרטים קטנים מהנחיות ארוכות ומורכבות יותר.

מה זה Imagen 3?

Imagen 3 הוא מודל הטקסט לתמונה המעודכן והאיכותי ביותר של גוגל, הכולל מספר יכולות חדשות ומשופרות.

  • יצירת תמונות עם פרטים טובים יותר, תאורה עשירה יותר ופחות חפצים מסיחים מדגמים קודמים.
  • הבנת הנחיות הכתובות בשפה טבעית ויומיומית, מה שמקל על יצירת תמונות ללא הנדסת הנחיות מורכבת.
  • יצירת תמונות במגוון רחב של פורמטים וסגנונות, מנופים פוטוריאליסטיים ועד ציורי שמן בעלי מרקם עשיר או סצנות דרמתיות.
  • עיבוד טקסט בצורה יעילה יותר ממודלים קודמים, ופותח אפשרויות חדשות למקרי שימוש כמו כרטיסי יום הולדת מסוגננים, מצגות ועוד.

גוגל מאוד ביקורתית בכל הנוגע לבטיחות.

Imagen 3 נבנה עם חידושי הבטיחות והאחריות האחרונים של Google, החל משלב פיתוח נתוני המודלים ועד לייצור התמונות.

צוות Google DeepMind השתמש בסינון נרחב ובתיוגי נתונים כדי למזער תוכן מזיק במערכי הנתונים ולהפחית את הסבירות לפלטים מזיקים.

מחויבות זו מרגיעה, במיוחד בעידן שבו ההשלכות האתיות של AI נמצאות תחת ביקורת אינטנסיבית.

איך להתנסות עם Imagen 3

יש לעבור אל הצ’אטבוט Gemini של Google, צריך להתחבר עם חשבון ה-Google שלכם ​​ולהתחיל להקליד תיאור של התמונה הרצויה.

Imagen 3 מחולל התמונות של גוגל

הקפידו להגדיר את מודל השפה ל-Gemini Advanced. אם אינכם רואים אפשרות זו, עליכם לשדרג את החשבון לתוכנית בתשלום.

הנחית תמונה:

Three women are standing together, laughing, with one woman somewhat out of focus in the foreground. The sun sets behind the women, producing lens flare and a pleasant glow. Three women are standing together, laughing, with one woman somewhat out of focus in the foreground. The sun sets behind the women, producing lens flare and a pleasant glow

תמונות שנוצרו עלי ידי Imagen 3 Google

התוצאה נראית ריאליסטית מאוד. התמונה לוכדת לא רק את הנושאים אלא גם את תנאי התאורה והניואנסים המתוארים בהנחיה.

לאחר יצירת התמונה, Gemini יציג תצוגה מקדימה במידות 512×512. על מנת לקבל את התמונה בגודל מלא, רחפו מעל הפינה הימנית העליונה של התמונה ולחצו על כפתור “הורדה בגודל מלא”.

Gemini Advanced Imagen 3 הורדה של תמונה בגודל מלא

התוצאה הסופית היא קובץ תמונה בגודל 2048×2048 בפורמט JFIF.

טיפ: אפשר לבקש מ-Gemini לשפר תמונות
כשיוצרים תמונות ב-Gemini, אין גבול לדמיון. אם מה שרואים לא ממש תואם למה שמדמיינים, פשוט מוסיפים עוד פרטים להנחיה. ככל שמוסיפים יותר פרטים, כך Gemini יוכל ליצור תמונה טובה יותר שתתאים לציפיות שלכם.

בואו ננסה דוגמה אחרת. הפעם, רציתי לראות עד כמה Imagen 3 יכול לעבד פרטים קטנים ומורכבים.

הנחית תמונה:

an amigurumi Elephant strolling in the savanna, professional shot with blurry background

תמונות שנוצרו עלי ידי Imagen 3 Google

רמת הפירוט מדהימה – המרקם של הבד הסרוג נלכד בצורה אמיתית, וטשטוש הרקע מוסיף מגע צילום מקצועי. התאורה והקומפוזיציה ממש טובים, מה שגורם לתמונה להיראות כאילו צולמה במצלמה מתקדמת.

עכשיו, בואו נראה עד כמה Imagen 3 יכול להוסיף טקסט בתוך התמונות.

הנחית תמונה:

The Word “imagen” constructed with various colorful feathers on a black background

תמונות שנוצרו עלי ידי Imagen 3 Google

עיבוד טקסט בתוך תמונות הוא כנראה אחת הבעיות הקשות ביותר איתה מתמודדים מחוללי תמונות רבים. עם זאת, Imagen 3 מתמודד עם זה בצורה מעולה. המילה “imagen” ברורה וקריאה, כשהנוצות הצבעוניות מפורטות ולא מעוותות על הרקע השחור העז.

בואו נעשה עוד אחד עם טקסט ארוך יותר ועם רקע טבעי.

The words “Google’s Imagen 3 is amazing!” constructed from numerous color stones on green grass background

תמונות שנוצרו עלי ידי Imagen 3 Google

זה מדהים! למרות המורכבות המוגברת, Gemini הצליח להציג את כל המשפט בצורה קריאה. האבנים הצבעוניות היוצרות את האותיות בולטות על רקע הדשא הירוק, והטקסטורות מוגדרות היטב.

היעדר יכולות עריכת תמונות

דבר אחד שכדאי לדעת על Imagen 3 ב-Gemini הוא שלא ניתן לבצע עריכות או שינויים ספציפיים בתוך התמונות שנוצרו (כמו שאנו התרגלנו במחוללי תמונות אחרים).

אתם לא יכולים להתאים את יחס הגובה-רוחב ואת הרזולוציה.

אין דרך להוסיף סגנונות או פילטרים.

אין יכולות inpainting או outpainting.

אנחנו תקועים עם יחס רוחב-גובה של 1:1 (מרובע) בכל התמונות שלנו.

מגבלות אלה עשויות להוות מכשול רציני עבור חלק מהמשתמשים, במיוחד לאנשי מקצוע שדורשים יותר שליטה על התפוקה הסופית. אם תכונות אלו חיוניות לזרימת העבודה שלכם, כלים כמו Leonardo AI או Midjourney עשויים להיות אלטרנטיבות מתאימות יותר.

Imagen 3 לעומת Midjourney ו- Leonardo AI

באופן טבעי, תהיו סקרנים כיצד Imagen 3 מתמודד מול מחוללי תמונות AI הפופולריים כמו Leonardo AI או Midjourney.

כדי להעמיד אותם למבחן, בידקו את הדוגמאות הבאות:

snapshot of a smiling lively positive mood woman laying on the sofa and reading a book, realistic, photo made on iPhone 11

השוואת תמונות בין Imagen 3 לעומת Midjourney ו- Leonardo AI

A soft oil painting of a fluffy cat wearing a classic red Christmas hat, peacefully sleeping near an elegant wooden window

השוואת תמונות בין Imagen 3 לעומת Midjourney ו- Leonardo AI

Polaroid photo with VSCO filter, 1990, stunning woman, night, flash photo, blonde, pretty, young face, lovely shadows, tropical plants, urban apparel, inside an apartment, DSLR, carrying a sign written in ballpoint pen on a notebook writing the words: Imagen 3

Imagen 3 מחולל התמונות של גוגל - האם הוא הטוב ביותר?

מהתוצאות האלה, באמת קשה לדעת איזה מודל תמונה הוא הטוב ביותר. כל התוצאות הללו נראות ממש טוב, וכולן עולות בקנה אחד עם ההנחיה.

מחשבות לסיכום

למרות ההייפ סביב השיחרור של Imagen 3, הניסיון שלי איתו היה שילוב של התפעלות ואכזבה קלה.

אולי זה בגלל שיש מחוללי תמונות שהם יותר חזקים ונגישים. גוגל צריכה לבנות אתר ייעודי למחוללי התמונות והוידאו במקום לשלב אותם ישירות ב-Gemini.

למרות שהוא זמין גם דרך AI Test Kitchen של גוגל או Vertex AI, הפלטפורמות הללו מיועדות רק לתכונות ניסיוניות ואינן מספקות את הפונקציונליות המלאה שהמשתמשים עשויים לצפות לה.

עם זאת, מבחינת איכות התמונה, Imagen 3 עשה כמה שיפורים ממש טובים לעומת Imagen 2. התמונות הן מהאיכותיות ביותר בתחום, והקוהרנטיות מרשימה מאוד. הלוואי שהם היו מוסיפים יותר שליטה על היבטים כמו יחס רוחב-גובה, סגנון ועריכה.

אז, האם Imagen 3 הוא מחולל תמונות AI הטוב ביותר שיש?

בהחלט יש לו את הפוטנציאל להיות, הודות לאיכות התמונה המעולה שלו והבנת השפה הטבעית שלו. עם זאת, המגבלות שלו בבקרת המשתמש והנגישות מונעות ממנו כרגע לקחת את הכתר.

גילוי נאות:

תוכן המאמר נכתב לאחר מאמץ ומחקר על מנת לספק את התוכן האמין ביותר שניתן. כמו כן התוכן מתייחס למידע שקיים בעת שעודכן לאחרונה בתאריך: 18/10/2024, ולכן עשויים להיות שינויים ואי התאמות שחלו מאז.
כמו כן, כל המאמרים המסקרים מוצרים או שירותים כלשהם הינם מוצרים שרכשתי והתנסתי בהם בעצמי. בחלק מהמקרים אני אקשר לאתרי המוצרים באמצעות קישור שיתופי (Affiliate), שיתוף פעולה זה מאפשר לי לעיתים לספק לכם הגולשים הטבות מיוחדות ובתמורה אני מתוגמל באופן חלקי ואינו משפיע על העלות הסופית.
תודה על שיתוף הפעולה. ומקווה שהפקתם את המיטב מקריאה זו.

אולי יעניין אותך לקרוא…

חברים יקרים!
אהבתם מה שקראתם?
אז תהיו חברים…
קבלו ישירות אליכם למייל:
חדשות, טיפים ומדריכים, מבצעים וכלי בינה מלאכותית.
השאירו שם ומייל וגם אתם לא תצטרכו לדאוג שתפספסו משהו בעולם ה-AI!
שדה זה מיועד למטרות אימות ויש להשאיר אותו ללא שינוי.
פרטיות(חובה)
This field is hidden when viewing the form
This field is hidden when viewing the form
חברים יקרים!
אהבתם מה שקראתם?
אז תהיו חברים…
קבלו ישירות אליכם למייל:
חדשות, טיפים ומדריכים, מבצעים וכלי בינה מלאכותית.
השאירו שם ומייל וגם אתם לא תצטרכו לדאוג שתפספסו משהו בעולם ה-AI!
שדה זה מיועד למטרות אימות ויש להשאיר אותו ללא שינוי.
פרטיות(חובה)
This field is hidden when viewing the form
This field is hidden when viewing the form
Send this to a friend