ChatGPT Images 2.0: המודל שסוף סוף כותב נכון בתמונות

מודלים לגנרציית תמונות סבלו מבעיית איות שנים. בקשה לעצב תפריט מסעדה מקסיקנית הסתיימה בלא מעט שגיאות מביכות. עכשיו OpenAI משנה את התמונה.

החברה השיקה השבוע את ChatGPT Images 2.0, לפי דיווח של TechCrunch, עם שיפור משמעותי ביכולת עיבוד טקסט. תפריט שנוצר על ידי המודל החדש נראה מוכן לשימוש אמיתי – קריא, מאויית נכון ועקבי חזותית.

הסיבה שמודלים ישנים כשלו בטקסט

מודלי דיפוזיה (Diffusion) משחזרים תמונות מרעש, וטקסט נתפס בהם כאשכול פיקסלים ככל אחר. מכיוון שתווים תופסים חלק קטן מכל תמונה, המודל לא למד לתעדף איות מדויק. מודלים אוטו-רגרסיביים (Autoregressive) פועלים אחרת, והם מנבאים את התמונה בצורה הדומה יותר לאופן שבו מודלי שפה מעבדים טקסט. OpenAI לא אישרה איזו ארכיטקטורה מניעה את Images 2.0.

מה המודל החדש מסוגל לעשות

OpenAI מציינת שהמודל כולל יכולות חשיבה המאפשרות לו לחפש מידע ברשת במהלך יצירת התמונה, לייצר מספר תמונות מפרומפט בודד, ולבצע בדיקה עצמית לפני שהוא מספק את הפלט.

היכולות האלה מתורגמות לשימושים מעשיים: חומרי שיווק במספר גדלים, רצועות קומיקס מרובות פאנלים, מוקאפים של ממשקי משתמש, וקומפוזיציות עמוסות עם אייקונוגרפיה קטנה – הכל ברזולוציה של עד 2K. יצירת תמונות לוקחת קצת זמן, אך פלט מורכב כמו רצועת קומיקס מתייצר תוך דקות.

המודל מטפל טוב יותר גם בכתבים שאינם לטיניים, כולל יפנית, קוריאנית, הינדית ובנגלית. מגבלה שכדאי לשים לב אליה: ידע המודל מסתיים בדצמבר 2025, מה שעשוי להשפיע על פרומפטים הקשורים לאירועים אחרונים.

גישה ומחיר

Images 2.0 נפרס מהיום לכלל משתמשי ChatGPT ו-Codex. מנויים בתשלום מקבלים גישה לאפשרויות פלט מתקדמות. OpenAI משחררת גם את ה-API של gpt-image-2, עם תמחור שמשתנה בהתאם לאיכות הפלט ולרזולוציה. למפתחים ויוצרים שבונים כלים ויזואליים, זה שווה בדיקה מיידית.

המקור המלא – ChatGPT’s new Images 2.0 model is surprisingly good at generating text

חברים יקרים!
אהבתם מה שקראתם?
אז תהיו חברים…
קבלו ישירות אליכם למייל:
חדשות, טיפים ומדריכים, מבצעים וכלי בינה מלאכותית.
השאירו שם ומייל וגם אתם לא תצטרכו לדאוג שתפספסו משהו בעולם ה-AI!
שדה זה מיועד למטרות אימות ויש להשאיר אותו ללא שינוי.
פרטיות(חובה)
This field is hidden when viewing the form
This field is hidden when viewing the form
Send this to a friend