גוגל משחררת את Gemini 1.5 עם חלון הקשר של 1M טוקנים

צוות ה-AI של גוגל היה תחת לחץ כבד לעמוד בקצב מול מודל השפה GPT-4 פורץ הדרך של OpenAI. ניסיתי את Gemini שהושק לאחרונה ואפילו שדרגתי ל-$20 לחודש עבור Gemini Advanced – עד כה, החוויה הייתה לא משהו בלשון המעטה.

גוגל הטילה פצצה – Gemini 1.5 – גרסה משופרת באופן דרמטי של מודל הדגל בינה המלאכותית שלהם.

מה חדש ב- Gemini 1.5?

Gemini 1.5 מציג שיפורים מהותיים שנועדו לטפל בחסרונות של הגרסה הראשונית:

  1. חלון הקשר של 1,000,000 טוקנים: זהו כרגע חלון ההקשר הגדול ביותר של כל מודל יסוד בקנה מידה גדול. ל-GPT-4 של OpenAI יש חלון הקשר של 128K.
  2. תגובה מהירה יותר: גוגל מאמצת את ארכיטקטורת MoE של Mixture of Experts שכנראה מפעילה את GPT-4. זה מאפשר למודל לפרק הנחיה לתת-משימות ולנתב אותן ל”מומחים” מיוחדים, מה שמגביר באופן דרמטי את היעילות והביצועים.
  3. אחזור מידע מהיר: המודל החדש מדגים יכולת משופרת משמעותית לאתר פרטים ספציפיים בתוך נפח עצום של נתוני טקסט, וידאו או אודיו.
  4. טוב יותר בקידוד: חלון ההקשר הגדול מאפשר ניתוח עמוק של בסיס קוד שלם, ועוזר למודלים של Gemini לתפוס קשרים מורכבים, דפוסים והבנה של קוד.

חלון ההקשר של 1M טוקנים

אולי הנושא המרעיד ביותר הוא השדרוג בגודל חלון ההקשר. בעוד שרוב מודלי השפה הגדולים הנוכחיים (LLMs) מוציאים לכל היותר כ-128,000 טוקנים לערך, המבנה הניסיוני של Gemini 1.5 Pro יכול לעבד מיליון טוקנים.

Gemini 1.5 חלון ההקשר של 1M טוקנים

יכולת זו מתורגמת ל:

  • סרטון של שעה
  • 11 שעות שמע
  • יותר מ-30 אלף שורות של קודים
  • יותר מ-700,000 מילים

זהו לגמרי משנה משחק – דמיינו שאתם תוכלו ״להאכיל״ את ה-LLM בתסריט לסרט שלם באורך מלא, אלפי שורות של קוד מורכב או ספר נרחב שלם. הוא מציע מספיק הקשר כדי לנתח אינטראקציות ניואנסיות, לעקוב אחר פיתוח דמויות או למצוא שגיאות קוד בקנה מידה עצום.

תחשבו על זה כהשוואה בין לבקש מצ’אט בוט לנתח שיחה של 30 שניות לעומת ניתוח מוטיבציות של דמויות על פני כל טרילוגיית שר הטבעות.

מפתחים, זה הזמן לשמוח!

כמפתח, התכונה המרשימה ביותר היא ככל הנראה היכולת להעלות מאגרי קוד שלמים ולבקש מ-Gemini לבנות מודולים שלמים תוך דקות. כמה מגניב זה?

Gemini 1.5 Pro יכול לעזור למפתחים להגביר את הפרודוקטיביות בעת לימוד בסיס קוד חדש.
Gemini 1.5 Pro יכול לעזור למפתחים להגביר את הפרודוקטיביות בעת לימוד בסיס קוד חדש. מקור: Google

בנוסף להבאת חידושי המודלים האחרונים, גוגל גם מקלה עליכם לבנות עם Gemini.

  • כוונון קל: תהיה קבוצה של דוגמאות שתוכלו להתאים אישית את Gemini לצרכים הספציפיים שלכם בתוך דקות מתוך Google AI Studio.
  • משטחי עבודה חדשים למפתחים: שלבו את ה-API של Gemini כדי לבנות תכונות חדשות המופעלות על ידי בינה מלאכותית עם הרחבות חדשות של Firebase, ברחבי סביבת העבודה והפיתוח שלכם ב-Project IDX, או עם Google AI Dart SDK החדש ששוחרר.
  • הוזלת מחיר של Gemini 1.0 Pro: הגרסה היציבה של היום מתומחרת ב-50% פחות עבור קלט טקסט ו-25% פחות עבור פלטים ממה שהוכרז בעבר. תוכניות ״תשלום לפי שימוש״ עבור AI Studio מגיעות בקרוב.

Gemini 1.5 בפעולה

ה-whitepaper של גוגל מציג מקרי שימוש מרשימים בעולם האמיתי עבור Gemini 1.5:

בדוגמה למטה, הם סיפקו את הסרט “Sherlock Jr” בן 45 הדקות של באסטר קיטון משנת 1924 (2,674 פריימים ב-1FPS, 684k טוקנים). Gemini 1.5 Pro מאחזר ומחלץ מידע טקסטואלי מפריים ספציפי ומספק את חותמת הזמן המתאימה.

האם עכשיו Gemini 1.5 שווה את השדרוג?

על הנייר, Gemini 1.5 בהחלט שווה שדרוג.

עם זאת, הרקורד האחרון של גוגל בהשקות מוצרי בינה מלאכותית מעורר חששות.

  • ההשקה הראשונה של בארד של גוגל בוטלה.
  • סרטון “ההשקה” של ג’מיני, שהיה ביסודו עריכה שיווקית, לא הראה את המוצר האמיתי וזכה לביקורת חריפה מצד רבים.
  • Gemini Ultra היה אמור להיות ממש טוב, אפילו טוב יותר מ-GPT-4, אבל בבדיקות הראשוניות הוכיחו שזה עדיין רחוק מ-GPT-4.

האם עלינו להתרגש משדרוגים שאפתניים שהוכרזו שבועות ספורים לאחר שגרסאות קודמות נכשלו? התהיות מובנות אם הדפוס הזה משקף השקות חפוזות או מאבק פנימי לעמוד בקצב.

כרגע, אומר בזהירות שאני לא סומך על שום דבר שיוצא מגוגל שאינו ניתן לבדיקה מיידית.

דברים שכדאי לזכור

  • Gemini 1.5 Pro אמור להיות ברמה של Gemini Ultra מבחינת ביצועים.
  • החל מהיום, מפתחים ולקוחות ארגוניים יכולים לגשת לתצוגה מקדימה מוגבלת של 1.5 Pro דרך AI Studio ו-Vertex AI.
  • למקרה שהתבלבלתם עם השמות, כמוני, הנה תקציר:
Gemini 1.0 Nano
Gemini 1.0 ProGemini (בחינם)
Gemini 1.0 UltraGemini Advanced (20$ לחודש)
Gemini 1.5 Proהוכרז ב- 15.02.2024
Gemini 1.5 Ultraאין עדיין הכרזה רשמית (בקרוב)

לסיכום

גוגל הפתיעה אותי. גודל חלון ההקשר – אם הוא באמת עובד כפי שפורסם – הוא די פורץ דרך.

בעוד שעדיין נדרשים מדדים מהעולם האמיתי, אין להכחיש שגוגל חזרה למשחק ומריחה דם. הלחץ הוא על OpenAI להעלות את הרף שוב.

אין חדשות עדיין מתי Gemini Pro ישוחרר לצרכנים. Gemini Ultra 1.5 כבר נמצא בקנה, ונראה שהוא עומד להיות בעל יכולת גבוהה. 1.5 Pro כבר מראה יכולות מרחיקות מאוד.

גילוי נאות:

תוכן המאמר נכתב לאחר מאמץ ומחקר על מנת לספק את התוכן האמין ביותר שניתן. כמו כן התוכן מתייחס למידע שקיים בעת שעודכן לאחרונה בתאריך: 03/03/2024, ולכן עשויים להיות שינויים ואי התאמות שחלו מאז.
כמו כן, כל המאמרים המסקרים מוצרים או שירותים כלשהם הינם מוצרים שרכשתי והתנסתי בהם בעצמי. בחלק מהמקרים אני אקשר לאתרי המוצרים באמצעות קישור שיתופי (Affiliate), שיתוף פעולה זה מאפשר לי לעיתים לספק לכם הגולשים הטבות מיוחדות ובתמורה אני מתוגמל באופן חלקי ואינו משפיע על העלות הסופית.
תודה על שיתוף הפעולה. ומקווה שהפקתם את המיטב מקריאה זו.

הגדילו את התנועה האורגנית שלכם עם SurferSEO
Jasper ai - ניסיון חינם

אולי יעניין אותך לקרוא…