גוגל משחררת את Gemini 1.5 עם חלון הקשר של 1M טוקנים

צוות ה-AI של גוגל היה תחת לחץ כבד לעמוד בקצב מול מודל השפה GPT-4 פורץ הדרך של OpenAI. ניסיתי את Gemini שהושק לאחרונה ואפילו שדרגתי ל-$20 לחודש עבור Gemini Advanced – עד כה, החוויה הייתה לא משהו בלשון המעטה.

תוכן המאמר

מה חדש ב- Gemini 1.5?
חלון ההקשר של 1M טוקנים
מפתחים, זה הזמן לשמוח!
Gemini 1.5 בפעולה
האם עכשיו Gemini 1.5 שווה את השדרוג?
דברים שכדאי לזכור
לסיכום

גוגל הטילה פצצה – Gemini 1.5 – גרסה משופרת באופן דרמטי של מודל הדגל בינה המלאכותית שלהם.

מה חדש ב- Gemini 1.5?

Gemini 1.5 מציג שיפורים מהותיים שנועדו לטפל בחסרונות של הגרסה הראשונית:

חלון הקשר של 1,000,000 טוקנים: זהו כרגע חלון ההקשר הגדול ביותר של כל מודל יסוד בקנה מידה גדול. ל-GPT-4 של OpenAI יש חלון הקשר של 128K.
תגובה מהירה יותר: גוגל מאמצת את ארכיטקטורת MoE של Mixture of Experts שכנראה מפעילה את GPT-4. זה מאפשר למודל לפרק הנחיה לתת-משימות ולנתב אותן ל”מומחים” מיוחדים, מה שמגביר באופן דרמטי את היעילות והביצועים.
אחזור מידע מהיר: המודל החדש מדגים יכולת משופרת משמעותית לאתר פרטים ספציפיים בתוך נפח עצום של נתוני טקסט, וידאו או אודיו.
טוב יותר בקידוד: חלון ההקשר הגדול מאפשר ניתוח עמוק של בסיס קוד שלם, ועוזר למודלים של Gemini לתפוס קשרים מורכבים, דפוסים והבנה של קוד.

מודל השפה המתקדם ביותר של גוגל Gemini 1.5 Pro שוחרר ממש לאחרונה וטוען להיות המודל הטוב ביותר בעולם כרגע.
לצד יכולות מדהימות כגון: יכולת לקרוא ולהבין מספר מאמרים, סרטונים ארוכים ובסיס קוד שלם.
גם מעורר מחלוקת בנתוני האימון שלו והתשובות שלו.
בואו נבחן כמה דוגמאות שצצו ברחבי הרשת: pic.twitter.com/B9feeyu7wX
— Tal Kenty Katz (@KentyKatz) February 27, 2024

חלון ההקשר של 1M טוקנים

אולי הנושא המרעיד ביותר הוא השדרוג בגודל חלון ההקשר. בעוד שרוב מודלי השפה הגדולים הנוכחיים (LLMs) מוציאים לכל היותר כ-128,000 טוקנים לערך, המבנה הניסיוני של Gemini 1.5 Pro יכול לעבד מיליון טוקנים.

יכולת זו מתורגמת ל:

סרטון של שעה
11 שעות שמע
יותר מ-30 אלף שורות של קודים
יותר מ-700,000 מילים

זהו לגמרי משנה משחק – דמיינו שאתם תוכלו ״להאכיל״ את ה-LLM בתסריט לסרט שלם באורך מלא, אלפי שורות של קוד מורכב או ספר נרחב שלם. הוא מציע מספיק הקשר כדי לנתח אינטראקציות ניואנסיות, לעקוב אחר פיתוח דמויות או למצוא שגיאות קוד בקנה מידה עצום.

תחשבו על זה כהשוואה בין לבקש מצ’אט בוט לנתח שיחה של 30 שניות לעומת ניתוח מוטיבציות של דמויות על פני כל טרילוגיית שר הטבעות.

מפתחים, זה הזמן לשמוח!

כמפתח, התכונה המרשימה ביותר היא ככל הנראה היכולת להעלות מאגרי קוד שלמים ולבקש מ-Gemini לבנות מודולים שלמים תוך דקות. כמה מגניב זה?

Gemini 1.5 Pro יכול לעזור למפתחים להגביר את הפרודוקטיביות בעת לימוד בסיס קוד חדש. מקור: Google

בנוסף להבאת חידושי המודלים האחרונים, גוגל גם מקלה עליכם לבנות עם Gemini.

כוונון קל: תהיה קבוצה של דוגמאות שתוכלו להתאים אישית את Gemini לצרכים הספציפיים שלכם בתוך דקות מתוך Google AI Studio.
משטחי עבודה חדשים למפתחים: שלבו את ה-API של Gemini כדי לבנות תכונות חדשות המופעלות על ידי בינה מלאכותית עם הרחבות חדשות של Firebase, ברחבי סביבת העבודה והפיתוח שלכם ב-Project IDX, או עם Google AI Dart SDK החדש ששוחרר.
הוזלת מחיר של Gemini 1.0 Pro: הגרסה היציבה של היום מתומחרת ב-50% פחות עבור קלט טקסט ו-25% פחות עבור פלטים ממה שהוכרז בעבר. תוכניות ״תשלום לפי שימוש״ עבור AI Studio מגיעות בקרוב.

Gemini 1.5 בפעולה

ה-whitepaper של גוגל מציג מקרי שימוש מרשימים בעולם האמיתי עבור Gemini 1.5:

בדוגמה למטה, הם סיפקו את הסרט “Sherlock Jr” בן 45 הדקות של באסטר קיטון משנת 1924 (2,674 פריימים ב-1FPS, 684k טוקנים). Gemini 1.5 Pro מאחזר ומחלץ מידע טקסטואלי מפריים ספציפי ומספק את חותמת הזמן המתאימה.

Gemini 1.5 Pro can perform highly-sophisticated understanding & reasoning tasks for different modalities, including video. 📹

When given a 44-minute silent Buster Keaton film, it can analyze various plot points, and even reason about small details that could easily be missed. ↓ pic.twitter.com/62hOoNIlWj
— Google DeepMind (@GoogleDeepMind) February 19, 2024

האם עכשיו Gemini 1.5 שווה את השדרוג?

על הנייר, Gemini 1.5 בהחלט שווה שדרוג.

עם זאת, הרקורד האחרון של גוגל בהשקות מוצרי בינה מלאכותית מעורר חששות.

ההשקה הראשונה של בארד של גוגל בוטלה.
סרטון “ההשקה” של ג’מיני, שהיה ביסודו עריכה שיווקית, לא הראה את המוצר האמיתי וזכה לביקורת חריפה מצד רבים.
Gemini Ultra היה אמור להיות ממש טוב, אפילו טוב יותר מ-GPT-4, אבל בבדיקות הראשוניות הוכיחו שזה עדיין רחוק מ-GPT-4.

האם עלינו להתרגש משדרוגים שאפתניים שהוכרזו שבועות ספורים לאחר שגרסאות קודמות נכשלו? התהיות מובנות אם הדפוס הזה משקף השקות חפוזות או מאבק פנימי לעמוד בקצב.

כרגע, אומר בזהירות שאני לא סומך על שום דבר שיוצא מגוגל שאינו ניתן לבדיקה מיידית.

דברים שכדאי לזכור

Gemini 1.5 Pro אמור להיות ברמה של Gemini Ultra מבחינת ביצועים.
החל מהיום, מפתחים ולקוחות ארגוניים יכולים לגשת לתצוגה מקדימה מוגבלת של 1.5 Pro דרך AI Studio ו-Vertex AI.
למקרה שהתבלבלתם עם השמות, כמוני, הנה תקציר:

Gemini 1.0 Nano
Gemini 1.0 Pro	Gemini (בחינם)
Gemini 1.0 Ultra	Gemini Advanced (20$ לחודש)
Gemini 1.5 Pro	הוכרז ב- 15.02.2024
Gemini 1.5 Ultra	אין עדיין הכרזה רשמית (בקרוב)

לסיכום

גוגל הפתיעה אותי. גודל חלון ההקשר – אם הוא באמת עובד כפי שפורסם – הוא די פורץ דרך.

בעוד שעדיין נדרשים מדדים מהעולם האמיתי, אין להכחיש שגוגל חזרה למשחק ומריחה דם. הלחץ הוא על OpenAI להעלות את הרף שוב.

אין חדשות עדיין מתי Gemini Pro ישוחרר לצרכנים. Gemini Ultra 1.5 כבר נמצא בקנה, ונראה שהוא עומד להיות בעל יכולת גבוהה. 1.5 Pro כבר מראה יכולות מרחיקות מאוד.

גוגל משחררת את Gemini 1.5 עם חלון הקשר של 1M טוקנים

מה חדש ב- Gemini 1.5?

חלון ההקשר של 1M טוקנים

מפתחים, זה הזמן לשמוח!

Gemini 1.5 בפעולה

האם עכשיו Gemini 1.5 שווה את השדרוג?

דברים שכדאי לזכור

לסיכום

אולי יעניין אותך לקרוא…

The Creator (היוצר) – סרט קולנוע מד”ב במבט מרגש על בינה מלאכותית

OpenAI משיקה מודל חדש o3-mini – גם משתמשי ChatGPT בחינם יכולים לנסות אותו

Midjourney: נתונים סטטיסטיים מרתקים לשנת 2024

איך בינה מלאכותית השתלטה על סופרבול 2025

מחוללי תמונות AI הטובים ביותר שתרצו לנסות בשנת 2025

Meta AI: מה זה Llama 3.1 ולמה זה משנה?

ניווט באתר

DeepSeek AI דיפסיק

PhotoRoom

Photopea

GPTzero

צאט גיפיטי Chat GPT

Luminar Neo