גוגל משיקה את Gemini, מודל הבינה המלאכותית החזקה ביותר שלה

למעלה מעשור שגוגל הציבה את הבינה המלאכותית בראש סדר העדיפויות שלה. עכשיו, שנה לתוך עידן הבינה המלאכותית שהביא לנו ChatGPT, גוגל סוף סוף עושה מהלך גדול אמיתי.

תחילתו של עידן חדש של AI בגוגל, כך אמר המנכ”ל סונדאר פיצ’אי: עידן הג’מיני. Gemini הוא מודל השפה הגדול העדכני של גוגל, שפיצ’אי הציג אותו לראשונה בכנס מפתחי I/O ביוני האחרון, ועכשיו הוא משיק אותו לקהל הרחב.

סונדאר פיצ’אי ומנכ”ל Google DeepMind, דמיס הסביס, מתארים זאת כקפיצת מדרגה ענקית במודל AI שישפיע בסופו של דבר על כמעט כל המוצרים של גוגל. “אחד הדברים העוצמתיים ברגע הזה”, אומר פיצ’אי, “הוא שאתה יכול לעבוד על טכנולוגיה בסיסית אחת ולשפר אותה והיא משפיעה באופן מיידי מיד פני כל המוצרים שלנו”.

Gemini הוא יותר ממודל AI יחיד. יש גרסה קלה יותר בשם Gemini Nano שנועדה לפעול באופן טבעי ולא מקוון במכשירי אנדרואיד. יש גרסה חזקה יותר בשם Gemini Pro שתפעיל בקרוב הרבה שירותי בינה מלאכותית של גוגל ומהווה את עמוד השדרה של Bard החל מהיום. וישנו דגם בעל יכולת אפילו יותר חזקות בשם Gemini Ultra שהוא ה-LLM החזק ביותר שגוגל יצרה עד כה, ונראה שהוא מיועד בעיקר למרכזי נתונים ויישומים ארגוניים.

גוגל משיקה את המודל בכמה דרכים ברגע זה: Bard מופעל כעת על ידי Gemini Pro, ומשתמשי Pixel 8 Pro יקבלו כמה תכונות חדשות הודות ל-Gemini Nano. (Gemini Ultra יגיע בשנה הבאה).

מפתחים ולקוחות ארגוניים יוכלו לגשת ל-Gemini Pro דרך Google Generative AI Studio או Vertex AI ב-Google Cloud החל מה-13 בדצמבר. Gemini זמין רק באנגלית לעת עתה, כאשר שפות אחרות יגיעו כנראה בקרוב. אבל פיצ’אי אומר שהמודל ישולב בסופו של דבר במנוע החיפוש של גוגל, מוצרי הפרסום שלה, דפדפן כרום ועוד, בכל רחבי העולם. זה העתיד של גוגל, והוא כאן כדי להישאר.

גוגל משיקה את מודל Gemini בכמה גרסאות
בתחילה, Gemini מגיע בשלושה גדלים, המיועדים לשלוש מטרות שונות. תמונה: Google

OpenAI השיקה את ChatGPT לפני שנה, והחברה והמוצר הפכו מיד לשמות הגדולים ביותר בעולם הבינה המלאכותית. עכשיו, גוגל – החברה שפיתחה חלק גדול מהטכנולוגיה הבסיסית מאחורי סערת הבינה המלאכותית הנוכחית, ואפילו כינתה את עצמה ארגון “AI-first” כבר כמעט עשור. שנתפסה באופן מביך אל מול הפריצה המהירה והשליטה של ChatGPT על התעשייה – גוגל סוף סוף מוכנה להילחם בחזרה.

גוגל טוענת ש-Gemini מנצחת את GPT-4 ב-30 מתוך 32 מדדים שנבחנו

אז בואו נגיע לשאלה החשובה, נכון? ה-GPT-4 של OpenAI מול ה-Gemini של גוגל. זה היה ברור מאוד בראשה של גוגל במשך זמן מה. “עשינו ניתוח מאוד יסודי של המערכות זו לצד זו, ואת ההשוואה”, אומר הסביס. גוגל הריצה 32 בנצ’מרקים מבוססים שהשוו בין שני המודלים, מבדיקות כוללות רחבות כמו מדד Multi-Task Language Understanding ועד בדיקה שמשווה את היכולת של שני המודלים ליצור קוד ב-Python. “אני חושב שאנחנו מקדימים באופן משמעותי ב-30 מתוך 32” מהמדדים האלה, אומר הסביס. “חלקם צמודים מאוד. חלקם גדולים יותר”.

באמות מידה אלה (שבאמת קרובות מאוד) היתרון הברור ביותר של Gemini נובע מהיכולת שלו להבין ולתקשר עם וידאו ואודיו. זהו חלק מהותי בתכנון: מולטי-מודאליות הייתה חלק מתוכנית Gemini מההתחלה. גוגל לא הכשירה מודלים נפרדים לתמונות וקול, כמו ש-OpenAI יצרה את DALL-E ו-Whisker; גוגל בנתה מודל רב-חושי אחד מההתחלה. “תמיד התעניינו במערכות מאוד מאוד רחבות”, אומר הסביס. הוא מתעניין במיוחד כיצד לערבב את כל המצבים הללו – לאסוף נתונים רבים ככל האפשר מכל גורם אפשרי ואז לתת תגובות במגוון גדול באותה מידה.

Gemini: Explaining reasoning in math and physics

“המודלים האלה פשוט מבינים טוב יותר את העולם שסביבם”

נכון לעכשיו, המודלים הבסיסיים ביותר של Gemini הם קלט טקסט ופלט טקסט, אבל מודלים חזקים יותר כמו Gemini Ultra יכולים לעבוד עם תמונות, וידאו ואודיו יחדיו. ו”זה הולך להיות אפילו יותר רחב מזה”, אומר הסביס. “עדיין יש דברים כמו פעולה ומגע – שנוגעים יותר לתחום הרובוטיקה.” עם הזמן, הוא אומר, Gemini יקבל יותר חושים, יהפוך מודע יותר ויהיה מדויק יותר ומבוסס בתהליך. “המודלים האלה פשוט מבינים טוב יותר את העולם סביבם.” המודלים האלה עדיין הוזים, כמובן, ועדיין יש להם הטיות ובעיות אחרות. אבל ככל שהם יודעים יותר, אומר הסביס, כך הם ישתפרו.

עם זאת, מדדים אלו הם רק אמות מידה, ובסופו של דבר, המבחן האמיתי ליכולת של Gemini יגיע ממשתמשים רגילים שרוצים להשתמש בו כדי ליצור סיעור מוחות, לחפש מידע, לכתוב קוד ועוד הרבה יותר. נראה שגוגל רואה בקידוד בפרט אפליקציה קטלנית עבור Gemini; היא משתמשת במערכת חדשה להפקת קוד בשם AlphaCode 2 שלדבריה מתפקדת טוב יותר מ-85 אחוז מהמשתתפים בתחרות הקידוד, לעומת 50 אחוז עבור ה-AlphaCode המקורי. אבל פיצ’אי אומר שהמשתמשים יבחינו בשיפור כמעט בכל מה שהמודל נוגע בו.

לא פחות חשוב לגוגל הוא ש-Gemini הוא כנראה מודל הרבה יותר יעיל. הוא הוכשר על יחידות עיבוד Tensor של גוגל, והוא גם מהיר יותר וגם זול יותר להפעלה מאשר המודלים הקודמים של גוגל כמו PaLM. לצד המודל החדש, גוגל משיקה גם גרסה חדשה למערכת ה-TPU שלה, ה-TPU v5p, מערכת מחשוב המיועדת לשימוש במרכזי נתונים לצורך הדרכה והרצת מודלים בקנה מידה גדול.

גוגל טוענת ש-Gemini מנצחת את GPT-4

ניכר מההתבטאויות של פיצ’אי והסביס, שהם רואים בהשקת Gemini גם כהתחלה של פרויקט גדול וגם כשינוי כיוון בפני עצמו. Gemini הוא המודל לו חיכתה גוגל, זה שהיא בונה לקראתו במשך שנים, אולי אפילו זה שהיה צריך להיות מוכן לפני ש-OpenAI ו-ChatGPT השתלטו על העולם.

נראה שגוגל, שהכריזה “קוד אדום” לאחר ההשקה של ChatGPT ומאז מנסה להדביק את הפער, עדיין מנסה להיאחז במנטרה “הנועזת והאחראית” שלה. הסאביס ופיצ’אי אומרים שהם לא מוכנים לנוע מהר מדי רק כדי לעמוד בקצב, במיוחד כשאנחנו מתקרבים לחלום הבינה המלאכותית האולטימטיבי: בינה כללית מלאכותית (AGI), המונח לבינה מלאכותית שיודעת להשתפר בכוחות עצמה, חכמה יותר מבני אדם, ומוכנה לשנות את העולם. “כשאנחנו מתקרבים ל-AGI, הדברים הולכים להיות שונים”, אומר הסאביס. “זהו סוג של טכנולוגיה פעילה, אז אני חושב שאנחנו צריכים לגשת לזה בזהירות. בזהירות, אבל באופטימיות”.

Gemini: Excelling at competitive programming

גוגל אומרת שהיא עבדה קשה כדי להבטיח את הבטיחות והאחריות של Gemini, הן באמצעות בדיקות פנימיות וחיצוניות ושיתוף פעולה עם צוות-אדום. פיצ’אי מציין כי הבטחת אבטחת המידע והאמינות חשובה במיוחד עבור מוצרים מובילים עבור ארגונים, וזה המקום שבו הבינה המלאכותית הגנרטיבית עושה את הכסף שלה. אבל הסביס מודה שאחד הסיכונים בהשקת מערכת בינה מלאכותית מתקדמת הוא שיהיו לה בעיות תקיפה ווקטוריות שאיש לא יכול היה לחזות. “בגלל זה אתה צריך לשחרר דברים”, הוא אומר, “כדי לראות וללמוד”. גוגל מקדמת את מהדורת ה-Ultra לאט במיוחד; הסאביס משווה אותו לגרסת בטא מבוקרת, עם “אזור ניסויים בטוח יותר” עבור המודל הכי מתקדם וחסר מעצורים של גוגל.

במשך שנים, פיצ’אי ובכירים אחרים בגוגל הפכו פואטיים לגבי הפוטנציאל של AI. פיצ’אי בעצמו אמר יותר מפעם אחת שבינה מלאכותית תשנה את האנושות יותר מגילוי האש או החשמל. בדור הראשון הזה, ייתכן שמודל Gemini לא ישנה את העולם. במקרה הטוב, הוא עשוי לעזור לגוגל להדביק את הפער עם OpenAI במירוץ לבניית בינה מלאכותית יצירתית. (במקרה הגרוע ביותר, בארד נשאר משעמם ובינוני, ו-ChatGPT ממשיך לנצח.) אבל נראה שפיצ’אי, הסאביס וכל השאר בגוגל חושבים שזו ההתחלה של משהו ענק באמת. האינטרנט הפך את גוגל לענקית טכנולוגיה; Gemini יכול להיות אפילו יותר גדול.

גילוי נאות:

תוכן המאמר נכתב לאחר מאמץ ומחקר על מנת לספק את התוכן האמין ביותר שניתן. כמו כן התוכן מתייחס למידע שקיים בעת שעודכן לאחרונה בתאריך: 19/12/2023, ולכן עשויים להיות שינויים ואי התאמות שחלו מאז.
כמו כן, כל המאמרים המסקרים מוצרים או שירותים כלשהם הינם מוצרים שרכשתי והתנסתי בהם בעצמי. בחלק מהמקרים אני אקשר לאתרי המוצרים באמצעות קישור שיתופי (Affiliate), שיתוף פעולה זה מאפשר לי לעיתים לספק לכם הגולשים הטבות מיוחדות ובתמורה אני מתוגמל באופן חלקי ואינו משפיע על העלות הסופית.
תודה על שיתוף הפעולה. ומקווה שהפקתם את המיטב מקריאה זו.

הגדילו את התנועה האורגנית שלכם עם SurferSEO
Jasper ai - ניסיון חינם

אולי יעניין אותך לקרוא…

הכירו את Magic Studio | תנו לכוח של AI להגביר את העבודה שלכם - תמונה מקדימה לסרטון

Canva מוסיפה מחולל וידאו בשיתוף עם Runway ו-Magic Studio המופעל על ידי בינה מלאכותית

Canva, חברת העיצוב הגרפי והמולטימדיה המקוון האוסטרלית, שהפלטפורמה מבוססת האינטרנט שלה משמשת ארגוני מדיה רבים ברחבי העולם ליצירת גרפיקה ומולטימדיה,…
המשך קריאה Canva מוסיפה מחולל וידאו בשיתוף עם Runway ו-Magic Studio המופעל על ידי בינה מלאכותית