מה זה Google Gemini

הצגת Google Gemini, קבוצה מודלים של שפה גדולה (LLM) המשלבת GPT-4 עם טכניקות בהשראת AlphaGo, מסמנת את התגובה האסטרטגית של גוגל ל-ChatGPT. עם יכולות מולטי-מודאליות וגישה פוטנציאלית לנתוני האימון הנרחבים של גוגל משירותיה השונים, Gemini שואפת לקרוא תיגר על הדומיננטיות של ChatGPT בתחום הבינה המלאכותית הגנרטיבית. המהלך הזה מדגיש את המחויבות של גוגל לחדשנות ולתחרות הבינה המלאכותית בשוק ה-AI הצומח במהירות, ששוויו צפוי להיות 1.3 טריליון דולר עד 2032.

ההשקה של ChatGPT בנובמבר 2022 טלטלה את חברת גוגל. הצ'אט-בוט הפופולרי היווה איום כל כך על עסקיה של החברה שגוגל נאלצה להכריז על קוד אדום והחלו להשקיע בהדבקת הפער עם פריצת הבינה המלאכותית הגנרטיבית לתודעה הציבורית. המאמץ הזה לא רק הביא לשחרור של Google Bard אלא גם ל-Gemini.

מה זה Google Gemini?

Gemini הוא קבוצה של מודלים של שפה גדולה (LLMs) המשלבים GPT-4 עם טכניקות אימון שנלקחו מ-AlphaGo, כגון Reinforcement learning ועצי חיפוש, שיש להם פוטנציאל לבטל את ChatGPT כפתרון הבינה המלאכותית הדומיננטי ביותר על פני כדור הארץ.

החדשות מגיעות חודשים ספורים לאחר שגוגל שילבה את מעבדות ה-Brain ו-DeepMind AI שלה כדי ליצור צוות מחקר חדש בשם Google DeepMind, ורק חודשים לאחר השקת בארד והדור הבא שלה PaLM 2 LLM.

כאשר חוקרים צופים כי שוק הבינה המלאכותית הגנרטיבית מוערכת בשווי צפוי של 1.3 טריליון דולר עד 2032, ברור שגוגל עושה הכל בכדי לשמור על מעמדה כמובילה בפיתוח בינה מלאכותית.

מה אנחנו יודעים עד כה על Gemini

בעוד שרבים מצפים ש-Google Gemini ישוחרר בסתיו 2023, לא הרבה ידוע על יכולות המודל.

עוד במאי, סונדאר פיצ'אי, מנכ"ל גוגל ואלפבית, פרסם פוסט בבלוג עם מבט מגבוה על ה-LLM, והסביר:

"Gemini פותח מהיסוד כדי להיות רב-מודאלי, יעיל ביותר באינטגרציות של כלים ו-API ונבנה כדי לאפשר חידושים עתידיים, כמו זיכרון ותכנון."

פיצ'אי ציין גם כי "למרות שעדיין מוקדם, אנו כבר רואים יכולות מולטי-מודאליות מרשימות שלא נראו בדגמים קודמים".

"לאחר כוונון עדין ובדיקה קפדנית לבטיחות, Gemini יהיה זמין בגדלים ויכולות שונות, בדיוק כמו PaLM 2."

מאז, לא נאמר הרבה על השחרור באופן רשמי, מלבד הראיון של מנכ"ל Google DeepMind, דמיס חסאביס, במגזין Wired שציין ש-Gemini "תשלב כמה מהיתרונות של מערכות מסוג AlphaGo עם יכולות השפה המדהימות של המודלים הגדולים".

במגזין Android Police, טוענים גם כי מקור אנונימי המעורב במוצר העיר כי Gemini יוכל ליצור טקסט ותמונות הקשריות ויוכשר על מקורות כגון תמלול סרטוני וידאו מיוטיוב.

האם Gemini יחטוף את הכתר מ-ChatGPT?

האם Gemini יחטוף את הכתר מ-ChatGPT

אחת השיחות המדוברות ביותר סביב שחרורו של Gemini היא האם למודל השפה המיסתורי יש את מה שצריך כדי להתעלות על ChatGPT, שהגיע השנה ליותר מ-100 מיליון משתמשים פעילים חודשיים.

במבט חטוף, היכולת של Gemini לייצר טקסט ותמונות מעניקה לו יתרון רציני על פני GPT4 ביחס למגוון התוכן שהוא יכול לייצר.

עם זאת, אולי המבדיל המאיים ביותר בין השניים הוא המגוון העצום של נתוני האימון (הקנייניים) של גוגל. Google Gemini יכול לעבד נתונים שנלקחו מכל שירותיה, כולל מנוע החיפוש של גוגל, YouTube, Google Books ו-Google Scholar.

השימוש בנתונים קנייניים אלה בהכשרת מודלים של Gemini עשוי להביא ליתרון מובהק בתחכום של התובנות והמסקנות שהוא יכול לקחת ממערך נתונים. זה נכון במיוחד אם הדיווחים המוקדמים הם נכונים, על כך ש-Gemini מאומן על פי שניים יותר טוקנים מאשר GPT4.

בנוסף, אי אפשר לזלזל בשותפות בין Google DeepMind וצוותי Brain השנה, מכיוון שהיא מציבה את OpenAI ראש בראש מול צוות של חוקרי בינה מלאכותית ברמה עולמית, כולל מייסד-שותף של גוגל, סרגיי ברין והמדען המומחה לבינה מלאכותית ב-DeepMind, פול ברהם.

זהו צוות מנוסה שיש לו הבנה עמוקה כיצד ליישם טכניקות כמו reinforcement learning ועצי חיפוש (tree search) כדי ליצור תוכניות AI שיכולות לאסוף משוב ולשפר את פתרון הבעיות שלהן לאורך זמן.

מירוץ החימוש של הבינה במלאכותית

היכולות הרב-מודאליות של Gemini, השימוש ב-reinforcement parenting, יכולות יצירת טקסט ותמונה, והנתונים הקנייניים של Google הם כל המרכיבים ש-Gemini צריך כדי להתעלות על GPT-4.

נתוני האימון הם המבדל העיקרי, אחרי הכל, הארגון שינצח במירוץ החימוש של ה-LLM יוכרע במידה רבה על סמך מי מאמן את הדגמים שלהם על מערך הנתונים הגדול והעשיר ביותר.

השאלה כעת היא, מה תעשה OpenAI בתגובה?

הגדילו את התנועה האורגנית שלכם עם SurferSEO
Jasper ai - ניסיון חינם

אולי יעניין אותך לקרוא…