Grok - הטוב, הרע והמכוער. הצ'טבוט החדש של אילון מאסק

האם הפלא הטכנולוגי האחרון של אילון מאסק הוא רק עוד צ’אט בוט בזירת הבינה המלאכותית?

תוכן המאמר

הטוב
הרע
המכוער
לסיכום

בעולם הטכנולוגיה המתפתח ללא הרף, המאמצים של אילון מאסק לעיתים רחוקות מצליחים להכות גלים. כמה שבועות לאחר קריאתו הברורה לעצור את ההכשרה של LLM בעלי יכולת גבוהה יותר מ-GPT-4, מאסק שיחק את המהלך המובהק שלו: עשה בדיוק ההפך ממה שהטיף. קבלו את xAI – פרי מוחו האחרון של מאסק – ו-Grok, ה-LLM החדש שרק הוכרז בשבת האחרונה.

Announcing Grok!

Grok is an AI modeled after the Hitchhiker’s Guide to the Galaxy, so intended to answer almost anything and, far harder, even suggest what questions to ask!

Grok is designed to answer questions with a bit of wit and has a rebellious streak, so please don’t use…
— xAI (@xai) November 5, 2023

המיזם עלה לכותרות, לא רק בגלל מעורבותו של מאסק אלא גם בשל הליין-אפ עמוס הכוכבים של חוקרי AI מובילים שהחברה הצליחה לגייס מחברות סטארט-אפ וענקיות טכנולוגיה מובילות. מיוצגת עם היומרה של: בינה מלאכותית שנועדה “להבין את העולם”, xAI נשארה מסתורית לגבי ה”איך” וה”מה” עם המניעים שלה… לפחות עד שבוע שעבר.

האם זהו עוד מהלך קלאסי של מאסק לאתגר את הסטטוס קוו, או סתם צ’אטבוט מוגזם שרוכב על הגל האדיר של פופולריות והייפ סביב קודמיו?

הטוב

זרם מתמיד של מידע בזמן אמת

Grok עשויה לשנות את כללי המשחק עם גישה לכל צינור התוכן של טוויטר. כפי שהדגישה xAI, ל-Grok יהיה “מידע בזמן אמת על העולם”, שיציג את מה שחוקרי בינה מלאכותית מכנים Reinforcement Learning from Human Feedback (RLHF), עיבוד חדשות ופרשנות מגוונת על אירועים עכשוויים.

על ידי למידה על אירועים מנקודות מבט שונות, והטמעת תגובות של קהילת טוויטר – שהן בעצם הערות – Grok יקבל נקודת מבו רב-גונית של העולם.

על פי מחקרים אחרונים, אנשים כבר משנים דפוסי התנהגות, בכך שהם נחשפים ומחפשים חדשות ברשתות החברתיות לפני שהם פונים למדיה המיינסטרים. האינטגרציה של Grok עם X (טוויטר) עשויה לזרז עוד יותר את התהליך הזה, להציע למשתמשים הערות מיידיות, הקשר, ואם מבוצע היטב – בדיקת עובדות במקום. תכונת המידע בזמן אמת, כפי שהדגישה xAI, מבטיחה ש-Grok תישאר מעודכנת עם הדופק של העולם, ומאפשרת לה לספק תשובות רלוונטיות ובזמן אמת.

Fun Mode: חלומו של אילון התגשם

נראה שהחזון של אילון מאסק: בינה מלאכותית חובבת כיף, קמה לחיים עם מה שנקרא “Fun Mode” של Grok. תכונה זו מאפשרת ל-LLM ליצור בדיחות, לספק תגובות הומוריסטיות אך מדויקות עובדתית, ולספק למשתמשים חווית שיחה קלילה וסתמית.

אחד האתגרים עם LLMs קיימים, כמו ChatGPT, הוא שחלק מהמשתמשים מרגישים שהם עברו סטריליזצית יתר כדי להבטיח תקינות פוליטית, מה שעלול להפוך את האינטראקציות לפחות אורגניות וספונטניות. בנוסף, חלק מה-LLMs הלוקאליים אינם מיומנים באינטראקציות ממושכות. Grok, עם המצב ״המהנה״ שלו, מבטיח למלא את הפער הזה, ויכול לשמש כבזבזן זמן מרתק למי שמחפש להירגע.

xAI’s Grok system is designed to have a little humor in its responses pic.twitter.com/WqXxlwI6ef
— Elon Musk (@elonmusk) November 4, 2023

הרעיון הזה אינו חדש לגמרי, מכיוון ש-Quora’s Poe מציע שירות דומה עם הצ’אטבוטים המכוונים שלו, כל אחד מתהדר באישיות ייחודית. עם זאת, הטמעה של זה ב-LLM עם היכולות של Grok לוקחת את החוויה לרמה חדשה.

גישה אינטגרלית לאינטרנט

אחד המבדלים הבולטים של Grok הוא היכולת לגשת לאינטרנט ללא צורך בתוסף או מודול אחר.

אמנם נותר להבהיר את ההיקף המדויק של יכולות הגלישה שלו, אבל הרעיון מפתה. דמיינו לעצמכם LLM שיכול לשפר את הדיוק העובדתי מכיוון שהוא יכול להצליב נתונים בזמן אמת. יחד עם הגישה שלו לתוכן בטוויטר, Grok יכול לחולל מהפכה באופן שבו משתמשים מקיימים אינטראקציה עם AI, בידיעה שהמידע שהם מקבלים אינו מבוסס רק על נתוני אימון קיימים, אלא מתעדכן ומאומת ללא הרף.

ריבוי משימות

על פי הדיווחים, Grok מסוגל לבצע ריבוי משימות, מה שמאפשר למשתמשים לנהל מספר שיחות במקביל. משתמשים יכולים לחקור נושאים שונים, לחכות לתגובה בשרשור אחד ולהמשיך בשרשור אחר.

הצ’אטבוט מציע גם הסתעפות בשיחות, מאפשר למשתמשים לחפור עמוק יותר באזורים ספציפיים מבלי לשבש את הדיון הראשי, מציע מדריך ויזואלי לכל ענפי השיחה, מה שמקל על המשתמשים לנווט בין נושאים.

Grok מציע גם עורך קוד מובנה, המאפשר למשתמשים להוריד, לערוך ולעצב את התגובות של Grok לשימוש מאוחר יותר. כלי זה, בשילוב עם הסתעפות שיחות, מבטיח שמשתמשים יכולים לעבוד עם ענפי שיחה ספציפיים ולהתחבר מחדש בצורה חלקה.

These are some of the UI features in Grok. First, it allows you to multi-task. You can run several concurrent conversations and switch between them as they progress. pic.twitter.com/aXAG0M2oPF
— Toby Pohlen (@TobyPhln) November 5, 2023

צנזורה מינימלית: AI עם חופש דיבור

החזון של אילון מאסק עבור Grok היה ברור: בינה מלאכותית שלא נרתעת מלומר את דעתה הדיגיטלית.

בעוד שלכל צ’טבוטי הבינה המלאכותית הגדולים יש רשתות בטיחות כדי למנוע נזק פוטנציאלי או מידע מוטעה, זה יכול לפעמים להרגיש מגביל. משתמשים ציינו מקרים שבהם מודלים כמו ChatGPT, Llama ו-Claude עלולים לעכב את התגובות, תוך נטייה לזהירות יתר כדי למנוע פגיעות אפשריות. עם זאת, זה עשוי לסנן תשובות לא מזיקות או כאלה המבוקשות באמת.

Grok מקבל יותר חופש בתגובותיו, ולכן עשוי להציע חווית שיחה אותנטית ובלתי מוגבלת. כפי שהודגש על ידי xAI, העיצוב של Grok מעניק לו מענה לשאלות פיקנטיות שמערכות בינה מלאכותיות אחרות עשויות לעקוף.

ברור שה-AI הזה מציע שילוב ייחודי של מידע בזמן אמת, הומור, דיוק וחופש. עם זאת, כמו בכל חידוש, ישנם אתגרים ומלכודות פוטנציאליות שיש לקחת בחשבון.

הרע

פיתוח מהיר והכשרה מוגבלת

מההתחלה, ההתפתחות המהירה של Grok הרימה כמה גבות. כפי שנאמר על ידי xAI בעצמם, ״Grok הוא עדיין מוצר במצב בטא מוקדם מאוד – הטוב ביותר שיכולנו לעשות עם חודשיים של אימון.” בעולם של LLM, חודשיים ו-33 מיליארד פרמטרים נשמעים כמו טיפה בים.

רק לצורך פרספקטיבה, OpenAI הייתה שקופה לגבי תהליך הפיתוח שלה, והזכירה, “השקענו שישה חודשים ביישור GPT-4 באופן איטרטיבי.” הפער בין לוחות הזמנים ההתפתחותיים מרמז שייתכן שהפיתוח של Grok הואץ כדי לרכוב על גל ההייפ של הבינה המלאכותית.

יתרה מזאת, x.AI עדיין נוצרת לשון לגבי היקף החומרה שנוצל במהלך ההכשרה של Grok, מה שמשאיר מקום לספקולציות.

הכל על הפרמטרים

לצורך ההבנה, פרמטרים ב-LLM מייצגים את כמות המידע או הידע שהמודל יכול להכיל. הם מצביעים על יכולת ניצול המוח האפקטיבית של ה-AI, וקובעות את יכולתו לעבד ולייצר מידע. Grok, עם 33 מיליארד הפרמטרים שלו, עשוי להישמע מרשים במבט ראשון.

עם זאת, בנוף התחרותי של LLM, זה רק עוד שחקן. למעשה, ספירת הפרמטרים שלו עשויה להיעדר במתן צרכים ארגוניים מורכבים ובתפוקות האיכותיות שענקיות כמו ChatGPT, Claude ובארד הציבו כסטנדרט הזהב.

חלק מספירת הפרמטרים הנמוכה הזו היא הסיבה לכך ש-Grok לא מצליח לנצח מודלים מיינסטרים אחרים במדדים מרכזיים כמו HumanEval או MMLU:

מלבד ספירת הפרמטרים, ישנה גם סוגיית הטיפול בהקשר – בעצם כמה מידע צ’אטבוט של AI יכול להבין בקלט אחד. Grok לא מרשים במיוחד באזור זה. לפי xAI, גרוק מבין 8,192 טוקנים של הקשר, לעומת GPT-4 שמלהטט ב-32,000 טוקנים, ו-Claude לוקח את זה אפילו רחוק יותר עם עד 100,000 טוקנים. ה-GPT-4 Turbo החדש של OpenAI מגיע לחלון הקשר של 128,000 טוקנים.

מחיר החדשנות

עלות היא גורם מכריע בהערכת הערך של כל מוצר, וגרוק אינו יוצא מן הכלל. הצ’אטבוט יהיה זמין למשתמשים שמוכנים לשלם 16 דולר לחודש עבור הפריבילגיה לקיים איתו אינטראקציה.

עם הצעות חינמיות כמו Claude 2 ו-ChatGPT המצוידת ב-GPT-3.5 Turbo, גרוק עלול להיות מוצר קשה למכירה – במיוחד בהתחשב בכך שהמודלים החינמיים הללו נהנים מדיוק מוכח, וכבר עברו את גרוק במדדים מסוימים.

יתרה מזאת, אפילו ה-LLM החזק ביותר בשכונה, GPT-4, מבטיח להיות טוב יותר מ-Grok, עם היתרון הנוסף של נגישות נרחבת, רב-מודאלית ועוצמתית.

The @xAI Grok AI assistant will be provided as part of ???? Premium+, so I recommend signing up for that.

Just $16/month via web. https://t.co/wEEIZNjEkp
— Elon Musk (@elonmusk) November 4, 2023

האם ההשקה המוקדמת של Grok יכולה להיות במידה רבה מהלך אסטרטגי להגברת המנויים של טוויטר בלו, ובכך להגביר את זרם ההכנסות של טוויטר?

חששות אלו מדגישים את האתגרים של Grok בביסוס עצמו כשחקן מרכזי בתחום ה-LLM. והחסרונות שלו לא נעצרים בתג המחיר.

המכוער

חיקוי סיפרותי

ביסוס לימודי LLM על דמות בדיונית מרומן פופולרי הוא, ללא ספק, בחירה יצירתית. אמנם הקסם של אישיות בדיונית עשוי להיות מפתה, אך הוא מהווה סיכונים טבועים בעולם שמסתמך יותר ויותר על מידע מדויק. משתמשים שפונים ל-AI לשאלות או עצות רציניות עלולים להסתבך עם מערכת שנועדה לחקות דמות קומית.

יתר על כן, כשהגבול בין בדיה למציאות מיטשטש, יש חשש שמשתמשים יפרשו תגובות שובבות או סאטיריות לא נכון למידע עובדתי. בעידן דיגיטלי, שבו כל פיסת מידע מנותחת ומשתפת, ההשלכות של תפיסות שגויות כאלה עשויות להיות נפוצות. במיוחד כשיותר משפה אחת נכנסת לתמונה.

בעוד שלהומור ושנינות יש את מקומם, חובה להגיע לאיזון, במיוחד כאשר משתמשים מחפשים תובנות קריטיות. מתן עדיפות להומור על פני דיוק עשוי לבדר, אך הוא גם מערער את עצם המהות של מה ש-LLM צריך להציע: מידע אמין.

הבטחות יתר ולא עמדו בהן

ההבטחות הגדולות של אילון מאסק לגבי Grok הניחו את הבסיס לציפיות מרחיקות לכת. בדיקה מעמיקה חושפת חוסר התאמה פוטנציאלי בין ההייפ למציאות. העובדה ששיטות האימון המסורתיות של LLM מוגבלות על ידי נתוני האימון שלהן מדגישה מגבלה קריטית: הן אינן יכולות להיכנס לטריטוריית “super AI” באמת.

ההכשרה של Grok, עם 33 מיליארד הפרמטרים שלו וכמה חודשים של פיתוח, נראית מתגמדת בהשוואה לענקיות LLM אחרות. בעוד שהרעיון של אישיות בדיונית שובבה נשמע מפתה, הציפייה שהיא תספק תוצאות פורצות דרך באמצעות שיטות אימון סטנדרטיות עשויה להיות מתיחה.

קהילת הבינה המלאכותית מנוסה עם הגזמות, אבל עם ההתקדמות המהירה בתחום, זה חשוב שהמשתמשים יסננו את ההייפ. השגת סטטוס “סופר בינה מלאכותית” היא אתגר עצום, ואין זה סביר ש-Grok, עם התצורה וההכשרה הנוכחיים שלו, יעמוד בדרישות.

ואכן, כדי להוכיח את כוחו של גרוק, אילון מאסק השווה את הצ’אטבוט לשיחה שלו עם LLM קטן שהוכשר רק לקידוד. מספיק לומר, שזה לא היה קרב הוגן.

Example of Grok vs typical GPT, where Grok has current information, but other doesn’t pic.twitter.com/hBRXmQ8KFi
— Elon Musk (@elonmusk) November 5, 2023

האיום של מידע מוטעה

LLMs הם רבי עוצמה, אבל הם לא חסיני טעויות. בהיעדר סטנדרטים מחמירים, הבחנה בין עובדות מפייק הופכת למשימה מאתגרת ביותר. ההיסטוריה האחרונה מציעה סיפורי אזהרה, כמו צ’אטבוטים שאומנו על נתוני 4chan או אפילו Tay, צ’טבוט מוקדם יותר ממיקרוסופט שהורשה לקיים אינטראקציה בטוויטר. הבוטים האלה לא רק שפלטו דברי שטנה, אלא גם התחזו בצורה משכנעת לאדם אמיתי, והטעו קהל עצום.

הפלירטוט הזה עם מידע מוטעה אינו מבודד. כשהתדמית של טוויטר לא מזהיר במיוחד מאז ההשתלטות של מאסק, ייתכן שיש חששות לגבי היכולת של Grok לספק מידע מדויק באופן עקבי. LLMs נופלים מדי פעם להזיות, ואם העיוותים הללו נצרכים כאמיתות, השפעות מהדהדות עלולות להיות מדאיגות.

הפוטנציאל למידע מוטעה הוא פצצת זמן מתקתקת. ככל שמשתמשים נשענים יותר ויותר על AI לתובנות, מידע שגוי יכול להוביל לקבלת החלטות פגומות. כדי שגרוק יהיה בעל ברית מהימן, עליו לנהוג בזהירות ולהבטיח שההתנהגות השובבה שלו לא תעיב על האמת.

חוסר ביכולות מולטי-מודאליות?

בעולם המתפתח של AI, גישת הטקסט בלבד של Grok מרגישה כמו שריד מהעבר. בעוד שמשתמשים צפויים לשלם עבור השירותים של Grok, הם עשויים לשאול בצדק מדוע, במיוחד כאשר LLMs אחרים מציעים חוויות עשירות יותר ורב-מודאליות.

לדוגמה, GPT-4-v כבר עשה צעדים בתחום המולטי-מודאלי, מתגאה ביכולת לשמוע, לראות ולדבר. ה-Gemini הקרוב של גוגל מבטיח חבילת תכונות דומה. על רקע זה, ההצעות של Grok נראות חסרות ברק, ומעלות שאלות נוספות לגבי הצעת הערך שלה.

זהו שוק תחרותי, והמשתמשים הופכים יותר ויותר בעלי אבחנה. אם Grok רוצה ליצור לעצמו נישה, הוא צריך להציע משהו באמת יוצא דופן. כפי שזה נראה, עם מתחרים המציעים תכונות משופרות ודיוק טוב יותר – לרוב בחינם – ל-Grok יש עוד דרך ארוכה להוכיח.

לסיכום

ההשקה של Grok עוררה התרגשות אך גם עוררה מידה לא מבוטלת של ספקנות. גישת ה-barebones MVP (מוצר קיימא מינימלי) מאפשרת איטרציה ושיפור מהירים על סמך משוב המשתמש. אבל התחרות של ענקיות בינה מלאכותית עם הרבה יותר משאבים מציבה קרב בדרך לעלייה.

כדי ש-Grok יצליח, הוא זקוק ליכולות חדשות ושימושיות כאחד. ערך בידורי בלבד לא יספיק בשוק רווי ותחרותית. קהילת הבינה המלאכותית משתעממים מהר מטרנדים חמודים.

בסופו של דבר, גורלו של Grok תלוי באיזון בין חדשנות לפרקטיות. למרות שספקנות בריאה היא הוגנת, ביטול מלא עלול להיות מוקדם מדי. Grok עדיין עשוי להיות חלוץ בגבולות חדשניים או מאידך עלול להיות הערת שוליים באבולוציה של AI. כך או כך, מקורותיו הלא שגרתיים מבטיחים ש-Grok יהיה פרק מסקרן בסיפורה של הבינה המלאכותית.

Grok – הטוב, הרע והמכוער. הצ’טבוט החדש של אילון מאסק

הטוב

זרם מתמיד של מידע בזמן אמת

Fun Mode: חלומו של אילון התגשם

גישה אינטגרלית לאינטרנט

ריבוי משימות

צנזורה מינימלית: AI עם חופש דיבור

הרע

פיתוח מהיר והכשרה מוגבלת

הכל על הפרמטרים

מחיר החדשנות

המכוער

חיקוי סיפרותי

הבטחות יתר ולא עמדו בהן

האיום של מידע מוטעה

חוסר ביכולות מולטי-מודאליות?

לסיכום

אולי יעניין אותך לקרוא…

קוקה קולה השתמשה בבינה מלאכותית ליצירת פרסומות החגים לשנת 2024 – מה דעתכם?

ממהפכת הסושיאל למהפכת הרובוטים: Meta מסמנת את היעד הבא

Midjourney V7: מהפיכה ביצירת תמונות באמצעות דיבור ועוד חידושים מפתיעים

Stability AI משחררת פלטפורמת אודיו בינה מלאכותית

סוכני בינה מלאכותית: הסבר מקיף, ואיך לא להישאר מאחור

איך ChatGPT עובד?

ניווט באתר

DeepSeek AI דיפסיק

PhotoRoom

Photopea

GPTzero

צאט גיפיטי Chat GPT

Luminar Neo