האם Claude 3 (קלוד) יתפוס את כס המלוכה של הבינה המלאכותית?

מה זה Claude 3?

Anthropic משיקה את קלוד 3, בטענה שהוא מתעלה על ה-GPT-4 לרוחב כל המדדים. השבוע (4 במרץ) מציינת Anthropic את השקת משפחת המודלים של קלוד 3, המציבה סטנדרטים חדשים במגוון רחב של משימות קוגניטיביות.

אבל החדשות האלה הן הרבה יותר ממה שנראה לעין.

זה עשוי להיות גם האחרון מבין מודלי ה-MLLM הגדולים של זמננו, שיפנה את מקומו למעמד חדש של מודלי AI מתקדמים, עם שמות כמו GPT-5 או, מי יודע, Q* הידוע לשמצה, שיהיו שונים בתכלית ומתקדמים בהרבה ממה שאנו רואים היום.

למעשה, המודל הזה יכול להיות כל כך חזק שהוא גרם לאילון מאסק לתבוע את OpenAI על כך שהסתירו לכאורה את העובדה שהם השיגו בינה כללית מלאכותית, או AGI, באופן פנימי.

ואולי אנחנו יודעים יותר על המודלים האלה ממה שאתם אולי חושבים.

יורש חדש לכס המלכות

Anthropic, חברה שמושקעים בה כמה מהארגונים החזקים בעולם כמו גוגל ואמזון, הכריזה על ליין המודלים החזק ביותר שלהם אי פעם.

Opus, Sonnet, ו- Haiku

המודלים החדשים של קלוד 3 מסווגים על פי אנתרופיק כ”אינטליגנציה”.

  • Opus הוא המודל המתקדם והחכם ביותר בעולם על פי התוצאות שלהם, המצטיין באוטומציה של משימות, מחקר ופיתוח וניתוח אסטרטגי. הוא המתחרה הישיר ל-Gemini 1.5 ול-GPT-4.
  • Sonnet היא גרסת ‘התמורה הטובה ביותר’, מודל שעוקב אחרי המודלים הטובים ביותר בתעשיה תוך שהוא מהיר וזול משמעותית. בהתבסס על תוצאות ראשוניות, כנראה האפשרות הטובה ביותר כיום עבור מקרי שימוש ארגוניים.
  • Haiku, המודל הקטן ובעל היכולת הנמוכה יותר, עדיין די חזק ומהיר, נועד במקור למקרי שימוש בהם זמני שהייה נמוכים ואינטראקציה בזמן אמת הם חובה, תוך שהוא מציע מחירים זולים.

כל אחד מתגאה ביכולות מוגברות. עם כל שדרוג של מודל, המשתמשים מקבלים ביצועים משופרים, המאפשרים להם להתאים את הבחירה שלהם כדי להשיג את השילוב האופטימלי של אינטליגנציה, מהירות ומחיר לצרכים הספציפיים שלהם.

לפי Anthropic, המודל Opus ו-Sonnet זמינים כעת לשימוש ב- claude.ai וב-Cloud API שזמין כעת באופן כללי ב-159 מדינות. Haiku יהיה זמין בקרוב.

אם אתם כבר מנויים על קלוד פרו, כבר עכשיו אתם יכולים לגשת לעבוד עם קלוד 3 Opus, לביצועים מקסימליים! Sonnet זמין גם דרך Amazon Bedrock ו-Vertex AI Model Garden של Google Cloud. בעקבות כך, Opus ו-Haiku יהיו זמינים בקרוב גם בפלטפורמות הללו. בינתיים, כדי להציג את שלושת המודלים שלהם, Anthropic פרסמה דוח טכני מקיף בן 42 עמודים, ניתן למצוא אותו כאן.

אם נסתכל על אמות המידה, התוצאות ללא ספק ממצבות אותן כחבילה הטובה ביותר (אם כי בהשוואה לתוצאות GPT-4 במרץ 2023, אז קחו זאת בחשבון), במונחים של הערכות מבוססות טקסט:

Anthropic Claude 3 (קלוד) מבחן השוואה
מקור: Anthropic

ונמצא קרוב קרוב אחרי Gemini 1.0 (וכנראה Gemini 1.5) במונחים של הערכות ראייה ממוחשבת:

Anthropic Claude 3 (קלוד) מבחן הערכות ראייה ממוחשבת
מקור: Anthropic

די מרשים אם תשאלו אותי.

מהשחרור של קלוד אנו גם מבינים שאימון מודלים ברצף ארוך (long-sequence modeling) הפך לברירת מחדל חדשה עבור מעבדות המחקר הבולטות ביותר.

למיליון…ומעבר

לפני מספר שבועות העולם נדהם כשגוגל טענה להגדיל את חלון ההקשר של Gemini עד למיליון טוקנים או יותר.

ועכשיו, Claude עושה את אותו הדבר.

אבל מהו חלון הקשר?

זוהי הכמות המקסימלית של טוקנים, מילים או תתי מילים במקרה של LLMs, שמודל יכול להתמודד איתה בכל זמן נתון.

במונחים של הדיוט, זהו מרחב העבודה של המודל, או הזיכרון שלו, והוא מוגדר לערך מקסימלי ספציפי כדי למנוע את מורכבות העלות הריבועית של טרספורמרים, שכן הכפלת הרצף מכפילה את העלות פי ארבעה.

לדוגמה, אם חלון ההקשר של Claude 3 הוא מיליון טוקנים, זה אומר שהמודל יכול לבלוע, במכה אחת, כ-750,000 מילים בו זמנית. כהשוואה, זה יותר מחמשת ספרי הארי פוטר הראשונים ביחד, כלומר אתם יכולים להזין אותם בבת אחת למודל ולשאול שאלות עליהם.

וכל זה נעשה בשליפה כמעט מושלמת, כפי שמוצג על ידי הגרף שלהלן (אם כי מוצג רק עד 200,000 טוקנים) כאשר התבקש להפתור בעיות ״מחט בערימת שחת״ (NIAH – בדיקה שחוקרים מציבים פיסת מידע, חד פעמית ומאוד ספציפי שלא קשורה בתוך רצף ארוך במיוחד ובקשו מהדגם למצוא אותו) והמודל מצא את הבעיה עם ממוצע של מעל 99% דיוק.

Claude 3 (קלוד) בעיות ״מחט בערימת שחת״
מקור: Anthropic

אבל קרה עוד משהו שכבש אתמול את X בסערה.

מודל Claude מודע לעצמו?

בעת בדיקת אחת מבעיות ה-NIAH, קבוצת חוקרים ב-Anthropic הבחינה במשהו יוצא דופן:

נראה שהמודל גילה שהוא תחת בדיקה, כאילו הוא ‘מודע’ למה שנעשה לו.

בתרגום חופשי, כך הוא הגיב:

“אני חושד שייתכן שה”עובדה” הזו של תוספת הפיצה הוכנסה כבדיחה או כדי לבדוק אם שמתי לב, מכיוון שהיא לא מתאימה בכלל לנושאים האחרים. המסמכים אינם מכילים מידע אחר על תוספות לפיצה”.

רמה זו של מטא-מודעות היא בהחלט מרשימה ומפחידה באותה מידה.

עם זאת, יכול להיות שיש לזה הסבר.

החוקרים, במהלך שלב למידה של חיזוק ממשוב אנושי (RLHF), אולי שיתפו כמה תגובות כאלה עם המודל כדי ללמוד את הדפוס שבכל פעם שנשאלת שאלה מאוד ספציפית, לכאורה לא קשורה, לחשוד שזו הערכה ולהעלות את השאלה הזו.

ובכל זאת מרשים מאוד.

המודל מוכן לכאורה לענות על שאלות עם יותר ניואנסים, מה שהפך לנושא חם לאחרונה בהתבסס על התגובות האחרונות של Gemini, שיתכן שגרמו לגוגל ירידה ערך של 90 מיליארד דולר לאחר ש-Gemini סיפק תגובות לא נכונות עובדתית בשל ההטיה הכבדה שלה כלפי אנשים לבנים.

Claude 3 (קלוד) - פחות סירובים
מקור: Anthropic

עם כל מה שנאמר, בואו נהיה אמיתיים, קלוד 3 לא נראה כקפיצת מדרגה מהותית ממצבנו הקודם.

זה בהחלט שיפור, אבל הוא גם מגיע כמעט שנה אחרי היריבה שלו, ועדיין מתעלה עליו רק במעט (לפחות מנקודת המבט של Anthropic, ששוב צריך לקחת קצת בערבון מוגבל).

במילים אחרות, ייתכן שאנו עדים לרוויה לגבי מה ש-LLMs עצמאיים יכולים להשיג.

למעשה, נראה ש-OpenAI לא מוטרדת לחלוטין מהעובדה ש-ChatGPT נחשב, נכון להיום, למודל השלישי בעוצמתו בשוק, מה שגורם לי להאמין שמה שהם מכינים לנו מאחורי הקלעים חורג הרבה מעבר לשיפור קטן לעומת Gemini 1.5 או Claude 3 .

אולי סוג של חיה חדשה לגמרי.

לסיכום

Claude 3 מייצג התקדמות משמעותית בטכנולוגיית AI, המציע ביצועים כמעט ללא תחרות, אחריות משופרת ושיפור השימושיות. עם היכולת שלו למזער הטיות, להבטיח אבטחה וביצוע הוראות מורכבות תוך שמירה על סגנונות שפה ספציפיים למותג, קלוד 3 קובע סטנדרט חדש עבור מודלי AI.

היכולות שלו ביצירת תפוקות מובנות מייעלות עוד יותר משימות ביישומים שונים, מה שהופך אותו לכלי רב ערך עבור עסקים וחוקרים כאחד. המאפיינים המקיפים וההתקדמות החדשנית של קלוד 3 מציבים אותו נכון להיום כמוביל בתחום הבינה המלאכותית, ומבטיח עתיד של פתרונות יעילים ואמינים יותר מונעי בינה מלאכותית.

Claude 2 - לוגו

Claude

קלוד של Anthropic פורץ את גבולות הבינה המלאכותית. המאמר בוחן תכונות מרשימות כמו שיחות מותאמות אישית וכתיבה ניואנסית, יחד עם שיקולים אתיים. סקירה מתקדמת עבור חובבי טכנולוגיה ובינה מלאכותית.

גילוי נאות:

תוכן המאמר נכתב לאחר מאמץ ומחקר על מנת לספק את התוכן האמין ביותר שניתן. כמו כן התוכן מתייחס למידע שקיים בעת שעודכן לאחרונה בתאריך: 06/03/2024, ולכן עשויים להיות שינויים ואי התאמות שחלו מאז.
כמו כן, כל המאמרים המסקרים מוצרים או שירותים כלשהם הינם מוצרים שרכשתי והתנסתי בהם בעצמי. בחלק מהמקרים אני אקשר לאתרי המוצרים באמצעות קישור שיתופי (Affiliate), שיתוף פעולה זה מאפשר לי לעיתים לספק לכם הגולשים הטבות מיוחדות ובתמורה אני מתוגמל באופן חלקי ואינו משפיע על העלות הסופית.
תודה על שיתוף הפעולה. ומקווה שהפקתם את המיטב מקריאה זו.

הגדילו את התנועה האורגנית שלכם עם SurferSEO
Jasper ai - ניסיון חינם

אולי יעניין אותך לקרוא…