המודל Tülu 3 של Ai2 מאיים על הענקים: האם זה הסוף של GPT-4o ו-DeepSeek v3?

Tülu 3, הפיתוח האחרון של מכון אלן לבינה מלאכותית (Ai2), מהווה שינוי משמעותי בתחום הבינה המלאכותית בקוד פתוח. עם 405 מיליארד פרמטרים, הוא מאתגר ענקים כמו GPT-4o ו-DeepSeek v3, ומציג ביצועים מעולים, במיוחד בהערכות בטיחות.

כוחו נובע ממערכת “למידה מתגמול מאומת” (RLVR). גישה זו משפרת את דיוק המודל באמצעות תוצאות מאומתות, כמו פתרון נכון של בעיות מתמטיות. בשילוב עם שיטות מתקדמות של אימונים לאחר ההכשרה כמו כוונון עדין מבוקר ולמידת העדפות, Tülu 3 קובע רף חדש.

פריצות דרך טכניות, כולל עיבוד מקבילי יעיל על פני כמה GPUs וסנכרון משקלים אופטימלי, משפרות עוד יותר את יכולותיו. המחויבות של Ai2 לשקיפות בקוד פתוח בולטת, ומציעה גישה מלאה לנתונים וקוד האימון, מה שמעצים את אנשי הפיתוח להתאים אישית את תהליכי הפיתוח של הבינה המלאכותית שלהם.

הצגת Tülu 3 מהווה צעד משמעותי בבינה המלאכותית בקוד פתוח, ומספקת למפתחים ולחוקרים אפשרות מרשימה מול מודלים קנייניים.

חברים יקרים!
אהבתם מה שקראתם?
אז תהיו חברים…
קבלו ישירות אליכם למייל:
חדשות, טיפים ומדריכים, מבצעים וכלי בינה מלאכותית.
השאירו שם ומייל וגם אתם לא תצטרכו לדאוג שתפספסו משהו בעולם ה-AI!
שדה זה מיועד למטרות אימות ויש להשאיר אותו ללא שינוי.
פרטיות(חובה)
This field is hidden when viewing the form
This field is hidden when viewing the form
Send this to a friend