תגליות בינה מלאכותית פורצות דרך | סיכום AI שבועי עמוס בחידושים

בזמן שכולנו עסוקים בחגי תשרי, ארוחות חג, חופשות וטיולים…עולם הבינה המלאכותית חזר בגדול עם שבוע מטורף לחלוטין של חדשות AI.

קרב הבינה המלאכותית בין Meta ו-OpenAI התלהט עם השקות רבות פורצות דרך, OpenAI מביאה יכולות חדשות מדהימות ל-ChatGPT. ו-Meta לא נשארת חייבת, ומשיקה עוד תכונות AI חדשות וגם זוג משקפי שמש התומכים בבינה מלאכותית. אמזון מדביקה את הקצב במירוץ הבינה המלאכותית עם השקעה מסיבית בחברת בינה מלאכותית, טסלה מציגה את הרובוט המעודכן שלה: Optimus ומיקרוסופט משיקה את Windows 11 עם בינה מלאכותית שמוטמעת בכל דבר!

הישענו לאחור והירגעו, תזכרו להירשם לערוץ הטוויטר שלנו ולניוזלטר השבוע כדי לקבל עדכונים של כל חדשות הבינה המלאכותיות החשובות ביותר, ובואו נתחיל!

OpenAI עם DALL·E 3

OpenAI שלטו באופן מוחלט השבוע עם מספר השקות חדשות. בכנות, גם אם הם היו משיקים רק אחד מהדברים האלה זה עדיין היה מדהים. ראשית, OpenAI השיקה את Dall E 3. הוצאנו עדכון על כך לפני כשבוע, ועכשיו זה באמת קרה ואפשר למצוא את הגרסה המעודכנת בתוך ChatGPT (למנויי Plus בלבד כרגע).

Dall E 3 הוא הגרסה החדשה ביותר של מחולל האמנות הגנרטיבית שלהם שמתחרה ישירות עם Midjourney ו-leonardo.ai. לפי הדוגמאות המוצגות באתר, נראה שהכלי מציג יכולות מרשימות מאוד שלא נופלות מ-Midjourney. מה שגם מרשים אותי הם מגוון הסגנונות שהוא יכול ליצור, גרסה 3 היא קפיצת מדרגה גדולה בהשוואה לגרסה 2.

תראו את הדוגמה הזו המשווה את V2 ל-V3 עם ההנחיה:
“An expressive oil painting of a basketball player dunking, depicted as an explosion of a nebula.”

אפילו עם אותה הנחיה, DALL·E 3 מספק שיפורים משמעותיים לעומת DALL·E 2
אפילו עם אותה הנחיה, DALL·E 3 מספק שיפורים משמעותיים לעומת DALL·E 2.

נראה כי DALL·E 3 גם באמת מסוגל לייצר טקסט קריא בתמונות האלה, מה שתמיד היה קושי גדול על מחוללי תמונות ג׳נרטיביים. בנוסף, הוא נבנה באופן טבעי בתוך ChatGPT. מה שאומר שתוכלו להשתמש ב-ChatGPT כשותף לסיעור מוחות כדי לעזור ליצור את ההנחיות הטובות ביותר. זו כבר טכניקה פופולרית ליצירת הנחיות עבור Midjourney ועכשיו היא מובנית בצורה חלקה לתוך זרימת העבודה ב-ChatGPT.

OpenAI השקיעה זמן רב בבדיקות בטיחות ונקטו בצעדים כדי להגביל את היכולת של DALL·E 3 ליצור תוכן אלים, מבוגר או שונא.

על פי הפרסום באתר שלהם: ״ל-DALL·E 3 יש את שיקול הדעת לדחות בקשות של איש ציבור בשמו. שיפרנו את ביצועי הבטיחות באזורי סיכון כמו יצירת דמויות ציבוריות והטיות מזיקות הקשורות לייצוג יתר/תת חזותי, בשיתוף עם red teamers – מומחי דומיינים שבודקים את המודל – כדי לסייע בהערכת הסיכונים ובמאמצי הפחתת הסיכון שלנו באזורים כמו תעמולה ומידע מוטעה.״

כל הנאמר מבחינת בטיחות בהחלט תהיה בעיה עצומה ככל שכלי הבינה המלאכותית האלה משתפרים.

נכון לעכשיו DALL·E 3 זמין רק בתוך ChatGPT למנויים בתוכניות Plus ו- Enterprise, אבל 20$ לחודש ממשיכים לעלות בערכם, במיוחד כשאשתף את העדכונים הבאים.

גלישה באינטרנט עם ChatGPT

עוד השקה חדשה של OpenAI השבוע, שיחסית עברה מתחת לרדאר אבל מאוד משמעותית, היא האפשרות לגלוש באינטרנט עם ChatGPT (כפי שעידכנו בכתבה: ChatGPT יכול כעת לחפש באינטרנט בזמן אמת).

עכשיו ל-ChatGPT יש גישה לכל האינטרנט במקום רק למה שמובנה בתוך המודל, כולנו נתקלנו בהתרעות שהיינו מקבלים לעתים עם: ״תאריך הפסקת הידע שלי הוא ספטמבר 2021״. אתם בטח חשבתם של-ChatGPT כבר יש גישה לאינטרנט והתשובה היא כן, הם אכן עשו זאת, וזו הייתה תכונה מדהימה.

אבל לפני כמה חודשים OpenAI השביתה את האפשרות הזו בלי לספק הרבה הסברים, הסיבה היחידה שהם נתנו היא שגלישה ב-ChatGPT תציג מדי פעם תוכן בדרכים לא מכוונות, ושהדוגמה שהם סיפקו היא שמשתמשים היו מבקשים את התוכן המלא מכתובות של אתרים באינטרנט ולרוב ChatGPT היה מספק זאת. וזה סיכון גדול להפרת זכויות יוצרים עבור החברה. נכון לעכשיו בעלי אתרים יכולים להחליט האם הם רוצים לחסום את Chat GPT מהאפשרות למשוך תוכן מהאתר שלהם באמצעות הסורקים שלהם. אני שמח שהגלישה הפתוחה חזרה, כי היא הופכת את ChatGPT להרבה יותר חזק.

ChatGPT יכול כעת לראות, לשמוע ולדבר!

בהשקה הגדולה והמרשימה ביותר השבוע של OpenAI היא היכולת של ChatGPT לראות לשמוע ולדבר. זה נקרא מולטי-מודאלי, והיכולת המולטי-מודאלית הזו מאפשרת ל-ChatGPT להיות מסוגל לקרוא תמונות ולקיים דיאלוג קולי עם משתמשים.

בדוגמה המופיעה בפוסט ההשקה, משתמש שואל את ChatGPT כיצד להוריד את מושב האופניים שלו ומספק תמונה של האופניים עבור ההקשר. ואז ChatGPT מספק עצות ליישום. המשתמש ממשיך עם תמונה נוספת המציגה את החלק הספציפי של האופניים שאולי צריך להתאים, ChatGPT מספק עצות לאופניים הספציפיים. זה פשוט מטורף ומעורר מחשבה! הרשת כבר מתחליה להיות מוצפת בדוגמאות מעוררות השראה.

אבל זה לא הכל, ChatGPT יכול עכשיו לתקשר עם קול ויכול לנהל שיחות מלאות! פשוט תפתחו את אפליקציית ChatGPT בטלפון שלכם ותתחילו לדבר איתו, ChatGPT יענה בקול ולא רק בטקסט. OpenAI אימנו אותו באמצעות שחקנים קוליים, למעשה הקול שנשמע ממש טוב ולא רובוטי בכלל. כל התכונות האחרות עתידות להשתחרר בימים/שבועות הקרובים לכל משתמשי ChatGPT Plus.

בנוסף, OpenAI סיפקה לפודקאסטרים של Spotify את היכולת לתרגם את הקול שלהם לשפות שונות. אבל זה לא קול מדובב או מתומלל, זה הקול של הפודקאסטר האמיתי אבל בשפות שונות! דמיינו את הפודקאסט הבריטי האהוב עליכם עם הקול הטבעי שלו רק שהוא מדבר בספרדית או צרפתית או אולי אפילו בעברית. זה באמת מדהים, ומאפשר את החשיפה של התוכן של רבים ואהובים לקהל רחב הרבה יותר מכל העולם.

אני חושב שכל התכונות האלה הן מה ש-Siri יכלה להיות כל הזמן הזה, ולאפל יש כמה יעדים גדולים להגיע אליהם כדי להתחרות עם ChatGPT. למרות שאני יודע שהם עובדים על הרבה מהפונקציות האלו כדי לשלב אותם ל-Siri.

הכירו את הרובוט Optimus של טסלה

כשאנחנו מאיצים אל העתיד, טסלה הוציאה סרטון חדש של הרובוט אופטימוס שלהם. מאז שהושק לפני כמה שנים, אופטימוס השתפר מאוד. למעשה בהשקה הראשונית זה הזוי, הם הציגו ממש בני אדם לבושים בחליפות רובוט שרקדו מסביב.

בסרטון המעודכן הזה Optimus מסוגל כעת לבצע כיול עצמי של הידיים והרגליים שלו באמצעות ראייה ושילוב מיקום מקודד בלבד, מיון קוביות לפי צבע גם בזמן שהסביבה משתנה באופן דינמי, ולבסוף מוציג יכולות איזון של עמידה על רגל אחת. חברת בוסטון דינמיקס היא עדיין מלך הרובוטיקה לעת עתה, עם רובוטים שמסוגלים ממש לעשות פארקור, אבל צריך לזכור שהם עובדים על זה כבר עשורים. וכאמור טסלה נמצאת רק כמה שנים בפיתוח, וההתקדמות שהם עשו מרשימה.

Meta AI

ל-Meta היו כמה השקות בתחום הבינה המלאכותיות השבוע. Meta AI שהושקה לראשונה, היא חוויית בינה מלאכותית חדשה בכל משפחת המוצרים שלהם. Meta AI שנמצא כרגע בבטא הוא עוזר שיחה מתקדם שיהיה זמין ב-WhatsApp Messenger וב-Instagram, הוא יגיע גם ל-Quest 3 VR החדש כמו גם למוצר משקפי השמש החדש שלהם, אבל עוד על כך בהמשך.

על פי הפוסט בבלוג שלהם, Meta AI מופעל על ידי מודל מותאם אישית הממנף את הטכנולוגיה מ-Llama 2 והמחקר החדשני של מודל שפה גדול (LLM). בצ'אטים מבוססי טקסט, ל-Meta AI יש גישה למידע בזמן אמת באמצעות שותפות החיפוש עם Bing ומציעה כלי ליצירת תמונות.

כך שמיקרוסופט לא רק שמפעילים את הגלישה ב-ChatGPT אלא עכשיו גם את גלישת הבינה המלאכותית של Meta. מיקרוסופט נראית כמו המנצחת הברורה כאן. בנוסף, Meta יוצרת AI עם דעות אישיות ותחומי עניין, וקצת יותר כיף ליצור איתם אינטראקציה.

העוזר AI של Meta, מפיצה סגל ראשוני של 28 דמויות בינה מלאכותי כמו קנדל ג׳נר

יחד עם Meta AI יש עוד 28 דמויות בינה מלאכותית שאפשר לשלוח אליהם הודעות ב-WhatsApp Messenger וב-Instagram. אתם יכולים לחשוב על ה-AI האלו כקאסט חדש של דמויות, כולן עם סיפורי רקע ייחודיים. חלק מהדמויות הללו כוללות את כוכב הטיק טוק צ'רלי דמיליו, כריס פול, קנדל ג'נר, Mr.Beast וסנופ דוג. ניתן למצוא את הסיפור המלא על הפיתוח הזה של Meta AI בכתבה שפורסמה כאן. אני לגמרי נעול על Snoop Dog, במי אתם תבחרו להשתמש?

EMU: מחולל האומנות החדש של Meta

Meta גם השיקה את EMU (Expressive Media Universe), הדור הבא שלהם לאומנות ג׳נרטיבית מבוססת בינה מלאכותית. EMU שואף להתחרות ישירות עם Midjourney והוא מובנה ישירות בחלק מהמוצרים השונים שלהם, כולל Messenger. כמו כן, EMU יוכל גם ליצור מדבקות (סטיקרים) שהן פופולריות מאוד בפלטפורמת המסנג'ר. הם גם בונים פונקציונליות דומה של אמנות בינה מלאכותית באינסטגרם וב-WhatsApp.

בהמשך לנושא של הוספת אמנות AI יצירתית למוצרים שלהם, Meta מפתחת אפשרות של עריכת תמונות עם בינה מלאכותית באמצעות למידה עמוקה ומחקר. לדוגמא, תוכלו לשנות בקלות את הרקע של תמונות ואת המיקום עם תכונה שנקראת Backdrop. ובשם הבטיחות הם הולכים לסמן בבירור תמונות שנוצרו או נערכו עם AI. ואתם כבר יודעים שאני מעריץ גדול של פיקוח ובטיחות בעולם הבינה המלאכותית. אני חושב שכל תוכן שנוצר עם בינה מלאכותית צריך להיות מסומן ככזה.

משקפי שמש Meta AI

כאמור Meta משיקה משקפי שמש בשיתוף עם Rayban, למעשה המשקפיים האלה נראים נורמליים לגמרי. זוכרים את הניסיון של גוגל לייצר משקפיים חכמים לפני כעשור ואיך הם נראו? ובכן כך לא יראו משקפי Meta.

משקפי השמש של Meta כוללים המון פונקציות בינה מלאכותית ויאפשרו לכם לשדר בשידור חי, לצלם תמונות, לנגן מוזיקה, לבצע שיחות טלפון ולשוחח עם Meta AI בקלות. המשקפיים האלה יגיעו בשני סגנונות ובמספר וריאציות צבע, וההבחנה האמיתית היחידה שעושה אותם ייחודיים הם המצלמות הקטנות בחזית. זה נראה כמו סיוט בתחום הפרטיות, אבל היום לכולם כבר יש מצלמות בכיס, אז אולי זה לא שונה בהרבה.

Meta Quest 3

Meta השיקה גם גרסה חדשה של ערכת אוזניות ה-Quest VR שלהם. עם כל חדשות הבינה המלאכותית שמגיעות מ-Meta לאחרונה, קל לשכוח בעצם שמארק צוקרברג שינה את מהות כל החברה שלו סביב Metaverse. ערכת ה-Quest 3 יגיע עם כוח עיבוד משופר, גרפיקה ורזולוציה משופרים, מבנה צר יותר ואיכות שמע מוגברת.

Meta דוהרת קדימה על מנת להיות מוכנה לקראת ההשקה הקרבה של אפל עם ה-Apple Vision Headset. התנסתי בעבר עם אוזניות VR, אבל הן אף פעם לא באמת הפכו לחלק מזרימת העבודה היומיומית שלי. הן ממש מגניבות אבל פשוט לא מצאתי עבורן מקרי שימוש יומיומיים. אני מאוד מתרגש מה-Apple Vision ואולי זה קשור לעובדה שאני מעריץ גדול של מוצרי Apple, אבל Meta Quest החדש הזה גם נראה ממש מגניב.

ה-Metaverse אמיתי: הטכנולוגיה הריאליסטית של צוקרברג מתעוררת לחיים

תקראו את הכתבה המלאה ששוחררה כאן לפני כמה ימים על ה-Metaverse אמיתי: הטכנולוגיה הריאליסטית של צוקרברג מתעוררת לחיים, זה מציג את חזון צוקרברג והאמת זה מטורף לחלטין.

Meta Quest אמור להיות מתומחר ב-$499, בשבריר מהעלות של ה-Apple Vision. אז Meta באמת נוקטת בגישת שיווקית שונה מאוד מאשר אפל. Meta מתייגת בבירור את Quest 3 כאוזניות מציאות משולבת, בעוד שלפני כן הם קראו להם רק מציאות מדומה. זו כנראה תגובה לכך שאפל כינתה את האוזניות שלהם מציאות מעורבת ולעולם לא השתמשה במילים מציאות מדומה, כנראה שהמונח VR כבר לא טרנדי.

אמזון נכנסת למירוץ

כדי לא להישאר מחוץ למירוץ הבינה המלאכותית, אמזון פרסמה השבוע כמה הכרזות בקשר לבינה מלאכותית. לראשונה, אמזון רכשה נתח גדול בחברת הבינה המלאכותית Anthropic, החברה שעומדת מאחורי כותב התוכן Claude 2, מתחרה ישירה ואיכותית במיוחד ל-ChatGPT. אמזון התחייבה על השקעה בסך 4 מיליארד דולר ב-Anthropic, אך גם סימנה שיתוף פעולה גדול יותר בין שתי החברות הכולל את AWS, והפיכתה לספקית הענן הראשית של Anthropic.

שתי החברות כבר השיקו את מודל הענן של Claude על גבי Amazon Bedrock, שהוא אחד משירותי הענן הרבים של AWS. תוכלו להתאים ולכוון אישית את Claude באמצעות יכולות ה-AI של Bedrock. המודל של Cloud יתחיל להשתלב גם במוצרים אחרים של אמזון.

אמזון תשקיע עד 4 מיליארד דולר ב-Anthropic היריבה של OpenAI

זהו מהלך חכם של אמזון המציגה אסטרטגיה דומה בין מיקרוסופט לבין OpenAI. עם השקעה עצומה של מיקרוסופט ב-OpenAI ובנוסף גם מספקת להם שירותי ענן.

תכונות חדשות עם Leonardo Elements

Leonardo.ai, מתחרה חזק של Midjourney, השיק תכונה חדשה בשם Elements. תכונת Elements מוסיפה את היכולת לשלב Lora בזרימת העבודה של יצירת תמונות. על פי ההכרזה: ״פישטנו את התהליך עבורך כדי למזג בצורה חלקה בין דגמי Mix וסגנונות שונים ולהשיג אפקטים מדהימים שמתיישרים בצורה מושלמת עם החזון היצירתי שלך״.

תוכלו ליצור מערך של אפקטים רבי עוצמה על התמונות שנוצרו, בשילוב של סגנונות אמנותיים כגון Baroque glass, steel Inferno ורבים נוספים. Leonardo.ai הוא ללא ספק דויד מול מספר גולייתים הכוללים את Midjourney ו- DALL·E 3. אבל אני מעריץ גדול של Leonardo כבר מהימים הראשונים שהיתנסתי בו, אז אני מעודד אותם מהיציע. Elements זמין כבר עכשיו לכל המשתמשים, אז אל תהססו לבדוק את התכונות החדשות.

Microsoft Copilot עם Windows 11

מיקרוסופט השיקה השבוע את Windows 11, עם Microsoft Copilot. על פי ההכרזה שהם פרסמו: Copilot בתוך Windows 11 הוא עוזר אינטליגנטי מופעל בינה מלאכותית שיעזור לכם לקבל תשובות והשראה מרחבי האינטרנט, תומך ביצירתיות ושיתוף פעולה, ומאפשר לכם להתמקד במשימות הניצבות מולכם.

Copilot הוטמע כמעט בכל היבט של מערכת ההפעלה של Windows והוא יכול לא רק לענות על שאלות אלא גם לשלוט בהיבטים שונים של סביבת ה-Windows שלכם. לא הייתה לי הזדמנות להוריד ולשחק עם Copilot עדיין, אבל אני בהחלט הולך לעשות את זה בקרוב.

סוגר את העדכון השבועי: גוגל עם Gemini

ועכשיו לסיפור האחרון שלנו, גוגל מתקרבת להשקה של Gemini המתחרה הישיר של GPT-4. ולמרות ש-OpenAI הקדימה את גוגל בהשקת תכונות מולטי-מודאליות, השמועה היא ש-Gemini תכלול תכונות מולטי-מודאליות כבר בהשקה. בשלב זה, גוגל סיפקה לקבוצה קטנה של חברות גישה ל-Gemini למטרות בדיקה.

Gemini הוא אוסף של מודלי בינה מלאכותית שתהיה להם גישה לאינטרנט, בנוסף לכל המידע שלכם כגון: היומן, דוא"ל ומסמכים. Gemini יוכל גם לכתוב קוד ולייצר תמונות, כל התכונות שכבר נתמכות בChatGPT.

ציינתי זאת בעבר, אבל זה נראה כאילו כל חברות הטכנולוגיה, כולל גוגל, מנסות כל הזמן לצמצם פערים עם OpenAI. זה לבטח מתסכל במיוחד עבור גוגל בהתחשב בכך שהם פרסמו את עבודת המחקר המקורית שהניעה את הגל הזה של טכנולוגיית בינה מלאכותית. כנראה שתשומת לב זה כל מה שאתם צריכים.

אם אהבתם את הכתבה הזו, תשקלו לעקוב אחרי ערוץ הטוויטר ולשתף את המידע הלאה.

נתראה בעדכון הבא, שכנראה לא יהיה רחוק, בהתחשב בהתקדמות המואצת שמתרחשת כל הזמן.

הגדילו את התנועה האורגנית שלכם עם SurferSEO
Jasper ai - ניסיון חינם

אולי יעניין אותך לקרוא…