ChatGPT יכול כעת לראות, לשמוע ולדבר - רובוטים מזמינים לעצמם ארוחה בבית קפה

הצ’טבוט AI הסופר-פופולרי עד כה היה רק תיבת טקסט. עכשיו הוא לומד להבין את השאלות שלכם בדרכים חדשות.

רוב השינויים של OpenAI ב-ChatGPT כוללים את מה שהבוט המופעל על ידי בינה מלאכותית יכול לעשות: שאלות שהוא יכול לענות עליהן, מידע שהוא יכול לגשת אליו ומודלים משופרים.

כעת תוכלו להנחות את ChatGPT עם תמונות ופקודות קוליות

עם זאת, הפעם הוא משנה את הדרך שבה אתם משתמשים ב-ChatGPT עצמו. החברה משיקה גרסה חדשה של השירות המאפשרת לכם להנחות את הבוט AI לא רק על ידי הקלדת משפטים בתיבת טקסט, אלא על ידי דיבור בקול או סתם העלאת תמונה. הפיצ’רים החדשים יוצעו ללקוחות בחבילה בתשלום עבור ChatGPT בשבועות הקרובים, וכל השאר יקבלו אותם “זמן קצר לאחר מכן” על פי OpenAI.

החלק של הצ’אט הקולי די מוכר: אתם לוחצים על כפתור ושואלים בקולכם את השאלה, ChatGPT ממיר אותה לטקסט ומזין אותה למודל השפה הגדול, מקבל תשובה בחזרה, ממיר אותה בחזרה לדיבור ומדבר את התשובה בקול רם. זה אמור להרגיש בדיוק כמו לדבר עם Alexa או Google Assistant, רק ש- OpenAI מקווה – שהתשובות יהיו טובות יותר הודות לטכנולוגיה המשופרת. נראה שרוב העוזרים הוירטואליים נבנים מחדש כדי להסתמך על מודלי שפה גדול – רק ש- OpenAI מקדים מאוד את כולם במשחק.

מודל ה-Whisper המצוין של OpenAI עושה הרבה מעבודת הדיבור לטקסט, והחברה מוציאה מודל טקסט לדיבור חדש שלדבריה יכול ליצור “אודיו דמוי אדם מטקסט וממספר שניות של דיבור לדוגמה”. תוכלו לבחור את הקול של ChatGPT מתוך חמש אפשרויות, אבל נראה ש-OpenAI חושב שלמודל יש הרבה יותר פוטנציאל מזה. OpenAI עובדת עם Spotify כדי לתרגם פודקאסטים לשפות אחרות, למשל, כל זאת תוך שמירה על צליל הקול של יוצר הפודקאסט. יש הרבה שימושים מעניינים לקולות סינתטיים, ו-OpenAI יכול להיות חלק גדול מהתעשייה הזו.

העובדה שניתן לבנות קול סינתטי עם רק כמה שניות של אודיו פותחת את הדלת לכל מיני מקרי שימוש בעייתיים. בפוסט ההכרזה על התכונות החדשות, מטעם החברה נאמר: “היכולות הללו מציגות גם סיכונים חדשים, כמו הפוטנציאל של שחקנים זדוניים להתחזות לדמויות ציבוריות או לבצע הונאה”. המודל אינו זמין לשימוש רחב בדיוק מהסיבה הזו, נאמר מ-OpenAI: הוא יהיה הרבה יותר מבוקר ומאופק למקרי שימוש ושותפויות ספציפיים.

חיפוש התמונות של ChatGPT: הזדמנויות ואתגרים

חיפוש התמונות, בינתיים, דומה קצת ל-Google Lens. אתם מצלמים תמונה של כל מה שאתם מעוניין בו, ו-ChatGPT ינסה להבין מה אתם שואלים ולהגיב בהתאם. אתם יכולים גם להשתמש בכלי הציור של האפליקציה כדי להבהיר את השאילתה שלכם, או לדבר ולהקליד שאלות שיתלוו לתמונה. זה המקום שבו הסגנון של הצ׳אט של ChatGPT כל כך מועיל: במקום לבצע חיפוש, לקבל את התשובה השגויה ולאחר מכן לבצע חיפוש נוסף, אתם יכולים להנחות את הבוט ולחדד את התשובה תוך כדי. (זה מאוד דומה למה שגוגל עושה בחיפוש מולטי-מודאלי.)

וגם יעניין אתכם: הצ’אט-בוטים AI הטובים ביותר: ChatGPT וחלופות ראויות אחרות

ברור שגם לתכונת התמונות יש בעיות פוטנציאליות. אחד מהם הוא מה שעלול לקרות במידה ותבצעו הנחיה בצ׳אט לגבי אדם מסויים. לדברי OpenAI, נאמר שהם הגבילו את “היכולת של ChatGPT לנתח ולהצהיר הצהרות ישירות על אנשים” הן מטעמי דיוק והן מטעמי פרטיות. כנראה שחזון המדע בידיוני על הבינה מלאכותית, היכולת של AI להסתכל על מישהו ולדעת “מי זה?”, לא יגיע ממש בקרוב. וזה כנראה דבר טוב.

כמעט שנה לאחר ההשקה הראשונית של ChatGPT, נראה ש-OpenAI עדיין מנסה להבין איך לתת לבוט שלו יותר תכונות ויכולות מבלי ליצור סדרות חדשות של בעיות וחסרונות. עם העדכונים האחרונים, החברה מנסה ללכת על הקו הדק הזה בכך שהיא מגבילה בכוונת תחילה את יכולות המודלים החדשים. אבל הגישה הזו לא תעבוד לנצח. ככל שיותר אנשים ישתמשו בשליטה קולית ובחיפוש תמונות, וככל ש-ChatGPT קרוב יותר להיות עוזר וירטואלי רב-מודאלי ושימושי באמת, יהיה קשה יותר ויותר לשמור על מעקה הבטיחות ההולך וקטן.

גילוי נאות:

תוכן המאמר נכתב לאחר מאמץ ומחקר על מנת לספק את התוכן האמין ביותר שניתן. כמו כן התוכן מתייחס למידע שקיים בעת שעודכן לאחרונה בתאריך: 25/09/2023, ולכן עשויים להיות שינויים ואי התאמות שחלו מאז.
כמו כן, כל המאמרים המסקרים מוצרים או שירותים כלשהם הינם מוצרים שרכשתי והתנסתי בהם בעצמי. בחלק מהמקרים אני אקשר לאתרי המוצרים באמצעות קישור שיתופי (Affiliate), שיתוף פעולה זה מאפשר לי לעיתים לספק לכם הגולשים הטבות מיוחדות ובתמורה אני מתוגמל באופן חלקי ואינו משפיע על העלות הסופית.
תודה על שיתוף הפעולה. ומקווה שהפקתם את המיטב מקריאה זו.

הגדילו את התנועה האורגנית שלכם עם SurferSEO
Jasper ai - ניסיון חינם

אולי יעניין אותך לקרוא…