בני האדם שמרו תמונות, חפצים, הקלטות וידאו וכו’ של בני משפחתם במשך הדורות. אבל מה אם בינה מלאכותית תוכל לאפשר לכם לשמוע אותם מדברים שוב? האם זו דרך טובה “לשמור אותם קרוב”, או שזה יהיה מטריד בצורה מסוכנת?

OpenAI הכריזה לאחרונה על Voice Engine – מודל AI שיכול להעתיק את הקול של כל אחד באמצעות הקלטה של 15 שניות בלבד של אותו אדם מדבר.

מהו מנוע קול?

Voice Engine הוא מודל שנועד ליצור דיבור בצלילים טבעיים המחקה מקרוב את קולו של הדובר המקורי באמצעות קלט טקסט בלבד ודגימת שמע בודדת של 15 שניות. טכנולוגיה זו, שפותחה בסוף 2022, מציגה את היכולת להפיק קולות רגשיים ומציאותיים גם עם דגם קטן וקלט דגימה מוגבל.

זה יושם כדי להפעיל קולות מוגדרים מראש בתכונות ה-API של טקסט לדיבור, ChatGPT Voice ו-Read Aloud, מה שמדגיש את הרבגוניות והיעילות שלו ביצירת דיבור אמיתי מטקסט.

זה מזכיר לי את אחד הפרקים של סדרת הלהיט של נטפליקס Black Mirror בשם “Be Right Back” שבו מוצגת אישה צעירה שהחבר שלה נהרג בתאונת דרכים.

כשהיא מתאבלת עליו, היא מגלה שהטכנולוגיה מאפשרת לה כעת לתקשר עם בינה מלאכותית המחקה אותו.

למרות שזהו תרחיש בדיוני, Voice Engine הופך יישומים דומים לאפשרות ממשית.

Black Mirror “Be Right Back”
מתוך הפרק Black Mirror – Be Right Back

3 יישומים מובילים לשיבוט קול

OpenAI הציגה מספר דוגמאות מעשיות של Voice Engine בפוסט בפרסמו בלוג שלהם, והנה שלושת היישומים האהובים עלי ביותר:

  1. תרגום ודיבוב תוכן: Voice Engine יכול לדובב תוכן כגון סרטונים ופודקאסטים. טכנולוגיה זו מאפשרת לעסקים וליוצרים לתרגם את התוכן שלהם למספר שפות תוך שמירה על הקול והמבטא של הדובר המקורי.
  2. תמיכה באנשים שאינם יכולים לדבר: מנוע קול הוא עזרה גדולה לאנשים שאינם יכולים לדבר. זה נותן להם קולות ייחודיים שנשמעים טבעיים, ולא רובוטיים.
  3. עוזר למטופלים לשחזר את קולם: במכון למדעי המוח של נורמן פרינס, Voice Engine עוזר לחולים שאיבדו את יכולת הדיבור שלהם עקב מחלה או פציעה. בעזרת קטע שמע קצר בלבד, הרופאים יכולים לשחזר את קולו של המטופל.

באופן אישי, אני נרגש לראות את Voice Engine משתלב באפליקציות ובמכשירים האהובים עלינו. מקרי השימוש הפוטנציאליים כמו ברשימה למטה באמת יכולים להיות מדהימים.

  • היכולת להשתמש בקול שלי בשפות אחרות כדי שאוכל לבצע לוקליזציה בסרטוני YouTube תהיה עצומה.
  • ליצירת משחקים, בידור או דרמות רדיו, Voice Engine יאפשר לאדם אחד להשמיע תפקידים שונים בקול משכנע, ולספק גמישות יצירתית יותר בתקציב הפקה מוגבל.
  • דמיינו לעצמכם צפייה בסרט של נטפליקס ביפנית ולהיות מסוגלים לעבור במהירות לכל שפה לפי דרישה, כל זאת תוך שמירה על קולות השחקנים המקוריים.

כדי להעריך באמת את העוצמה והפוטנציאל של מנוע הקול של OpenAI, אתם באמת צריכים לשמוע את זה בעצמכם. אני ממליץ בחום לבדוק את הדוגמאות באתר של OpenAI.

ToolAi.co - כלי בינה מלאכותית להמרת טקסט לדיבור הטובים ביותר

8 כלי בינה מלאכותית להמרת טקסט לדיבור הטובים ביותר (בחינם ובתשלום)

גלו את כלי הבינה המלאכותית הטובים ביותר שיכולים להמיר טקסט לדיבור, ליצירת תוכן אודיו מרתק. השוואת תכונות, תמחור ומאפיינים עבור הצרכים שלכם.

שיבוט קול יכול להיות מסוכן מאוד

ברור שהיתרונות הפוטנציאליים של Voice Engine הם גדולים, אבל עדיין יש סיכונים משמעותיים שיש לקחת בחשבון. לטכנולוגיית שיבוט קול מתקדמת כזו יש פוטנציאל לניצול לרעה בדרכים שעלולות לגרום נזק ממשי לפרטים, לארגונים ולחברה שלנו בכללותה.

  • שימוש בהונאות: פושעים יכולים לשכפל קולות של אנשים כדי להונות אחרים למען רווח כספי. לדוגמה, רמאים יכולים להתחזות באופן סינתטי לקרובי משפחה, נציגי רשויות או לאנשי קשר עסקיים כדי להערים על קורבנות לשלוח כסף או לחשוף מידע רגיש.
  • הפצת מידע שגוי ותוכן מזויף: ניתן להשתמש בנשק הזה כדי ליצור תוכן אודיו מזויף של אישי ציבור האומרים דברים שהם מעולם לא אמרו בפועל. אודיו קולי סינתטי יכול לשמש להפצת חדשות מזויפות, תעמולה, תיאוריות קונספירציה ומתיחה בקנה מידה חסר תקדים.
  • הפרת פרטיות והסכמה: זה פשוט ליצור תוכן אודיו מזויף של כל אחד ללא ידיעתו או הסכמתו, כל עוד דגימת הקול זמינה. זה פותח את הדלת ליצירת פורנו אודיו ללא הסכמה, שיחות פרטיות מזויפות ועוד חדירות מטרידות לפרטיות. גם אם אינו משותף בפומבי, שיבוט קול ללא הסכמה מהווה הפרה.
  • שיבוש תעשיית שחקני קול ודיבוב: שיבוט קול יאפשר לבמאים וליוצרים לקבל בדיוק את הסאונד שהם רוצים עבור הדמויות שלהם. זה בעצם יכול להחליף שחקני קול וגניבת הדמיון שלהם.
  • סיבוך הליכים משפטיים ועיתונות: כרסום האמון בראיות שמע ככל ששיבוט קול הופך לנגיש ומציאותי יותר, הוא עלול לערער את האמון בהקלטות שמע כראיות מהימנות. הודעות קוליות מזויפות, הקלטות פגישות וראיונות עלולים לשמש כדי להפליל אנשים באופן שקרי או לזרוע ספק.
שיבוט קול יכול להיות מסוכן מאוד

איך מקבלים גישה?

OpenAI עדיין לא פרסמה באופן נרחב את מודל הבינה המלאכותית עקב חששות לגבי שימוש פוטנציאלי לרעה והשלכות אתיות.

החברה נזהרת לגבי השחרור הרחב יותר של Voice Engine ומתקשרת עם מספר מצומצם של שותפים שהסכימו לתנאי שימוש מחמירים, כגון אי התחזות לאנשים ללא הסכמה וגילוי שהקולותיהם נוצרו עם בינה מלאכותית.

OpenAI גם עובדת על הטמעת מנגנוני אבטחה למניעת שימושים זדוניים ב-Voice Engine כדי להבטיח שהטכנולוגיה לא תנוצל לרעה למטרות מזיקות.

מחשבות לסיכום

הסכנות של מודל AI לשיבוט קול הן בלתי נמנעות.

אם ינוצל לרעה, שיבוט קול יכול לאפשר רמות חדשות של הונאה, גניבת זהות, מידע מוטעה והפרת פרטיות. זה מאיים להרוס תעשיות שלמות כמו דיבוב וקריינות.

ברגע שכל קול יכול להיות משוכפל בצורה מושלמת על ידי AI, איך נוכל לסמוך על מה שאנו שומעים?

נצטרך להסתגל לעידן שבו ניתן ליצור אודיו בקלות כמו טקסט. בדיוק כפי מחוללי תמונות הפכו לפזמון נפוץ, בקרוב ״חתימה קולית״ עשויה להופיע באופן נרחב ככל שזיופי אודיו עמוקים מתרבים. מנה בריאה של ספקנות תהיה מוצדקת.

גילוי נאות:

תוכן המאמר נכתב לאחר מאמץ ומחקר על מנת לספק את התוכן האמין ביותר שניתן. כמו כן התוכן מתייחס למידע שקיים בעת שעודכן לאחרונה בתאריך: 08/04/2024, ולכן עשויים להיות שינויים ואי התאמות שחלו מאז.
כמו כן, כל המאמרים המסקרים מוצרים או שירותים כלשהם הינם מוצרים שרכשתי והתנסתי בהם בעצמי. בחלק מהמקרים אני אקשר לאתרי המוצרים באמצעות קישור שיתופי (Affiliate), שיתוף פעולה זה מאפשר לי לעיתים לספק לכם הגולשים הטבות מיוחדות ובתמורה אני מתוגמל באופן חלקי ואינו משפיע על העלות הסופית.
תודה על שיתוף הפעולה. ומקווה שהפקתם את המיטב מקריאה זו.

הגדילו את התנועה האורגנית שלכם עם SurferSEO
Jasper ai - ניסיון חינם

אולי יעניין אותך לקרוא…