כיצד לחסום את הסורק החדש של OpenAI מלחדור לנתונים שלכם

היוצרים של ChatGPT מאמנים את הדור הבא של מערכות הבינה המלאכותית, על פי הדיווחים זה כולל גם את GPT-5. מספיק מילה אחת שתעצור את הסריקה.

OpenAI פרסם סורק אינטרנט חדש – הנקרא GPTBot – יחד עם הנחיות כיצד לחסום אותו.

ChatGPT היא אחת ממערכות הבינה המלאכותית המתקדמות ביותר שנבנו אי פעם, למרות הדיווחים האחרונים על האינטליגנציה התנודתית שלה. OpenAI, החברה שמאחורי צ’טבוט הבינה המלאכותית, ממשיכה לאמן את מודלי השפה הגדולים שלה (LLMs), כמו GPT-3.5 ו-GPT-4.

סורקי אינטרנט, המשמשים מנועי חיפוש כמו גוגל ובינג לסריקת אתרים ולאנדקס תוכן, משמשים גם חברות בינה מלאכותית כדי להכשיר LLM. מודלים אלו לומדים מהתוכן של אתרי אינטרנט ומכל נתון אחר שמפתחיהם בוחרים לאמן אותם. שימוש בסורק אינטרנט מזרז תהליך זה בכך שהוא מאפשר ל-LLMs להתאמן על כמויות אדירות של נתונים.

“מתן אפשרות ל-GPTBot לגשת לאתר שלך יכול לעזור למודלים של AI להיות מדויקים יותר ולשפר את היכולות הכלליות והבטיחות שלהם”

מצהירים OpenAI בתיעוד ה-GPTBot שלהם. החברה טוענת שהיא מסננת דפי אינטרנט הדורשים גישה בתשלום, או אתרים שאוספים מידע אישי או שיש להם תוכן שמפר את המדיניות של OpenAI.

לבעלי אתרים יש אפשרות לחסום את ה-GPTBot מגישה לאתרים שלהם כדי להשתמש במידע שלהם באימון מערכות בינה מלאכותית.

OpenAI מסביר כיצד לא לאפשר או להתאים אישית גישת GPTBot לאתר שלך.
OpenAI מסביר כיצד לא לאפשר או להתאים אישית גישת GPTBot לאתר שלך.

כדי לחסום את הגישה של GPTBot לאתר לחלוטין, בעל האתר יכול להוסיף את הטוקן של ה-GPTBot ל-robots.txt של האתר ו-“Disallow: /”.

OpenAI גם מאפשר למשתמשים להתאים אישית את הגישה של GPTBot רק על ידי מתן אפשרות לסרוק חלקים מסוימים באתר שלהם. כדי לחסום את הגישה של GPTBot לחלקים של אתר אינטרנט, יש להוסיף את GPTBot ל-robots.txt של האתר ואת “Allow: /directory-1/” ו-“Disallow: /directory-2/” ולהתאים אישית לפי הצורך.

ובנוסף: Nvidia משפרת את ה-Superchip שלה Grace-Hopper עם זיכרון מהיר יותר עבור AI

OpenAI לא הכריזה בעבר על שימוש בסורקי אינטרנט כדי להכשיר את GPT-3.5, ה-LLM מאחורי הגרסה החינמית של ChatGPT, או GPT-4, ה-LLM החדש ביותר שלה שזמין למנויי ChatGPT Plus שמניע את Bing AI.

למרות שלא ברור האם נעשה שימוש ב-GPTBot כדי להכשיר את ה-LLMs הזמינים כרגע של OpenAI, ייתכן שזה הסורק האינטרנטי שמאמן את GPT-5, בהנתן שהחברה הגישה את השם המסחרי ביולי. בעוד ש-OpenAI לא הכריזה על תאריך שיחרור ל-GPT-5, ה-LLM החדש צפוי להיות חזק וגדול הרבה יותר מ-GPT-4, שהוא כיום ה-LLM הגדול ביותר שקיים.

יהיה מעניין לקרוא: ChatGPT בשירות לקוחות: 7 דרכים חדשניות לשמח את הלקוחות שלכם

מאז השקת ChatGPT, OpenAI ספגה כמה תביעות בטענה שכלי הבינה המלאכותית גונבת נתונים ממשתמשים, כולל מקרה של הפרת זכויות יוצרים שהפך את החברה למטרה של חקירת FTC. אתרים כמו Stack Overflow, Reddit וטוויטר אמרו שהם מתכננים להתחיל לחייב תשלום מחברות בינה מלאכותית כדי לגשת לנתונים שלהם.

גילוי נאות:

תוכן המאמר נכתב לאחר מאמץ ומחקר על מנת לספק את התוכן האמין ביותר שניתן. כמו כן התוכן מתייחס למידע שקיים בעת שעודכן לאחרונה בתאריך: 21/09/2023, ולכן עשויים להיות שינויים ואי התאמות שחלו מאז.
כמו כן, כל המאמרים המסקרים מוצרים או שירותים כלשהם הינם מוצרים שרכשתי והתנסתי בהם בעצמי. בחלק מהמקרים אני אקשר לאתרי המוצרים באמצעות קישור שיתופי (Affiliate), שיתוף פעולה זה מאפשר לי לעיתים לספק לכם הגולשים הטבות מיוחדות ובתמורה אני מתוגמל באופן חלקי ואינו משפיע על העלות הסופית.
תודה על שיתוף הפעולה. ומקווה שהפקתם את המיטב מקריאה זו.

הגדילו את התנועה האורגנית שלכם עם SurferSEO
Jasper ai - ניסיון חינם

אולי יעניין אותך לקרוא…