כיצד לחסום את הסורק החדש של OpenAI מלחדור לנתונים שלכם

עורך: טל כץ עודכן לאחרונה: 21/09/2023

כיצד לחסום את הסורק החדש של OpenAI מלחדור לנתונים שלכם

היוצרים של ChatGPT מאמנים את הדור הבא של מערכות הבינה המלאכותית, על פי הדיווחים זה כולל גם את GPT-5. מספיק מילה אחת שתעצור את הסריקה.

תוכן המאמר

OpenAI פרסם סורק אינטרנט חדש – הנקרא GPTBot – יחד עם הנחיות כיצד לחסום אותו.

ChatGPT היא אחת ממערכות הבינה המלאכותית המתקדמות ביותר שנבנו אי פעם, למרות הדיווחים האחרונים על האינטליגנציה התנודתית שלה. OpenAI, החברה שמאחורי צ’טבוט הבינה המלאכותית, ממשיכה לאמן את מודלי השפה הגדולים שלה (LLMs), כמו GPT-3.5 ו-GPT-4.

סורקי אינטרנט, המשמשים מנועי חיפוש כמו גוגל ובינג לסריקת אתרים ולאנדקס תוכן, משמשים גם חברות בינה מלאכותית כדי להכשיר LLM. מודלים אלו לומדים מהתוכן של אתרי אינטרנט ומכל נתון אחר שמפתחיהם בוחרים לאמן אותם. שימוש בסורק אינטרנט מזרז תהליך זה בכך שהוא מאפשר ל-LLMs להתאמן על כמויות אדירות של נתונים.

“מתן אפשרות ל-GPTBot לגשת לאתר שלך יכול לעזור למודלים של AI להיות מדויקים יותר ולשפר את היכולות הכלליות והבטיחות שלהם”

מצהירים OpenAI בתיעוד ה-GPTBot שלהם. החברה טוענת שהיא מסננת דפי אינטרנט הדורשים גישה בתשלום, או אתרים שאוספים מידע אישי או שיש להם תוכן שמפר את המדיניות של OpenAI.

לבעלי אתרים יש אפשרות לחסום את ה-GPTBot מגישה לאתרים שלהם כדי להשתמש במידע שלהם באימון מערכות בינה מלאכותית.

OpenAI מסביר כיצד לא לאפשר או להתאים אישית גישת GPTBot לאתר שלך.

כדי לחסום את הגישה של GPTBot לאתר לחלוטין, בעל האתר יכול להוסיף את הטוקן של ה-GPTBot ל-robots.txt של האתר ו-“Disallow: /”.

OpenAI גם מאפשר למשתמשים להתאים אישית את הגישה של GPTBot רק על ידי מתן אפשרות לסרוק חלקים מסוימים באתר שלהם. כדי לחסום את הגישה של GPTBot לחלקים של אתר אינטרנט, יש להוסיף את GPTBot ל-robots.txt של האתר ואת “Allow: /directory-1/” ו-“Disallow: /directory-2/” ולהתאים אישית לפי הצורך.

ובנוסף: Nvidia משפרת את ה-Superchip שלה Grace-Hopper עם זיכרון מהיר יותר עבור AI

OpenAI לא הכריזה בעבר על שימוש בסורקי אינטרנט כדי להכשיר את GPT-3.5, ה-LLM מאחורי הגרסה החינמית של ChatGPT, או GPT-4, ה-LLM החדש ביותר שלה שזמין למנויי ChatGPT Plus שמניע את Bing AI.

למרות שלא ברור האם נעשה שימוש ב-GPTBot כדי להכשיר את ה-LLMs הזמינים כרגע של OpenAI, ייתכן שזה הסורק האינטרנטי שמאמן את GPT-5, בהנתן שהחברה הגישה את השם המסחרי ביולי. בעוד ש-OpenAI לא הכריזה על תאריך שיחרור ל-GPT-5, ה-LLM החדש צפוי להיות חזק וגדול הרבה יותר מ-GPT-4, שהוא כיום ה-LLM הגדול ביותר שקיים.

יהיה מעניין לקרוא: ChatGPT בשירות לקוחות: 7 דרכים חדשניות לשמח את הלקוחות שלכם

מאז השקת ChatGPT, OpenAI ספגה כמה תביעות בטענה שכלי הבינה המלאכותית גונבת נתונים ממשתמשים, כולל מקרה של הפרת זכויות יוצרים שהפך את החברה למטרה של חקירת FTC. אתרים כמו Stack Overflow, Reddit וטוויטר אמרו שהם מתכננים להתחיל לחייב תשלום מחברות בינה מלאכותית כדי לגשת לנתונים שלהם.

קראו עוד בנושא: ChatGPT

גילוי נאות:

תוכן המאמר נכתב לאחר מאמץ ומחקר על מנת לספק את התוכן האמין ביותר שניתן. כמו כן התוכן מתייחס למידע שקיים בעת שעודכן לאחרונה בתאריך: 21/09/2023, ולכן עשויים להיות שינויים ואי התאמות שחלו מאז.
כמו כן, כל המאמרים המסקרים מוצרים או שירותים כלשהם הינם מוצרים שרכשתי והתנסתי בהם בעצמי. בחלק מהמקרים אני אקשר לאתרי המוצרים באמצעות קישור שיתופי (Affiliate), שיתוף פעולה זה מאפשר לי לעיתים לספק לכם הגולשים הטבות מיוחדות ובתמורה אני מתוגמל באופן חלקי ואינו משפיע על העלות הסופית.
תודה על שיתוף הפעולה. ומקווה שהפקתם את המיטב מקריאה זו.

אודות הכותב

טל כץ

קצת על העורך: מומחה לשיווק דיגיטלי, פיתוח אסטרטגיית מותג ובניית אתרים החל משנת 2009. בעל תואר ראשון בשיווק ומנהל עסקים ובעלים של סוכנות לשיווק דיגיטלי TKMedia.co.il. מפתח אפליקציות וכלי בינה מלאכותית, כותב וסוקר על טכנולוגיה וגאדג׳טים.

אולי יעניין אותך לקרוא…

Claude AI Artifacts – אפשר לשתף ולפרסם באינטרנט
בעוד ש-OpenAI ממשיכה לדשדש בשיחרור תכונות חדשות, Anthropic מוציאה דברים חדשים ומגניבים במשך כבר כמה שבועות. השדרוג האחרון מ-Anthropic הוא…
המשך קריאה Claude AI Artifacts – אפשר לשתף ולפרסם באינטרנט
26 הנחיות Midjourney (מידג׳רני) ליצירת תמונות פוטוריאליסטיות של אנשים
מאז יציאתו בתחילת 2022, Midjourney קידמה משמעותית את אפליקציות ה- AI הג׳נרטיבי ליצירת תמונות בינה מלאכותית על ידי הצעת ממשק…
המשך קריאה 26 הנחיות Midjourney (מידג׳רני) ליצירת תמונות פוטוריאליסטיות של אנשים
בינה מלאכותית בתחום הבריאות: הזדמנויות ואתגרים
אמנם רובנו מבינים שבינה מלאכותית (AI) היא כבר לא עניין של מדע בדיוני ושאנחנו מתקשרים איתה מדי יום – במובנים…
המשך קריאה בינה מלאכותית בתחום הבריאות: הזדמנויות ואתגרים
Bard Chatbot של גוגל מקבל שידרוג משמעותי הודות ל-Gemini
הצ’אטבוט של גוגל הוא המקום הטוב ביותר לנסות את המודל החדש שלו, המתקדם לכאורה – האם הוא יכול להדביק את…
המשך קריאה Bard Chatbot של גוגל מקבל שידרוג משמעותי הודות ל-Gemini
Bard טוב כמעט כמו ChatGPT – רק איטי יותר
בארד המופעל על ידי Gemini Pro הוא כלי רב עוצמה, אבל האם הוא משתווה ל- ChatGPT עם GPT-4? בחודש דצמבר…
המשך קריאה Bard טוב כמעט כמו ChatGPT – רק איטי יותר
OpenAI חושפת סוף סוף את GPT-4.5 מה הוא יכול לעשות?
OpenAI השיקה רשמית את GPT-4.5, בשם הקוד “אוריון”, המסמן צעד משמעותי קדימה במודלים של בינה מלאכותית. GPT-4.5 תוכנן לשפר דיוק,…
המשך קריאה OpenAI חושפת סוף סוף את GPT-4.5 מה הוא יכול לעשות?

חברים יקרים!

ביקשתם, אז קיבלתם…ישירות אליכם למייל:
חדשות, טיפים ומדריכים, מבצעים וכלי בינה מלאכותית.
השאירו שם ומייל וגם אתם לא תצטרכו לדאוג שתפספסו משהו בעולם ה-AI!

כותב תוכן בינה מלאכותית הטוב ביותר שלנו

Jasper AI הוא אחד מעוזרי הכתיבה הטובים ביותר של AI שנועד ליצור תוכן המותאם למותג שלכם. כותב בינה מלאכותית זה מושלם עבור עסקים, מבלוגרים ועד מותגי מסחר אלקטרוני, עסקים מבוססי שירות ועוד.

נסו בחינם ל-7 ימים

כיצד לחסום את הסורק החדש של OpenAI מלחדור לנתונים שלכם

אולי יעניין אותך לקרוא…

Claude AI Artifacts – אפשר לשתף ולפרסם באינטרנט

26 הנחיות Midjourney (מידג׳רני) ליצירת תמונות פוטוריאליסטיות של אנשים

בינה מלאכותית בתחום הבריאות: הזדמנויות ואתגרים

Bard Chatbot של גוגל מקבל שידרוג משמעותי הודות ל-Gemini

Bard טוב כמעט כמו ChatGPT – רק איטי יותר

OpenAI חושפת סוף סוף את GPT-4.5 מה הוא יכול לעשות?

ניווט באתר

DeepSeek AI דיפסיק

PhotoRoom

Photopea

GPTzero

צאט גיפיטי Chat GPT

Luminar Neo