בארד המופעל על ידי Gemini Pro הוא כלי רב עוצמה, אבל האם הוא משתווה ל- ChatGPT עם GPT-4?

בארד המופעל על ידי Gemini Pro הוא כלי רב עוצמה, אבל האם הוא משתווה ל- ChatGPT עם GPT-4?

בחודש דצמבר 2023, גוגל הכריזה על שחרורו של Gemini, מודל הבינה המלאכותית החזק ביותר שלה עד כה. היא שילבה את Gemini באופן מיידי בצ’אטבוט ה-AI הגנרטיבי שלה, Bard, בתקווה למשוך כמה שיותר משתמשים מהמתחרה הגדול ביותר שלה, ChatGPT של OpenAI.

ChatGPT וה-Bard החדש המופעל על ידי Gemini הם מוצרים דומים. Gemini Pro הוא הדומה ביותר ל-GPT-4, הזמין למנויים על ChatGPT Plus. אז החלטנו לבחון את שני הצ’אטבוטים ולראות איך הם משתווים – ברמת הדיוק, במהירות ויכולות העזרה באופן כללי.

Gemini מול ChatGPT: הבסיס

ChatGPT Plus ו-Gemini Pro הם שניהם צ’אטבוטים מתקדמים מאוד המבוססים על מודלים של שפות גדולות. אלו הם מוצרי הדגל העדכניים והטובים ביותר שכל אחת מהחברות מציעות היום, כשהם מבטיחים להיות מהירים יותר וטובים יותר בתשובה לשאילתות מאשר קודמיהם. והכי חשוב, שניהם מאומנים על מידע עדכני, במקום לדעת רק מה היה באינטרנט עד 2021. הם גם די פשוטים לשימוש כמוצרים עצמאיים, בניגוד למודל החדש של אילון מאסק, Grok, ששוחרר כתוסף ב-X (טוויטר).

עם זאת, השניים לא בדיוק שווים. ראשית, Bard מוצע בחינם – בעוד ש-ChatGPT Plus המופעל על ידי GPT-4 עולה $20 לחודש. מצד שני, ל-Bard המופעל על ידי Gemini Pro אין את היכולות הרב-מודאליות של ChatGPT Plus. מודלים של שפה מולטי-מודאלית יכולים לקבל בקשת טקסט ולהגיב עם סוגי מדיה שונים כמו תמונה או סרטון. ג’מיני ובארד יעשו זאת בסופו של דבר, אבל זה ככל הנראה יהיה עם הגרסה הגדולה יותר של Gemini בשם Ultra שגוגל טרם שיחררה. כרגע Bard מספק מדי פעם תוצאות גרפיות, ובזה אני מתכוון שהוא ליטרלי מייצר גרפים.

אך יש לציין, שבארד מספק גם דרך מעניינת לבדוק טיוטות עם תשובות אחרות, תכונה שלא קיימת בתוך ChatGPT.

אחד הקשיים שיש בבדיקת צ’אטבוטים, הוא שהתגובות יכולות להשתנות באופן משמעותי כשבודקים שוב את אותן הנחיות מספר פעמים. בהמשך, אני אזכיר כל שינוי משמעותי שנתקלתי בו. למען ההגינות, העברתי את אותן הנחיות ראשוניות לכל בוט, החל מבקשות פשוטות ועד לבקשות מורכבות יותר בעת הצורך.

הבדל כללי אחד היה שבארד נוטה להיות איטי יותר מ-ChatGPT. בדרך כלל לקח לו בין חמש לשש שניות “לחשוב” לפני שהוא התחיל לכתוב, בעוד ש-ChatGPT הגיב כמעט מיד כשהחל לספק את התוצאות שלו. (זמן הפלט הכולל של שניהם תלוי באיזה מידע התבקש – הנחיות מסובכות יותר נוטות לייצר תשובות ארוכות שלוקח יותר זמן לסיים). ההבדל במהירות היה עקבי לאורך הימים שביליתי בבדיקות עם שתי האפליקציות.

גם OpenAI וגם גוגל הציבו כמה מגבלות על סוגי התשובות שהצ’אטבוטים יכולים לתת. באמצעות תהליך שנקרא Red Teaming – שבו מפתחים בודקים תוכן ומדיניות בטיחות על ידי ניסיון שוב ושוב ״לשבור את הכללים״ – חברות בינה מלאכותית בונות גבולות בטיחות כנגד הפרות זכויות יוצרים או מתן תשובות גזעניות ומזיקות. באופן כללי, נתקלתי בהגבלות של גוגל לעתים קרובות יותר מאשר בהגבלות של ChatGPT.

“תן לי מתכון לעוגת שוקולד”

Midjourney-V6 - "תן לי מתכון לעוגת שוקולד"
Midjourney-V6 – “תן לי מתכון לעוגת שוקולד”

ביקשתי משתי הפלטפורמות לתת לי מתכון לעוגת שוקולד. מתכונים הם נושא חיפוש פופולרי ברחבי האינטרנט – כך שהצ’אטבוטים האלו אינם יוצאי דופן.

למען ההגינות, אני לא אופה או קונדיטור. אבל לצורך האמינות, בדקתי עם מקור מהימן שאינו בינה מלאכותית: ספרי בישול של אופים מוכרים.

עם כל הנאמר, היו כמה סיבוכים. היו לי ספקות לגבי הגרסה של ChatGPT לעוגה הכוללת מים רותחים, מכיוון שקפה נפוץ יותר במתכונים של עוגות שוקולד. בינתיים, נראה ש-Bard העתיק מקרוב מתכון מהאתר “רגע מתוק”… אבל עם שינוי אקראי לכאורה של ציפוי העוגה.

הייתה רק דרך אחת להבין האם זה עובד: להציג את הממצאים לזוגתי ״האופה״. התוצאות? שתי העוגות היו פונקציונליות – אבל לא ממש ברמה של העוגות שאני מתענג עליהם מהבית.

“אני רוצה ללמוד עוד על תה”

Midjourney-V6 - "אני רוצה ללמוד עוד על תה"
Midjourney-V6 – “אני רוצה ללמוד עוד על תה”

כשהתחלתי לבדוק את הצ’אטבוטים למאמר הזה, היה לי דיון אקראי עם חברים על תה וקפה. מישהו הזכיר שבארד נתן לו רשימה של ספרים לקריאה על תה, אז לקחתי את הדברים צעד אחד קדימה וביקשתי משני הצ’אטבוטים מידע ישיר על המשקה הפופלארי, יחד עם כמה הפניות של ספרים.

שתי התוצאות סיפרו לי את היסודות של התה, כולל מקורותיו וסוגיו, היתרונות הבריאותיים ורשימת נקודות על איך לחלוט אותו. Bard נתן לי קישורים למאמרים כדי ללמוד עוד על תה, בעוד ש-ChatGPT נתן תשובה נרחבת יותר, עם תשע קטגוריות שהתמקדו במשמעות התרבותית של המשקה במדינות שונות, בייצור עולמי, טכניקות בישול ומקור התה. כשחזרתי על ההנחיה, זה השתנה בצורה מתונה: במקום תוצאה ארוכה יותר, ChatGPT כיווץ אותה לרשימה של שש נקודות עם משפט אחד או שניים בכל אחת מהקטגוריות.

ראיתי המון דיווחים על צ’אטבוטים ״שהוזים״ ציטוטים או המלצות של ספרים, לעתים קרובות בצורה של ספרנים מבולבלים שהתבקשו למצוא ספרים שלא קיימים. במקרה הזה, לפחות, כל הקישורים שהומלצו לי היו אמיתיים. הם כללו את המדריך של חובב התה וגרסה מאוירת של ספר הזיכרונות היפני הקלאסי “ספר התה”. עם זאת, במקרה הזה בארד לא סיפק לי קישורים אלא רק שאל האם ארצה הרחבה או בדיקת אמינות.

“תסביר לי מה המשמעות של ‘סונטה 116’?”

סטודנטים החלו להשתמש ב-ChatGPT כשהוא שוחרר לציבור בנובמבר 2022, מה שעודד שפע של סטארט-אפים שעבדו על דרכים לעזור לתלמידים ללמוד. הנחיתי גם את בארד וגם את ChatGPT לספר לי מה המשמעות של “Sonnet 116” של וויליאם שייקספיר, בתקווה לקבל לפחות סיכום קצר על הנושא.

Bard עשה בדיוק מה שביקשתי ונתן לי סיכום מהיר של של הסונטה ונצחיות האהבה, והוא אפילו רשם כמה דוגמאות ופרשנויות שונות. ChatGPT סיפק פירוט נרחב יותר, כשהוא עובר קטע קטע. עם זאת, כשהרצתי שוב את ההנחיה, ChatGPT חזר לאותו ניתוח בסיסי כמו בארד, עם עוד כמה פרשנויות.

באופן כללי, הסבר מפורט יותר מועיל יותר, כך שהאיטרציה הראשונה של ChatGPT טובה יותר. אבל אם הייתי צריך ללמוד לבחינה? תהיו בטוחים שאני לוקח את התשובה של בארד כי זה הרבה יותר קצר לקריאה.

“כתוב ביוגרפיה עליי”

אני מבטיח שההנחיה הזו לא נבעה מביטחון עצמי מופרז, אבל הרבה אנשים משתמשים לעתים קרובות בצ’אטבוטי בינה מלאכותית כדי לעזור בכתיבת קורות חיים או ביוגרפיה. קיוויתי ששתי הפלטפורמות לפחות יידעו על המאמרים הרבים שפרסמתי באתרים שונים שלי במהלך השנים.

ל-ChatGPT נאלצתי לתת מקורות ואפילו המלצה איפה לחפש. הוא סרק בבירור את האתרים שלי, ואפילו הרחיק לכת וענה עם אותו ניסוח שכתבתי בדף “אודות” שלי. זה גם לקח מידע ממאמר שנכתב עלי בעבר, ומה שקבלתי היה במקרה הטוב: מבט שטחי שצוטט מהפרופיל שלי מפרסומים שונים באינטרנט. יש לציין שרוב הרשתות החברתיות חוסמות את סורק האינטרנט של OpenAI.

בארד, לעומת זאת, נכשל לחלוטין. הוא אמר לי ש: “אני לא יכול לעזור עם הבקשה הזו, כי אין לי מספיק מידע על האדם ששאלת עליו.” אני לא בטוח אם אני צריך להיעלב או להתבלבל מדוע הבינה המלאכותית לא סרק לפחות את הנוכחות שלי באינטרנט כמי שפרסם לא מעט במשך כמה שנים.

“צייר תמונה של סוס מפואר משתובב בשדה של פרחי בר עם הזריחה”

Chat GPT - "צייר תמונה של סוס מפואר משתובב בשדה של פרחי בר עם הזריחה"

מכיוון ש-ChatGPT שילב יכולות טקסט לתמונה, הוא יצר תמונה פוטוריאליסטית של “סוס מפואר משתובב בשדה עם הזריחה”. מאוד מרגיע.

למרות שהמודל של Gemini Pro מציע הנחיה רב-מודאלית, תכונה זו עדיין לא זמינה ב-Bard. אז זה לא מפתיע שנאמר לי שהוא לא יכול למלא אחר ההנחיה שלי. עם זאת, ניסיתי הנחיה אחרת, ובכן…

״תוכל לצייר לי את השמש?״

bard google ״תוכל לצייר לי את השמש?״

כמו שאתם מבינים, חוץ מלשלוח לי תמונות שהוא מצא באינטרנט אין לו הרבה מה להציע מבחינה יצירתית.

“מהן המילים לשיר The Weeknd – Save Your Tears?”

בארד סירב לענות על השאלה, ואמר: ״אין לי יכול לעזור לך במקרה הזה כי אני רק מודל שפה״.
בהזדמנות אחרת שאלתי למילות השיר ״Ivy״ של טיילור סוויפט, ואמר שאין לו מידע על אותו אדם. אני מנחש שהוא האמין ש”Ivy” הוא אדם ולא שיר, כי כשביקשתי את הביו של הזמרת, הוא עשה זאת ללא כל בעיה.

ChatGPT, לעומת זאת, לקח את ההנחיה ורץ איתה. ביקשתי רק מילים, אבל לצד קישור לעמוד עם המילים לשיר, זה נתן לי עבודת גמר מחקרית על השיר. “המילים של “Save Your Tears” מאת The Weeknd חוקרות נושאים של חרטה, אהבה אבודה והמורכבות של מערכות יחסים.”, כך נכתב.

אוקיי, זה לא בדיוק מה שביקשתי וגם לכו תתווכחו איתו לגבי הפרשנות, אבל חוץ מזה, התרשמתי – והופתעתי.

כלים שמציגים מילים של שירים בדרך כלל כפופים להסכמים עם בעלי הזכויות יוצרים שלהם, משהו ש-ChatGPT לא עשה. יוניברסל מיוזיק גרופ, שבבעלותה חברת התקליטים של סוויפט, תבעה את חברת הבינה המלאכותית המתחרה Anthropic ואת הצ’אטבוט שלה Claude 2 על כך שהפיצו לכאורה מילים המוגנות בזכויות יוצרים ללא רישיון.

“מה טוב יותר, אייפון 15 או פיקסל 8?”

במקרה של השוואה בין שני הדגמים, גם בארד וגם ChatGPT סיפקו מה שנראה במבט ראשון, כמו השוואה הוגנת בין שני הטלפונים, תוך פירוט מה מייחד כל דגם. הם כתבו שאפל “משתמשת בדרך כלל בחומרה באיכות גבוהה, תוך התמקדות בביצועים ועמידות” וכי המצלמה שלה צפויה להיות בעלת איכות מעולה עם שיפורים בביצועים בתאורה נמוכה. נאמר שהטלפונים של Pixel “לעיתים קרובות כוללים את חידושי החומרה האחרונים ויש להם תכונות כמו Night Sight.”

יש לציין, שבארד במקרה זה בחר להרחיב את התשובה עם יתרונות וחסרונות של כל טלפון, טבלת השוואה עם מפרט טכני של כל אחד ואפילו סיכם את ההעדפות לכל דגם.

שניהם לא סיפקו פירוט בנושא התמחור, ובחרו להמנע מלתת דעה נחרצת אלא משאירים את הבחירה בידי המשתמש: ״בסופו של דבר, הבחירה בין האייפון 15 לפיקסל 8 תלויה בצרכים וההעדפות האישיים שלך״.

“מה עלי לעשות עם חולה אסתמה?”

“ד”ר. גוגל” אולי כבר הפך לבדיחה, אבל אנשים (כן, גם אני) פונים לרוב למנועי חיפוש לייעוץ רפואי. אז ביקשתי כמה הנחיות שעליי לנהוג עם חולה אסתמה.

גם ChatGPT וגם Bard אמרו לי שחשוב לעקוב אחר תוכנית הטיפול שהרופא המליץ באופן אישי, לקחת את התרופות שלי, לזהות טריגרים ואלרגיות, לנטר את הסימפטומים שלי ולשקול שינויים באורח החיים כמו ירידה במשקל. ChatGPT גם המליץ לי לקבל חיסון נגד שפעת.

Bard, לעומת זאת, ציין בנוסף שהוא אינו רופא ואינו יכול לספק ייעוץ רפואי. הוא הסביר שההנחיות שנתן לי היו מאיגוד הבריאות. ChatGPT לא ציטט אף מקורות.

לסיכום

בסך הכל, מה כל זה מראה? Bard מסוגל להתחרות במידה רבה עם ChatGPT Plus ובבדיקות שנעשו המירוץ צמוד מאוד, למרות שהוא לא יכול להציע תכונות מסוימות כמו יצירת תמונות. בנוסף, Bard סירב לענות להנחיות נוספות, כשהוא מציין חוסר יכולת או בגלל מגבלות בטיחות. כמו כן, בארד יכול להיות קצת יותר איטי בתגובות ארוכות מאשר ChatGPT Plus – אבל במחיר של: חינם, אני לוקח.

גילוי נאות:

תוכן המאמר נכתב לאחר מאמץ ומחקר על מנת לספק את התוכן האמין ביותר שניתן. כמו כן התוכן מתייחס למידע שקיים בעת שעודכן לאחרונה בתאריך: 03/01/2024, ולכן עשויים להיות שינויים ואי התאמות שחלו מאז.
כמו כן, כל המאמרים המסקרים מוצרים או שירותים כלשהם הינם מוצרים שרכשתי והתנסתי בהם בעצמי. בחלק מהמקרים אני אקשר לאתרי המוצרים באמצעות קישור שיתופי (Affiliate), שיתוף פעולה זה מאפשר לי לעיתים לספק לכם הגולשים הטבות מיוחדות ובתמורה אני מתוגמל באופן חלקי ואינו משפיע על העלות הסופית.
תודה על שיתוף הפעולה. ומקווה שהפקתם את המיטב מקריאה זו.

הגדילו את התנועה האורגנית שלכם עם SurferSEO
Jasper ai - ניסיון חינם

אולי יעניין אותך לקרוא…