משלוש בצהריים עד ארבע לפנות בוקר. ניסיתי לבנות משהו שיאפשר לי לשחזר מהלכי תוכן מוצלחים – כאלה שעבדו ממש טוב – ולגרום לבינה מלאכותית לייצר עבורי מהלכים דומים.
נשמע פשוט, נכון? יש את הנוסחה, יש את הדוגמאות, יש את הניסיון. פשוט צריך להעביר את זה למודל.
אבל משהו לא עבד.
הפלט היה סביר. לא רע. אבל הוא הרגיש גנרי. כאילו הבינה המלאכותית כתבה "משהו שנשמע נכון" במקום "משהו שמרגיש נכון".
ובאיזשהו שלב באותו לילה, הבנתי שהבעיה היא לא מה שחשבתי. הבעיה לא הייתה שהמודל "לא יודע לכתוב". הבעיה הייתה שביקשתי ממנו לעשות משהו שהוא פשוט לא בנוי לעשות – לפחות לא בדרך שבה ביקשתי.
במדריך הזה אני הולכת לשתף מה גיליתי, למה מודלי שפה מתקשים עם שיקול דעת יצירתי, ואיך אפשר לעקוף את זה בצורה חכמה.
אם אתם מרגישים שהתוצאות שאתם מקבלים מבינה מלאכותית הן "בסדר" אבל לא באמת מה שרציתם – המדריך הזה בשבילכם.
אמל"ק – למי שממהר ⚡
הבעיה האמיתית: מודלי שפה מצוינים במשימות פורמליות, אבל מתקשים עם החלטות שדורשות "שיפוט מצבי" – לדעת מה מרגיש נכון ברגע ספציפי
למה זה קורה: המודל מאומן לנבא את ההמשך הסביר סטטיסטית, לא להעריך מה מתאים למצב מסוים
הפתרון: לא לבקש מהמודל לבחור נכון בבת אחת, אלא להכריח אותו לעבור תהליך שמדמה שיפוט
איך בפועל: להפריד בין שלבי חשיבה, לייצר כמה אפשרויות, לבקר אותן, ורק אז לבחור
העיקרון לקחת הביתה: אם יש נקודה במשימה שבה "מרגיש נכון" חשוב יותר מ"נשמע סביר" – היא דורשת שלב חשיבה נפרד
🔍
הבעיה שנתקלתי בה
בואו נדבר רגע על מה שקורה לרובנו.
אנחנו כותבים פרומפט. משקיעים בו. נותנים הקשר, דוגמאות, הוראות מפורטות. לוחצים Enter. ומקבלים תוצאה ש... בסדר.
לא רעה. לא משהו שצריך לזרוק. אבל גם לא מה שרצינו.
התוצאה נשמעת נכון אבל לא מרגישה נכון. היא גנרית. כאילו אפשר היה לקבל אותה על כל נושא, בכל הקשר, לכל אדם.
מכירים את התחושה הזו?
אחד התלמידים בקורס תיאר את זה מצוין: "אני רוצה להשתמש בכלים כדי שיחסכו לי זמן, אבל אני מקבל טקסט שנשמע כמו בינה מלאכותית כתבה אותו״.
הרבה אנשים חושבים שהפתרון הוא לשפר את הניסוח. להוסיף עוד הוראות. לתת עוד דוגמאות. לכתוב פרומפט ארוך יותר.
אבל זה לא הפתרון. ולפעמים זה אפילו מחמיר את המצב.
כי הבעיה היא לא מה אנחנו מבקשים מהמודל. הבעיה היא איך אנחנו מבקשים ממנו לחשוב.
💡
התובנה ששינתה לי הכל
בואו נעשה רגע סדר.
יש שני סוגים של משימות שאנחנו נותנים לבינה מלאכותית:
משימות פורמליות – כאלה שאפשר להגדיר בכללים ברורים. "תמיין את הרשימה הזו לפי X". "תכתוב סיכום של 100 מילים". "תבחר מתוך האפשרויות האלה לפי הקריטריונים האלה".
מודלי שפה מצוינים בזה. הם עוקבים אחרי הוראות, מיישמים כללים, ומייצרים תוצאות עקביות.
משימות סובייקטיביות – כאלה שדורשות הערכה של מצב. "מה מרגיש נכון עכשיו?". "האם זה הרגע להוסיף הומור או דווקא לעצור?". "מה הקורא כנראה חושב ברגע הזה?".
וכאן מגיעה הבעיה.
כשאנחנו מקבלים החלטות יצירתיות, אנחנו לא עוקבים אחרי כללים. אנחנו מעריכים מצב. שמים את עצמנו במקום הקורא, מרגישים מה הוא כנראה חווה, ומגיבים לזה.
זה כמו לספר סיפור לחבר. לפעמים אתם עוצרים באמצע ואומרים "חכה, אתה לא מאמין מה קרה אחר כך". לפעמים אתם מוסיפים הערה קטנה על הצד. לפעמים אתם דווקא משתקים – עוצרים רגע לפני הפאנץ'.
אף אחד לא לימד אתכם "תעצור בדיוק פה". אתם פשוט מרגישים מתי זה נכון.
וזה בדיוק מה שמודל שפה לא יודע לעשות.
לא כי הוא "טיפש". אלא כי הוא בנוי אחרת.
🧠
מה באמת קורה מתחת למכסה המנוע
אחרי שהבנתי את זה, התחלתי לחפור. רציתי להבין למה מודל שפה מתקשה עם הסוג הזה של החלטות.
הנה מה שגיליתי:
1. המודל לא "שופט סיטואציה"
מודל שפה מאומן לנבא את ההמשך הכי סביר סטטיסטית. מה בדרך כלל נשמע נכון, לא מה מרגיש נכון עכשיו.
זה הבדל קריטי. המודל מעולה בלכתוב משהו סביר. אבל הוא פחות טוב בלזהות מה מתאים לרגע מסוים בתוך הקשר מסוים.
2. אין לו חישה של סיטואציה
אנחנו מקבלים החלטות יצירתיות מתוך המון רמזים קטנים. מה קורה עכשיו, מה השתנה, מה הקורא כנראה חושב. למודל אין את החומר הגולמי הזה, אלא אם נותנים לו את זה במפורש.
בלי זה, הוא מנחש. ולכן היצירתיות שלו מרגישה כללית ולא מצבית.
3. ההבדל בין לוגיקה לפרגמטיקה
הרבה מההחלטות היצירתיות הן פרגמטיות – קריצה, רמז, אמירה שלא נאמרת עד הסוף, התייחסות למה שלא נאמר במפורש.
מודלי שפה חלשים יותר בדיוק בהחלטות מהסוג הזה. במיוחד כשלא מכריחים אותם לעשות את זה בצורה מודעת.
4. נעילה מוקדמת
כשמודל מתחיל לכתוב מיד, הוא ננעל על כיוון אחד מהר מאוד. ומרגע שהכיוון נבחר, קשה לו "להרגיש" שאולי יש כיוון אחר שמתאים יותר לרגע.
זה מסביר למה פרומפטים שמבקשים הכל בבת אחת מייצרים תוצאות סבירות, אבל לא מבריקות.
🔑
העיקרון שעומד מאחורי הפתרון
אז מה עושים?
השאלה כבר לא הייתה "איך ללמד את המודל להיות יצירתי". השאלה הייתה אחרת לגמרי: אם המודל לא יודע לבצע שיפוט מצבי בצורה ישירה, האם אפשר לגרום לו להגיע לתוצאה דומה דרך מבנה תהליך אחר?
והתשובה היא כן. אבל לא בדרך שרוב האנשים חושבים.
אין פתרון קסום אחד. יש כמה גישות, וכולן עובדות על אותו עיקרון:
לא מבקשים מהמודל לבחור נכון בבת אחת. מכריחים אותו לעבור דרך תהליך שמדמה שיפוט.
גישה 1: לייצר יותר מאפשרות אחת
במקום לשאול "מה נכון לעשות עכשיו", מכריחים את המודל לייצר כמה כיוונים אפשריים. ואז לבחור ביניהם.
למה זה עובד? כי הרבה יותר קל למודל להגיד "זה פחות מתאים מזה" מאשר להמציא מראש את הדבר המדויק. הבחירה הופכת ממופשטת לקונקרטית.
גישה 2: שלב ביקורת נפרד
המודל לא רק מייצר רעיון, אלא גם עוצר. מסתכל על מה שיצר. ובוחן אותו דרך עדשה אחרת: האם זה גנרי מדי? האם זה באמת תלוי במצב הספציפי? האם זה מתאים?
הביקורת הזו לא מתקנת ניסוח. היא פוסלת כיוונים שלא מתאימים.
גישה 3: לאלץ נימוק של בחירה
במקום לתת למודל להחליט ולהמשיך הלאה, מכריחים אותו להסביר למה בחר את מה שבחר. ומה עלול לא לעבוד.
הנימוק הזה מכריח את המודל "לחשוב" על ההחלטה במקום לבצע אותה אוטומטית.
🛠
איך זה נראה בפועל – 5 השלבים
עכשיו בואו נראה איך זה עובד בפועל. אני אתן לכם את המבנה שבניתי, שלב אחר שלב.
שלב 1: לנתח את המצב
לפני שהמודל מתחיל לייצר משהו, הוא צריך לעצור ולהבין את המצב.
מה קרה עד עכשיו? מה הקורא/צופה כבר יודע? מה הוא כנראה מרגיש? מה הוא מצפה שיקרה עכשיו?
המודל כותב את הניתוח הזה במפורש. לא עובר ישר לכתיבה.
שלב 2: לייצר אפשרויות
עכשיו המודל מייצר כמה אפשרויות שונות למה שאפשר לעשות. לא רעיון אחד – כמה כיוונים שונים.
לכל אפשרות, הוא צריך להסביר: מה העיקרון שעומד מאחוריה, למה היא יכולה לעבוד, ולמה היא עלולה לא להתאים.
לדוגמה:
"קריאת מחשבות – להראות לקורא שאני יודעת מה הוא עושה עכשיו. יכול לעבוד כי זה יוצר חיבור. עלול לא להתאים אם ההנחה שגויה."
"הומור – לא מתאים עכשיו. הקורא במצב של סקרנות רצינית, הומור יכול לשבור את האנרגיה."
שלב 3: לפתח את הכיוונים שנבחרו
רק עכשיו המודל מתחיל לחשוב על רעיונות קונקרטיים. הוא יוצר 3-4 רעיונות שונים, וכולם משתמשים באפשרויות שנבחרו בשלב הקודם.
לכל רעיון, הוא צריך לכתוב:
מה העיקרון שעומד מאחוריו
מה יקרה בראש הקורא כשהוא יראה את זה
למה זה עובד דווקא ברגע הזה ולא בכל רגע
מה עלול לא לעבוד
שלב 4: לבקר את עצמו
אחרי שהמודל יצר רעיונות ובחר אחד, הוא צריך לשים את עצמו בעמדת ביקורת.
הוא שואל את עצמו:
מה מטריד אותי ברעיון הזה?
האם כל מטריד הוא בעיה אמיתית או שאני סתם מודאג?
אם זו בעיה אמיתית – איך לתקן?
אם זו לא בעיה – למה בעצם זה בסדר?
שלב 5: בחירה סופית עם נימוק
רק עכשיו המודל בוחר את הרעיון הסופי, ומציג:
מה הרעיון
למה בחרתי בו (3 סיבות)
באילו הנחות אני מסתמכת
מה אעשה אם ההנחות לא נכונות
איך אדע אם זה עבד או לא
🎁
הפרומפט שאפשר לקחת עכשיו
אחרי כל ההסברים, הנה משהו פרקטי.
בניתי פרומפט קצר שמיישם את כל העקרונות שדיברנו עליהם. אפשר להוסיף אותו בתחתית כל פרומפט שכבר יש לכם – והוא יכריח את המודל לעבור את התהליך במקום לקפוץ ישר לתשובה.
הנה הפרומפט:
plain text
לפני שאתה מייצר תשובה, עבור את התהליך הזה בפורמט מובנה:1.SITUATIONMAPPING
תאר בדיוק את ההקשר:- מה הבעיה / המטרה הספציפית?- מי הקהל / התוצאה הצפויה?- אילו אילוצים או בקשות קיימות?2.MULTI-VECTORIDEATION
אל תיצור פתרון אחד – תיצור 3–5 כיוונים שונים טיפולוגיים:- כיוון 1:[גישה / מהלך שונה]- כיוון 2:[גישה / מהלך שונה]- כיוון 3:[גישה / מהלך שונה]3.CRITICALEVALUATION
לכל כיוון,בחן:- מדוע זה יעבוד בהקשר הזה?- מה הסיכונים / המלכודות?- מה שונה בו מכיוונים אחרים?דירוג: איכות / שימושיות /התאמה(1–10)4.SYNTHESIS&SELECTION
בחר את הכיוון הטוב ביותר:- על בסיס איזה קריטריון?- מה תקף בו ביחס להקשר?- מה ההנחות שלך?5.FINALOUTPUT
על בסיס הניתוח, הפק את התשובה.
הוסף משפט שמסביר את בחירתך.
איך משתמשים בזה?
פשוט מאוד. יש לכם פרומפט שאתם כבר עובדים איתו? מוסיפים את הבלוק הזה בסוף.
מה שיקרה: במקום שהמודל יקפוץ ישר לתשובה, הוא יעצור. ימפה את המצב. ייצור כמה כיוונים. יבחן אותם. ורק אז יבחר.
זה לא קסם. זה פשוט מכריח את המודל לעבור תהליך שמדמה שיפוט – במקום לנחש מה נכון בבת אחת.
טיפ: הפרומפט הזה עובד הכי טוב במשימות יצירתיות או אסטרטגיות. במשימות פורמליות פשוטות (כמו "תמיין רשימה" או "תתרגם טקסט") הוא פחות נחוץ.
👌🏽
לסיכום
אחד המאזינים של הפודקאסט שאל אותי: "אז מה, אני צריך לבנות פרומפט של 25 עמודים לכל משימה?"
התשובה היא לא.
העיקרון הוא הרבה יותר פשוט מזה.
אם יש נקודה במשימה שבה "מרגיש נכון" חשוב יותר מ"נשמע סביר" – זו כנראה נקודה שדורשת שלב חשיבה נפרד.
לא עוד חוקים. לא עוד דוגמאות. שינוי בארכיטקטורה של הבקשה.
במקום לבקש מהמודל גם להבין הקשר, גם לבחור כיוון, וגם לנסח טקסט – הכל בבת אחת – מפרידים בין השלבים.
שלבים שבהם הכל ריגידי וברור. ושלב אחד שבו מאפשרים שיפוט מצבי, אבל בצורה מבוקרת.
ברגע שמכריחים את המודל לעצור, לייצר כמה אפשרויות, לבקר אותן, לפסול כיוונים גנריים, ורק אז לבחור – מתקבל משהו שמרגיש הרבה יותר אנושי.
הסיפור של המדריך הזה לא נועד להגיד לכם "תכתבו פרומפטים ארוכים יותר" או "תכתבו פרומפטים חכמים יותר".
הוא נועד להראות משהו הרבה יותר פשוט.
כשאנחנו נותנים לבינה מלאכותית משימות מורכבות, הבעיה כמעט אף פעם לא נמצאת בניסוח עצמו. היא נמצאת באופן שבו אנחנו מבקשים מהמודל לחשוב.
מודלי שפה נועדו לחקות אינטליגנציה אנושית. אבל הם עושים את זה דרך מבנים.
וככל שאנחנו עובדים איתם יותר, אנחנו לומדים לא רק איך להשתמש בהם טוב יותר. אנחנו גם לומדים לפרק את החשיבה שלנו עצמנו לחלקים.
וברגע שמבינים את זה, אפשר לבנות פרומפטים שלא רק כותבים טוב – אלא חושבים בצורה שמתקרבת למה שאנחנו באמת מצפים מהם לעשות.
רוצים ללמוד איך לבנות פרומפטים מורכבים בצורה מסודרת? בקורס "לומדים AI" אנחנו מלמדים את שיטת מ.ב.צ.ר – שיטה שנועדה בדיוק למצבים שבהם מנסים להוריד תהליך מורכב לבינה מלאכותית, בלי שהמשימה תתפרק או תהפוך כללית מדי.
כל הפרטים כאן