במשך קרוב לשבעים שנה, מאז הופעתם של המחשבים האלקטרוניים, לא חלה שום התקדמות דרמטית בתחום העיבוד הממוחשב של שפה אנושית טבעית. קריאה וכתיבה של טקסטים ברמה כמו-אנושית הייתה משימה כמעט בלתי אפשרית עבור המחשב. ואז, בנובמבר 2022, הופיע ChatGPT - וטרף את כל הקלפים.מה הביא לכך שאחרי אינספור כשלונות ומאמצים עקרים, הצליחו לפתע מדעני המחשב להפיק מבין ידיהם מכונה שמסוגלת לתקשר איתנו - בשפה שלנו? כמו כן, האזינו בסוף הפרק לפינה בחסות ארכיון הסרטים הישראלי בסינמטק ירושלים, אודות הסרטים הביתיים שצילמו חיילי מילואים במלחמת יום הכיפורים - ומה הם מלמדים אותנו אודות חיי היום יום במובלעת הסורית שברמת הגולן, ובארץ גושן שמעברה השני של תעלת סואץ.
תאריך עליית הפרק לאוויר: 07/11/2023.
שלום וברוכים הבאים לעושים היסטוריה. פרק 412. צ'אט ג'י פי טי ומודלי שפה גדולים. חלק א'
האזינו בסוף הפרק לפינה בחסות ארכיון הסרטים הישראלי בסינמטק ירושלים, על הסרטים הביתיים שצילמו חיילי מילואים במלחמת יום הכיפורים ומה הם מלמדים אותנו עוד עוד חיי היומיום במובלעת הסורית שברמת הגולן ובארץ גושן שמעברה השני של תעלת סואץ.
בשבע בינואר, 1954, התכנסו נציגיהם של כמה מהעיתונים החשובים ביותר בארצות הברית ה"ניו יורק הראלד טריביון", ה"לוס אנג'לס טיימס" ואחרים, במשרדיה של חברת IBM שבניו יורק.
מחשבים היו באותם הימים טכנולוגיה חדשה שהסעירה את דמיונו של הציבור. "מוחות אלקטרונים" כינו אותם סופרי המדע הבדיוני. אבל למרות שלכולם היה ברור שמדובר בטכנולוגיה פורצת דרך, עדיין לא היה ברור בשלב הזה למה בדיוק ישמשו אותן מכונות מתוחכמות.
שנה קודם לכן השיקה IBM מחשב חדש ומתקדם בשם IBM 701 וכל העיתונאים היו סקרנים לגלות מה מסוגלת לעשות המפלצת הדיגיטלית המרשימה הזו ששקלה למעלה מ-10 טונות ומילאה חדר רחב מימדים.
ההדגמה יצאה לדרך. מפעיל שעמד לצידו של המחשב הזין לתוכו כרטיסייה מנוקבת שעליה נכתב, בייצוג בינארי כמובן, משפט בשפה הרוסית. המחשב הגדול קרא את תוכנה של הכרטיסייה, זמזם, המהם וקרקש ולאחר כמה עשרות שניות פלט נייר ועליו אותו המשפט בדיוק אבל הפעם באנגלית.
בזו אחר זו הזין המפעיל למחשב 60 כרטיסיות ועליהן 60 משפטים שונים ברוסית בתחומים שונים ומגוונים - פוליטיקה, משפט, מדע ועוד, שאת כולם תרגם המחשב בזריזות, יעילות ודייקנות.
העיתונאים לא ידעו את נפשם מרוב התפעלות. למרות שבדיווחים בעיתונים למחרת השתדלו מרבית העיתונאים להדגיש כי אם מדובר בטכנולוגיה חדשה ובוסרית שעדיין נמצאת בשלבי פיתוח, ניכר היה כי הם מתקשים להכיל את התלהבותם. "ההדגמה בה צפינו היום היא הקיטי הוק של התרגום האלקטרוני " התפעם אחד העיתונאים שהשווה את ההישג טיסתם הראשונה של האחים רייט, לא פחות. והאמת? אפשר להבין את ההתרגשות. לתרגום האלקטרוני היה את הפוטנציאל להאיץ את קצב ההתקדמות של המדע המודרני באופן דרמטי.
באחת מהכתבות נכתב כי "הניסוי המוצלח מעלה אפשרויות רבות ומסעירות. בלשנים יוכלו לחקור שפות באותו אופן שבו פיזיקאים לומדים את חוקי הטבע. הספרות הטכנית של גרמניה, רוסיה, צרפת והארצות דוברות האנגלית תעמוד לרשותם של מדענים בכל המדינות האחרות מיד לכשתצא ממכונת הדפוס". ולא רק זה, בעידן שלאחר מלחמת העולם השנייה העולם היה מפולג בין מזרח ומערב.
ההדגמה המוצלחת חיזקה את התקווה שאולי היכולת לתרגם בין השפות בזריזות וביעילות תפחית את קשיי התקשורת בין הצדדים היריבים ותסייע לגשר על המחלוקות שביניהם.
למרות שהטכנולוגיה שהדגימה IBM לעיתונאים, פרי שיתוף פעולה של החברה עם חוקרים מאוניברסיטת ג'ורג'טאון, הייתה עדיין בחיתוליה, המדענים עצמם היו משוכנעים שהחזון של תרגום אוטומטי מכל שפה לכל שפה נמצא ממש מעבר לפינה.
כתב של העיתון "קרישטיין סיינס מוניטור" הביא דברים ברוח הזו מפי אחד החוקרים ציטוט "על אף שהוא מדגיש כי עדיין אין ביכולתנו להזין למערכת ספר ברוסית מצד אחד ולקבל ספר באנגלית בצד השני, הפרופסור חוזה כי בתוך חמש אולי אפילו שלוש שנים תרגום אלקטרוני בתחומים חשובים ובמספר שפות יהיה עניין גמור וחתום" סוף ציטוט.
אבל זה כמובן לא מה שקרה. במשך קרוב ל-70 שנה מאז אותה הדגמה מוצלחת בשנות ה-50 ועד לפני שנים ספורות לא חלה שום התקדמות דרמטית בתחום העיבוד הממוחשב של שפה אנושית טבעית. עד לפני עשור פחות או יותר קריאה או כתיבה של טקסטים אנושיים, למעט בשפות ספציפיות או בתחומי עיסוק מוגדרים ומצומצמים מאוד, הייתה משימה כמעט בלתי אפשרית עבור המחשבים.
ואז בשלהי 2022 הופיע "chat gpt" בינה מלאכותית שמסוגלת להבין שפה אנושית טבעית. למעשה כמה עשרות שפות, כולל אפילו עברית, ולשוחח איתנו ברמת אינטליגנציה ברת השוואה לזו של אדם בשר ודם.
לשם הדוגמה, לרוח השנים "זכיתי" במרכאות לקבל אלפי מיילים של ספאם ואף פעם, אפילו לא פעם אחת, טעיתי לחשוב שמדובר במייל אותנטי.
עד לפני שבועיים, כשקיבלתי מייל ספאם שנכתב על ידי "chat gpt". צורת הכתיבה והפנייה המאוד אישית ואנושית במכתב הזה שכנעו אותי שמדובר במאזין של הפודקאסט. כמעט שכתבתי תגובה, אבל אז, במקרה לגמרי, ראיתי מישהו שצייץ בטוויטר על אותו המייל בדיוק, בשינוי הפרטים הרלוונטיים כמובן, ורק אז הבנתי שנפלתי בפח.
"chat gpt" כבש את העולם בסערה והצית את דמיונם של מיליונים. יש מי שמשווים את השפעתה הצפויה של הטכנולוגיה המהפכנית הזו על הציביליזציה האנושית להשפעתה של המצאת מכונת הדפוס. אבל במקביל, ישנם חוקרים שרואים בה את האיום הקיומי הגדול ביותר על האנושות מאז פיתוחה של פצצת האטום.
במאי 2023, פרסמה קבוצה של עשרות חוקרי בינה מלאכותית הצהרה מיוחדת שבה הם טענו כי "מניעת הסיכון להכחדת המין האנושי על ידי הבינה המלאכותית צריכה להיות בעדיפות גלובלית עליונה לצד סיכונים דומים בקנה מידה של ציביליזציה כדוגמת מגפות ומלחמה גרעינית" אפילו ג'פרי הינטון, מי שנחשב לאבי הבינה המלאכותית המודרנית, רואה בבינה המלאכותית סכנה קיומית מוחשית.
בראיון שהעניק לאחרונה לרשת CBS האמריקנית נשאל הינטון אם הוא מאמין שיש אפשרות שהבינה המלאכותית תחסל את האנושות. "אני חושב שזו אפשרות שניתן להעלות על הדעת" הוא השיב.
בשני הפרקים הבאים אם כן נדון בשתי שאלות. הראשונה, מה הביא לכך שאחרי כמעט 70 שנה של כישלונות ומאמצים עקרים, הצליחו לפתע מדעני המחשב להפיק מבין ידיהם מכונה שמסוגלת לתקשר איתנו בשפה שלנו? והשאלה השנייה, האם CHAT GPT מודלי השפה הגדולים, הטכנולוגיה שעומדת מאחורי המוצר המאבחני שהשיקה OpenAI, מסמנים את התגשמותו של החלום או הסיוט שעליהם נכתבו אין ספור עלילות מדע בדיוני: בינה מלאכותית חכמה, מהירה ומוכשרת יותר מכל בן אנוש.
במבט לאחור, קל להבין מדוע כשל פרויקט התרגום האוטומטי של IBM. מחשבים עקרונית מבוססים על מתמטיקה ולוגיקה. אחד ואפס. כן ולא. אמת ושקר. מושגים חדים ברורים ומוגדרים. לא כן, השפה שלנו. קחו לדוגמה את המילה run. לא, לא השם שלי, אני מתכוון למילה האנגלית run במשמעות של לרוץ. או אולי במשמעות של לזרום, כמו running water. או אולי במשמעות של משהו מחזורי וקבוע: the bus runs into town every half an hour. או אולי בכלל במשמעות של לנהל : she runs this company אתם מתחילים להבין את הבעיה?
למילה האנגלית run יש לא פחות מ-645 משמעויות שונות כתלות בהקשר שבו היא נאמרת. ולמרות ש-run היא דוגמה קצת קיצונית, היא בהחלט מייצגת. לכמעט כל המילים בשפות האנושיות יש כמה וכמה משמעויות שלעתים עשויות להיות הפוכות לחלוטין זו מזו. כמו למשל כן! בטח! וכן…בטח…
החוקרים של IBM ואוניברסיטת ג'ורג'טאון ניסו להתמודד עם המורכבות הזו באמצעות ניסוח של חוקים ברורים שהגדירו למחשב כיצד עליו לתרגם כל מילה שבה הוא נתקל.
לצורך העניין, אם המחשב נתקל במילה הרוסית "פוליטיקה" עליו לתרגם אותה למילה האנגלית "פוליטיקס". זו גישה הגיונית ובמקרים מסוימים היא אפילו עשויה ליצור מראית עין כאילו המחשב באמת "מבין" את הטקסט שהוא מקבל.
למשל, באמצע שנות ה-60 פיתח חוקר בשם ג'וזף וייזנבאום תוכנה בשם אלייזה, שדימתה שיחה עם פסיכולוג. אם המשתמש היה מזין לתוכה משפט כמו "אני עצוב" התוכנה הייתה הופכת את המשפט לצורת שאלה "למה אתה מרגיש עצוב?"
משתמשים שלא היו מודעים לחוקיות הפשוטה הזו האמינו באמת ובתמים שהם משוחחים עם בינה מלאכותית מתוחכמת שמבינה אותם ומפגינה אמפתיה כלפיהם.
אבל במציאות, הtשליה הזו הייתה שברירית מאוד כמובן. די בכך שהמשתמש הזין מילה או ביטוי שלא התאימו לחוקיות הפשוטה שהגדיר וייזנבאום, למשל הכללה כלשהי, כדי לגרום לאלייזה להפיק תגובות חסרות היגיון. זו גם הסיבה לכישלונו של פרויקט התרגום האוטומטי של IBM. ישנן כל כך הרבה דרכים לפרש ולתרגם כל משפט עד שאין דרך מעשית לנסח את כל החוקים הדרושים כדי לטפל בכל מילה ובכל מצב.
אחרי למעלה משנה של עבודה החוקרים של IBM וג'ורג'טאון הצליחו לנסח מספיק חוקים וכללים כדי לאפשר למערכת לתרגם בסך הכל רק 60 משפטים ספציפיים. אם הם היו מזינים למערכת משפט חדש ולא מוכר היא הייתה חסרת אונים.
חלפו 30 שנה ובשנות ה-90 של המאה הקודמת החלו להופיע יותר ויותר טקסטים בפורמט דיגיטלי. העובדה הזו נתנה בידי החוקרים גישה לכמויות גדולות בהרבה של טקסט ממה שהיה מקובל בעבר, ואיפשרה להם לנקוט בגישה שונה כדי לפתור את בעיית עיבוד השפה הטבעית. במקום לנסה חוקים קשיחים' לנסות לזהות קשרים סטטיסטיים בין המילים /
לצורך ההסבר, נאמר שיש לנו ספר באנגלית ואת אותו הספר מתורגם לעברית. נותנים למחשב לעבור על כל המילים והביטויים בשני הספרים ולחלץ מהם מידע סטטיסטי בסגנון : כמה פעמים תורגמה המילה האנגלית run למילה העברית לרוץ וכמה פעמים למילה לנהל. הגישה הזו כונתה למידת מכונה, machine learning, והיא אכן הובילה לשיפור מסוים ביכולתם של המחשבים להתמודד עם מידע בשפה טבעית. למשל הניתוח הסטטיסטי אפשר להם להתמודד עם טקסט שהכיל שגיאות כתיב, בהנחה שהמחשב ניתח המון טקסטים וכבר נתקל בהרבה שגיאות.
שירות התרגום שהשיקה גוגל בשנת 2006 היה מבוסס על הטכנולוגיה הזו.
ובכל זאת גם ביצועיהן של מערכות מבוססות למידת מכונה היו עלובים למדי ורחוקים שנות אור מהיכולת האנושית. מדוע?
סיבה אחת היא ששפות אנושיות מכילות עשרות ואפילו מאות אלפי מילים שיכולות להופיע במיליארדי קומבינציות שונות ומשונות. למשל אחרי המילה שפה יכולה להופיע המילה אנושית אבל גם המילים -קשה או יפה או מורכבת. וחישוב של שכיחות סטטיסטית עבור כל אחת ואחת מאינספור הקומבינציות האלה היא משימה חישובית תובענית מאוד שהגבילה את היעילות של מערכות מבוססות למידת מכונה בעולם האמיתי.
סיבה נוספת ואולי משמעותית יותר היא שלנו, בני האדם, יש הבנה אינטואיטיבית של המציאות שמסתתרת מאחורי המילים. למשל, המשמעות של המילה "נבח" במשפט "ראיתי את הכלב בפארק והוא נבח עלי" לא זהה למשמעות שלה במשפט "ראיתי את הבוס שלי בפארק והוא נבח עלי". אנחנו יודעים מהו כלב, אנחנו מבינים מהו בוס, וההבנה הזו היא זו שעוזרת לנו לחלץ את המשמעות הנכונה של המילה "נבח" בכל אחד מהמשפטים השונים. למחשב, לעומת זאת, אין הבנה לגבי המציאות שמאחורי המילים וגם ניתוח סטטיסטי של שכיחות הופעתן של מילים בטקסטים שונים לא מסייעת למחשב להבין את המציאות הזו. או שבעצם יכול להיות שמה שאמרתי עכשיו הוא לא נכון. אנחנו עוד נחזור לעניין הזה.
בשנת 2003 פרסם חוקר קנדי בשם יהושע בנג'יו מאמר ובו תיאר מערכת חדשה לעיבוד שפה טבעית שהייתה מבוססת על טכנולוגיה בשם רשתות נוירונים מלאכותיים. הבחירה ברשתות נוירונים מלאכותיים הייתה מפתיעה מכיוון שמדובר היה בתחום מחקר שנחשב אז לשולי ולא פופולרי בעולם מדעי המחשב. אבל ההפתעה האמיתית שהסתתרה בתוך המאמר של בנג'יו הייתה שביצועיה של אותה רשת נוירונים במשימות קלאסיות של עיבוד שפה טבעית היו טובים בהרבה מביצועיהם של מערכות איבוד השפה הטובות ביותר עד אותו הרגע. שיפור של עד כדי 24% מעל מה שנחשב אז כ-.
state of the art כיצד הצליחה רשת הנוירונים של יהושע בנג'יו להתמודד עם המורכבות המפורסמת של שפה אנושית טבעית?
בואו נחזור מספר צעדים אחורה. סיפרתי בהרחבה על ההיסטוריה ועיקרון הפעולה של רשתות נוירונים מלאכותיים בשני פרקים שהקדשתי לטכנולוגיית הלמידה העמוקה -Deep Learning פרקים 204 ו-205 של התוכנית. אבל הנה הרעיון הבסיסי על קצה המזלג. נוירון מלאכותי הוא מכונה פשוטה יחסית שמחקה את אופן הפעולה של נוירון ביולוגי, תא עצב.
כל נוירון מלאכותי שכזה הוא בפני עצמו מכונה די פשוטה אבל מסתבר שאם מחברים המון נוירונים זה לזה בצורה הנכונה ומזינים לתוך הרשת המתקבלת המון דוגמאות של מידע רלוונטי, מה שנקרא: מאמנים את הרשת בז'רגון המקובל, מקבלים מערכת שמסוגלת להפיק מתוך המידע הזה מסקנות ותובנות שמודל סטטיסטי פשוט לא מסוגל להפיק.
במקרה של בנג'יו, רשת הנוירונים שלו הצליחה לחלץ מתוך הטקסטים שעליהם היא אומנה מידע לגבי המשמעות של המילים. אם אני אמשיך את הדוגמה הקודמת שהבאתי, רשת הנוירונים הצליחה לגלות שהמילה כלב מציינת בעל חיים ושהמילה בוס מתייחסת לבן אדם. ולכן למילה נבח יש משמעות שונה בכל אחד מהמקרים האלה. התובנות החשובות האלה הן אלו שאפשרו את השיפור הניכר בביצועיה של המערכת.
ההצלחה הדרמטית הזו היממה את שאר החוקרים בתחום והביאה להתעניינות מחודשת בתחום רשתות הנוירונים. אבל במישור המעשי הטכנולוגיה הזו הייתה עדיין בוסרית מדי. כדי לאמן את רשת הנוירונים שלו בנג'יו הזין לתוכה לא פחות מ-14 מיליוני מילים ולמרות שמערכת המחשב שעמדה לרשותו הכילה לא פחות מ-40 מעבדים, תהליך האימון הזה עדיין ערך חודשים ארוכים. כל עוד רשתות הנוירונים היו איטיות ומסורבלות כל כך אף אחד לא שש להשתמש בהן.
איליה סצקבר נולד ברוסיה ב-1986 ובגיל חמש עלה עם משפחתו לישראל במסגרת העלייה הרוסית גדולה של שנות ה-90. לומר שאיליה היה ילד מבריק יהיה כנראה האנדרסטייטמנט של המאה. כבר בכיתה אחת הוא החל לקחת קורסים במדעי המחשב באוניברסיטה הפתוחה כי הלימודים בחטיבת הביניים לא איתגרו אותו מספיק. ב-2002 הגר איליה לקנדה שם השלים את לימודי הדוקטורט שלו במדעי המחשב תחת ג'פרי הינטון ונחשף לרעיונות של רשתות נוירונים מלאכותיים ולמידה עמוקה.
כבר כסטודנט איליה היה מעורב בפרויקט שהיה אבן דרך חשובה בדברי ימי הבינה המלאכותית.
הינטון, איליה וסטודנט נוסף בשם אלכס קריצ'בסקי פיתחו רשת נוירונים שהייתה מסוגלת לזהות אובייקטים שונים בתמונות. וב-2012 זכו בתחרות יוקרתית בשם אימאג'נט. ולא סתם זכו, ביצועיה של אלכס-נט, המערכת שלהם, היו טובים יותר בכמעט 11% מהמערכת שהגיעה למקום השני. ההצלחה הזו שכנעה את אחרוני הספקנים בעמק הסיליקון שהעתיד נמצא ברשתות נוירונים מלאכותיים. ואיליה, אלכס והינטון נחטפו על ידי גוגל שנעזרה בהם כדי לפתח יישומים חדשים ומתקדמים של בינה מלאכותית. למשל, שירות התרגום שהזכרתי קודם, גוגל טרנסלייט, שבמקור התבסס על למידת מכונה, עבר שדרוג לרשתות נוירונים מלאכותיים ובתוך תשעה חודשים בלבד הצליח להגיע לרמת ביצועים גבוהה יותר מאשר אליה הגיעה המערכת הקודמת גם אחרי עשר שנות פיתוח.
אבל למרות שגוגל הייתה סביבת עבודה נהדרת בכל קנה מידה, איליה לא היה ממש מרוצה. קבוצת המחקר שלו בגוגל הייתה קטנה מדי והמשאבים שהוקצו לה הרגישו לו מוגבלים מדי. איליה שקל לנסות ולהקים סטארט-אפ עצמאי אבל פסל את הרעיון הזה על הסף. הוא היה חוקר, לא יזם ולא איש עסקים.
אבל אז, באחד הימים, המתינה לו הודעה מפתיעה בתיבת הדואר האלקטרוני. הזמנה לארוחת ערב. ולא סתם ארוחת ערב, אלא פגישה עם סם אלטמן ואילון מאסק. שתיים מן הדמויות המפורסמות והמשפיעות ביותר בעמק הסיליקון.
אלטמן ומאסק סיפרו לו שהם מעוניינים להקים חברה חדשה שתתמקד בפיתוח בינה מלאכותית ותתחרה בדיפ מיינד של גוגל, שאז הובילה את עולם ה-AI עם מערכות פורצות דרך כדוגמת AlphaGo וAlphaZero. הם הציעו לאיליה להיות המדען הראשי של החברה החדשה.
איליה התלבט מעט, בכל זאת לא קל לעזוב את גוגל, אבל לבסוף קיבל את ההצעה. כך באה לעולם OpenAI.
אחת ממערכות הבינה המלאכותית הראשונות שפיתח איליה במסגרת עבודתו באופן-AI הייתה רשת נוירונים שאומנה על כ-80 מיליון ביקורות מוצרים באמזון, ולמדה מהם איך להפיק טקסטים שנראים ממש כמו ביקורות אמיתיות.
אני מניח שאתם שואלים את עצמכם למה שמישהו ירצה לפתח מערכת בינה מלאכותית שכל מה שהיא יודעת לעשות זה לקטר על דברים שהיא לא באמת שילמה עליהם בעצמה. הרי בשביל זה יש ילדים… אם זה מה שעבר לכם בראש אז אתם צודקים. מטרתו האמיתית של איליה הייתה שונה מאוד. השיטה המקובלת לאמן רשתות נוירונים באותה התקופה הייתה טכניקה שמכונה: למידה מונחית - supervised learning. בשיטה הזו מזינים לרשת דוגמאות של המידע הרצוי יחד עם התשובה הנכונה שהמערכת אמורה להפיק. למשל, נאמר שאנחנו רוצים לפתח רשת נוירונים שיודעת לזהות את הרגש שקיים בביקורת מוצר. זאת אומרת, האם המגיב אהב או לא אהב את המוצר שהוא רכש. הדרך לעשות זאת באמצעות למידה מונחית היא להזין למערכת המון דוגמאות של ביקורות שכאלה לצד התשובות הנכונות שהיא אמורה להפיק. רשת הנוירונים קוראת את הביקורת, מנחשת אם מדובר בביקורת חיובית או שלילית ואז משווים את התשובה הזו לתשובה הנכונה שידועה מראש. אם הרשת טעתה מתקנים אותה, שזה אומר בגדול לשחק עם הקשרים בין הנוירונים ואז שוב מזינים ביקורת חדשה, משווים את התשובה לפתרון הנכון מתקנים את הרשת אם צריך, וכן הלאה וכן הלאה.
למידה מונחית הוכיחה את עצמה בעבר כשהיא הייתה מוצלחת מאוד לאמן רשתות נוירונים לביצוע משימות שונות ומאתגרות אבל היה לה גם חיסרון בולט. מישהו, בן אדם, צריך להפיק את הדוגמאות הפתורות האלה במרכאות. זאת אומרת, מישהו צריך לקרוא את הביקורת מאמזון ולתייג אותה באופן ידני כחיובית או שלילית. מכיוון שבפועל צריך עשרות ואף מאות אלפי דוגמאות פתורות שכאלה, המשמעות היא שמדובר על אופרציה שדורשת המון אנשים, לוקחת המון זמן, וכמובן עולה המון כסף. ואפילו יותר גרוע, בשיטת הלמידה המונחית כל משימה חדשה שנרצה ללמד את הרשת שלנו לבצע דורשת מאיתנו סט חדש ושונה של דוגמאות פתורות שכאלה. עובדה שמאיטה ומייקרת מאוד את תהליך הפיתוח.
הייתה גם אפשרות אחרת: למידה לא מונחית - "Unsupervised Learning". בשיטה הזו לא מאמנים את הרשת על זיהוי הרגש שמופיע בביקורת, אלא עושים משהו אחר לגמרי.
מזינים לרשת ביקורת שמחכו ממנה את המילה האחרונה. למשל "אהבתי את הציור כי הוא…" ומבקשים ממנה לנחש מה צריכה להיות המילה החסרה. כמו מקודם, אם הרשת טעתה בניחוש מתקנים אותה וממשיכים אל המשפט הבא. היתרון הגלום בשיטה הזו הוא הפשטות שלה. לא צריך להושיב בני אדם שיקראו את הביקורות ויסמנו אם הן חיוביות או שליליות. צריך רק לקחת את הביקורות כמו שהן, לחתוך מהן את המילה האחרונה, משהו שתוכנת מחשב פשוטה יכולה לעשות בקלות, ואת המילה שחתכנו שומרים בצד, באיזשהו מאגר נתונים אחר.
בזמן תהליך האימון משווים את המילה הזו אל הניחוש שהפיקה רשת הנוירונים. לדוגמה: אם המשפט הוא אהבתי את הציור כי הוא…, והרשת מנחשת שהמילה החסרה היא מכוער, אפשר להשוות את התשובה הזו למילה המקורית שהייתה במשפט שכנראה הייתה משהו כמו יפה, ולראות אם הרשת צדקה או טעתה. היופי הוא שכל התהליך הזה יכול להיות אוטומטי לגמרי, ללא מגע יד אדם, מה שמפשט ומוזיל את האימון במידה משמעותית.
אבל בכל זאת יש כאן בעיה, מחקרים קודמים בתחום הראו שבאמצעות למידה לא מונחית אפשר בהחלט לפתח בינה מלאכותית שיודעת לייצר טקסטים שנראים כמו ביקורות מוצרים באמזון אבל לא הרבה יותר מזה. זאת אומרת אם אנחנו רוצים לפתח רשת נוירונים שתבצע משימות קצת יותר מורכבות, כמו למשל לזהות את הרגש שמסתתר בתוך ביקורת, אנחנו חייבים להשתמש בלמידה מונחית על כל העבודה הקשה והמפרכת שכרוכה באיסוף ביקורות ותיוג שלהן על ידי בני אדם. אבל איליה שיער שאולי המחקרים הקודמים האלה שגויים. הוא קרא את המאמרים וזיהה בהם שגיאות מסוימות שגרמו לו לחשוב שאולי למידה לא מונחית יכולה בכל זאת לאפשר לרשת נוירונים ללמוד לבצע משימה מורכבת יחסית כמו זיהוי רגש, אם רק מיישמים אותה כמו שצריך.
וזו בדיוק הייתה מטרת הניסוי שלו. הוא אימן את רשת הנוירונים שלו על ביקורות אמזון בלמידה לא מונחית. זאת אומרת לנחש את המילה החסרה בביקורת וביקש לבחון אם הרשת למדה בכל זאת לזהות את הרגש שמופיע בביקורות.
מסתבר שהוא צדק. המחקרים הקודמים אכן היו שגויים. כשבחן איליה את רשת הנוירונים שלו הוא גילה שהיא בהחלט מסוגלת לזהות את הרגש החבוי בביקורת למרות שכל מה שהיא אומנה עליו היה להשלים מילים חסרות. אם לדייק, היה ברשת הנוירונים נוירון אחד ספציפי שנדלק במחאות בצורה מסוימת כשהביקורת שהוזנה לרשת הייתה חיובית ובצורה אחרת כשהביקורת הייתה שלילית.
זו הייתה תוצאה מרתקת ופוקחת עיניים שהראתה שגם למידה לא מפוקחת יכולה לאפשר לרשת נוירונים לבצע משימות מורכבות יחסית. ואפילו עוד יותר מעניין, הרשת שלו, או יותר נכון הנוירון הספציפי המדובר, למד לזהות רגש בצורה מדויקת ונכונה יותר אפילו מבינות מלאכותיות שאומנו בשיטת הלמידה המונחית.
זו הייתה תוצאה מאוד מאוד מפתיעה שהייתה מנוגדת להלך המחשבה בעולם המחקר באותו הזמן.
איליה ועמיתיו תיארו את תוצאות הניסוי שלהם במאמר והגישו אותו לכנס מקצועי אבל המאמר נדחה. לא כל כך בגלל התוצאות עצמן אלא בגלל שזה היה פשוט מאמר גרוע "המאמר הזה כתוב רע, יש בו יותר מדי שגיאות כתיב" ציין אחד השופטים. "אני לא חושב שהבנתי לגמרי מה המחברים רוצים לומר" כתב שופט אחר. "מה היא ההשערה שהחוקרים מציגים. אני מבולבל לגמרי לגבי סעיף 3 ואיבדתי את האומץ לקרוא את המשך המאמר" סוף ציטוט.
המחקר הזה אם כן לא ממש היכה גלים בעולם הבינה המלאכותית, אם לומר זאת בעדינות, אבל איליה המשיך להפוך במוחו לגבי התוצאה המסקרנת שקיבל. הוא שאל את עצמו איך הצליחה רשת הנוירונים שלו ללמוד לזהות רגש בטקסט רק מתוך אימון שמטרתו המוצהרת הייתה ללמד אותה לנחש מה צריכה להיות המילה הבאה במשפט.
כשחושבים על זה זה ממש מוזר. זה כמו לקחת ילד לאמן אותו על לצבוע גדר WAX ON WAX OFF ופתאום הילד הופך להיות אומן קראטה. אגב אם הבנתם את הרפרנס הזה כנראה שהגיע הזמן לקבוע בדיקת קולונוסקופיה אצל הרופא…
התשובה שאליה הגיעה איליה הייתה מפתיעה ומרתקת. דמיינו לעצמכם שאתם קוראים ספר מתח בלשי. נאמר תעלומת רצח בסגנון אגתה קריסטי. העלילה המפותלת כוללת כמה וכמה חשודים, ראיות, אליבי וכדומה. ואז בעמוד האחרון של הספר במילה האחרונה ממש חושפת הסופרת את שמו של הרוצח. עכשיו נניח שהיינו נותנים לבינה המלאכותית לקרוא את הספר אבל ללא אותה מילה האחרונה ואז מבקשים ממנה לנחש מה צריכה להיות המילה הזו.
במילים אחרות מה שאנחנו באמת מבקשים מהבינה המלאכותית לעשות זה לנחש את זהותו של הרוצח. כדי להיות מסוגלת לעשות את זה רשת הנוירונים צריכה לא רק ללמוד את הקשרים הסטטיסטיים בין המילים שבספר, איזו מילה סביר להניח שתופיע אחרי מילה אחרת, אלא גם להיות מסוגלת לחלץ מהן משהו נוסף, משמעות חבויה, ידע סודי, קשרים עלומים בין פיסות המידע האלה. אפשר לומר שאנחנו מצפים מרשת הנוירונים להבין את הטקסט הזה באותו האופן שבו קורא אנושי היה מבין אותו.
רשת הנוירונים שפיתח איליה במסגרת הניסוי שלו לא הייתה עד כדי כך מתוחכמת כמובן. היא לא הייתה מסוגלת לקרוא טקסטים ארוכים כל כך ולחלץ מהן משמעויות כה עמוקות. אבל עצם העובדה שהרשת הצליחה בכל זאת לחשוף את הרגש שהסתתר בתוך ביקורת באמזון גילתה לאיליה שלמרות האימון הבסיסי והלא מתוחכם שהיא עברה הרשת שלו הבינה את הטקסט הזה באופן עמוק ואינטימי יותר מכפי שאיש העז לשער קודם לכן. ואם אפילו רשת נוירונים כל כך בסיסית ולא מתוחכמת, שאומנה על מאגר מידע קטן יחסית, מסוגלת לחלץ משמעויות חוויות של כאלה מתוך טקסטים שהיא מקבלת, מה יקרה שהוא ינסה לאמן רשת נוירונים גדולה ומתוחכמת יותר על כמות הרבה יותר גדולה של מידע?
רצה הגורל, ופחות או יותר במקביל לאיליה, עמלה קבוצת חוקרים בגוגל על פיתוחה של ארכיטקטורה חדשה עבור רשתות נוירונים בשם "טרנספורמר". הארכיטקטורה החדשה הייתה פורצת דרך בשני מישורים: היא אפשרה לרשתות הנוירונים לעבד טקסטים וסוגי מידע אחרים בהיקפים הרבה יותר גדולים ממקודם ולבצע את העיבוד הזה במהירות וביעילות רבים יותר מאי פעם.
הקבוצה של גוגל פרסמה את תוצאות מחקרם ב-2017 במאמר בשם "attention is all you need" שחולל מהפכה רבתי בתחום הבינה המלאכותית.
ארכיטקטורת ה"טרנספורמר" הייתה הרבה יותר מוצלחת מהגישות שקדמו לה וכמעט כל החוקרים עברו להשתמש בה בתוך שנים ספורות. גוגל עצמה הוציאה מודל שפה בשם "ברט" שהיה מבוסס על ארכיטקטורת הטרנספורמר, ולמשך פרק זמן מסוים נחשב לבינה המלאכותית הטובה ביותר בעולם בתחום עיבוד שפה טבעית.
בין החוקרים שאימצו את הטרנספורמר בזרועות פתוחות היה גם איליה סוצקבר שהבין מיד שהארכיטקטורה החדשה הזו היא בדיוק מה שהיה זקוק לו. הוא החליף את הארכיטקטורה הקודמת שבה השתמש אבל שמר על אותו עיקרון בסיסי של למידה לא מונחית. זאת אומרת גם הרשת החדשה אומנה על ניחוש מילים חסרות במשפטים והייתה מסוגלת להפיק, מלשון "to generate", טקסטים חדשים.
למערכת החדשה שקיבל הוא נתן את השם "GPT-1", ראשי תיבות של "Generative Pre-trained Transformer".
"OPEN AI" שיחררה את "GPT-1" ב-2018 וביצועיה של המערכת הזו עוררו התפעלות ואפילו התרגשות בקרב המומחים. הטקסטים שהפיק "GPT-1" היו מוצלחים ומשכנעים ובחלק מהמקרים כמעט בלתי ניתנים להבחנה מטקסטים שנכתבו על ידי בני אנוש.
שנה מאוחר יותר שחררה "OPEN AI" את "GPT-2" שהיה מודל מוצלח אפילו יותר.
אבל קו פרשת המים האמיתי היה "GPT-3" שיצא לאור ב-2020. מידת המורכבות של מערכת בינה מלאכותית נמדדת לרוב במונחים של פרמטרים. נתון שקשור בקשר הדוק למספר הנוירונים המלאכותיים מהן עשויה רשת.
"GPT-1" הכיל כ-175 מיליון פרמטרים ו"GPT-2" היה גדול פי עשרה - 1. 75 מיליארד פרמטרים. אבל "GPT-3" היווה עליית מדרגה אמיתית: 175 מיליארד פרמטרים! פי 100 יותר גדול מ-GPT-2 ופי 1000 יותר גדול מ-GPT-1. גודל שהציב אותו בקטגוריה משל עצמו. מודל שפה גדול - Large Language Model
והקפיצה הזו מסתבר, לא רק שעשתה את "GPT-3" לטוב יותר מקודמו, היא גם הפכה אותו למשהו אחר. "GPT-3" הפגין יכולות שאף מודל שפה לפניו לא התקרב אליהן אפילו. לא רק שהשיחות איתו הרגישו טבעיות, כאילו שאתה מדבר עם אדם בשר אדם, "GPT-3" היה מסוגל לכתוב שירים ולאמצעי בדיחות. הוא היה מסוגל לכתוב קוד תוכנה באיכות גבוהה, לתרגם בין שפות ולענות על שאלות בכמעט כל תחום אפשרי: עריכת דין, רפואה, גננות, בישול, הגותו של ברוך שפינוזה, חייה האישיים של טיילור סוויפט וכל זה מבלי שהבינה המלאכותית אומנה במכוון לבצע את הדברים האלה, אלא רק אומנה לנחש את המילה הבאה במשפט. זה הכל.
את ההשפעה שהייתה להצלחה המדהימה הזו אני לא חושב שאני צריך לתאר לכם. כשהשיקה OPEN AI את chat gpt שהיה מבוסס על gpt 3. 5 'גרסה משופרת של gpt 3 הוא הפך מיד לשירות הפופולרי ביותר בהיסטוריה של האינטרנט עם מיליון משתמשים בשבוע הראשון של ההשקה ולמעלה ממאה מיליון משתמשים בתוך חודשיים/ בפעם הראשונה בהיסטוריה הבינה המלאכותית הפכה לשימושית ומועילה לא רק עבור המומחים אלא גם עבור האדם הרגיל ברחוב. אני נעזר בchat gpt כדי ללמוד על הנושאים שאני כותב עליהם ב"עושים היסטוריה". הבת הגדולה שלי משתמשת בו כדי ללמוד ספרדית. הבן האמצעי שלי פותר איתו שיעורי בית והבן הקטן מפתח איתו משחקי מחשב.
איליה סוצקבר, הילד שעלה מרוסיה בגיל חמש ולמד באוניברסיטה הפתוחה חולל את מה שהיא אולי אחת המהפכות הטכנולוגיות הגדולות ביותר בהיסטוריה האנושית.
אבל לקפיצה המדהימה ביכולותיו של gpt3, על פני קודמו, הייתה גם השפעה נוספת. היא גרמה לאנשים לפחד. זה לא שאנשים לא פחדו מבינה מלאכותית גם קודם כמובן. הפחד מפני טכנולוגיה מתקדמת, שתתהפך עלינו כמו גולם שקם על יוצרו, הוא עתיק לפחות כמו הסיפור על הגולם שקם על יוצרו בהגדה על הגולם מפראג. הפחד מבינה מלאכותית שתתחרפן ותנסה להשמיד אותנו הוא הציר שסביבו נסובו אין ספור עלילות מדע בדיוני. מאודיסאה בחלל 2001 ועד הרובוט המחסל בשליחות קטלנית. אבל עד לא מכבר, אם הייתם שואלים את מומחי הבינה המלאכותית אם אולי יש גרעין של אמת בעלילות הבדיוניות הללו הם היו מחייכים ואומרים שלא. אין שום סיכוי שמשהו כזה יוכל להתרחש בעתיד הנראה לעין. הרי הבינות המלאכותיות שאנחנו מפתחים הן כל כך פשוטות וחסרות תחכום ביחס למה שראינו על המסך הגדול.
ואז הגיעו gpt3 וזמן קצר אחריו גם gpt4 ותרפו את כל הקלפים. הבינה המלאכותית החדשה הזו הייתה כל כך הרבה יותר מוצלחת ומוכשרת מקודמותיה עד שלפתע פתאום מכונות כמו HAL 9000 מאודיסאה בחלל והטרמינטור של שליחות קטלנית כבר לא נראות מופרכות כל כך. למעשה אני די בטוח ש gpt יותר מתוחכם ממה שהיה HAL 9000 בסרט ועושה עבודה הרבה יותר משכנעת בלהעמיד פנים שהוא בן אדם מאשר ארנולד שווארצנגר.
מומחים כמו ג'פרי הינטון ויושוע בנג'יו, שעמלו כל חייהם המקצועיים כדי להביא את בשורת הבינה המלאכותית לעולם, לפתע פתאום נתקפו בחרדה וקראו למנהיגי העולם לקחת ברצינות את האיום שנשקף לאנושות דמצידה של הבינה המלאכותית. הינטון אפילו פרש מעבודתו בגוגל כדי להתרכז בהעלאת המודעות הציבורית לאיום הזה.
הפחד מפני הבינה המלאכותית יעמוד במרכז הפרק הבא של "עושים היסטוריה". חלקו השני של הפרק הזה. השאלה שנרצה לענות עליה היא האם מודלי שפה הגדולים הם אכן הצעד הראשון לקראת הגשמתו של מה שהפיזיקאי המפורסם סטיוון הוקינג כינה "הדבר הטוב ביותר או הדבר הגרוע ביותר שאי פעם קרה לאנושות". בינה מלאכותית כללית artificial general intelligence. יצור מלאכותי שיהיה חכם יותר ומוצלח יותר מבין אנוש בכמעט כל פרמטר אפשרי ובפעם הראשונה יערער על ההגמוניה המוחלטת שלנו כיצורים האינטליגנטיים ביותר בכדור הארץ.
כל זאת ועוד בפרק הבא של עושים היסטוריה.
הפינה בחסות ארכיון הסרטים הישראלי של סינמטק ירושלים
ב-11 בנובמבר 1973 נחתמו הסכמי הפסקת האש בין ישראל, מצרים וסוריה ומלחמת יום הכיפורים הגיעה לסיומה.
לסיומה אבל רק על הנייר. במשך חודשים ארוכים השתופפו אלפי חיילים בסדיר ובמילואים בשוחות קפואות במה שכונתה המובלעת הסורית, שטח שכבשה ישראל בתוך סוריה בימים האחרונים ללחימה, ובדרום אלפים נוספים הזיעו בעמדות שמירה בארץ גושן, כפי שכונה השטח שמערבית לתעלת סואץ.
תשומת הלב הציבורית בימים שאחרי תום הקרבות הופנתה לבחירות לכנסת השמינית שנערכו כשלושה חודשים לאחר תום הקרבות, ולמחאות הספונטניות נגד הממשלה שהחלו לצוץ כשיותר ויותר חיילי מילואים שבו הביתה מהחזית.
כתוצאה מכך הימים שאחרי המלחמה זכו מטבע הדברים למעט מאוד תיעוד בדברי ימי ההיסטוריה הישראלית ביחס לימי הלחימה עצמם. מסיבה זו בשנה שעברה, לקראת יום השנה ה-50 למלחמת יום הכיפורים, יצא ארכיון הסרטים הישראלי של סינמטק ירושלים בקריאה לציבור הרחב לאתר ולמסור לארכיון סרטים ביתיים שצולמו בימי המלחמה ולאחריה מתוך מטרה לשמר את פיסות התיעוד הנדירות האלה עבור הדורות הבאים. ואכן כמה וכמה סרטים שכאלה נמסרו לארכיון הסרטים ברוב המקרים על ידי ילדיהם של הלוחמים שצילמו אותם.
יש משהו שונה ומיוחד בסרטים האלה. כלי התקשורת הממסדיים מתרכזים, מטבע הדברים, בדיווחים חדשותיים, ולכן הם מתמקדים באירועים גדולים במרכאות. קרבות חשובים, גנרלים גדולים ואתרים מפתח בשדות הקרב. סרטים שצולמו על ידי הצבא עצמו נועדו כדי לקדם את מטרותיו של צה"ל. כדוגמת העלאת מורל החיילים והעורף ולכן הם מצולמים וערוכים כדי לשרת את המטרות הללו. אבל סרטים ביתיים לעומת זאת הם תיעוד קטן ואינטימי יותר. הם צולמו על ידי הלוחמים עצמם ומטבע הדברים עוסקים בדברים שהיו חשובים ומעניינים עבורם. נקודת מבט שונה בתכלית מזו של כלי התקשורת והפיקוד הצבאי.
מכיוון שכך הסרטים הביתיים לוקחים אותנו לזמנים ולמקומות שכמעט ולא מתועדים בסרטונים הרשמיים והסצנות שהם מציגים בפנינו הן אותנטיות ואנושיות יותר. לטוב ולרע הם מציגים בפנינו את פניה האמיתיות של המלחמה.
לפני מספר חודשים פנו אלי אנשיו של ארכיון הסרטים וביקשו ממני לעבור על הסרטונים שהתקבלו וליצור מהם אסופה מייצגת. בפינה הזו אם כן אני אתן לכם טעימה מתוך הסיפור שמספרים הסרטונים שבחרתי. את הסרטונים עצמם, לצד מידע לגבי מי שצילמו אותם, תוכלו למצוא באתר של ארכיון הסרטים הישראלי בכתובת jfc. org. il תחת קטגוריית "אסופות" וקישור ישיר לאסופה תוכלו למצוא גם בעמוד של הפרק הזה באתר הבית של רשת "עושים היסטוריה" osimhistoria. com
ב-16 באוקטובר 1973 נחתו ראשוני חיילי צה"ל בגדה המערבית של תעלת סואץ. במרוצת הימים הבאים כבשו הכוחות שטחים נרחבים בתוך מצרים והתמקמו בעמדות ומוצבים מאולתרים. במתחם אוהלים, על כביש קהיר- סואץ, במרחק של 101 ק"מ מקהיר, ניהלו נציגי ישראל ומצרים משא ומתן על תנאי הסכם שביתת הנשק ועל גורלה של הארמיה השלישית המצרית, שהייתה נצורה ומוקפת בכוחות ישראלים, בגדה המזרחית של התעלה.
כיתורה של הארמיה השלישית, שכללה כ-30 אלף חיילים מצרים ועוד כ-300 טנקים, היווה מנוף לחץ מעולה של ישראל על מצרים וסייע לה להכריח את המצרים להחזיר שבויים ישראלים לדוגמה, אבל תחת לחץ המעצמות הסכימה ישראל לאפשר לאו"ם להעביר אספקת מזון ומים למצרים הנצורים. חלק מפעילותם של הלוחמים בשטח היה לארגן את האספקה הזו ולפקח על החיילים המצרים שהעמיסו את שקי המזון על משאיות ודוברות.
אבל גם הפעילות הזו לצד השמירות והתורנויות ודאי הותירה לחיילים לא מעט זמן פנוי להשתעמם בו. אז איך מפיגים את השעמום בלב מדבר?
ובכן רוב שטחה של המובלעת הישראלית בארץ גושן המצרית היה מדבר צחיח ושומם. אבל תעלה ארוכה שהובילה מים מתוקים מהנילוס יצרה מעין נווה מדבר מלאכותי, רצועה צרה לאורכה של תעלת סואץ, שהכילה שטחים חקלאים מעובדים, צמחייה, בעלי חיים וישובים קטנים, שברובם ננטשו בזמן המלחמה או אפילו לפניה בתקופת מלחמת ההתשה.
החיילים הישראלים ניצלו את האזור הפורה הזה כדי לשפר את תנאי השירות העגומים שלהם במדבר החולי. למשל פה ושם לכדו החיילים תרנגולות וכבשים שהסתובבו בין הכפרים הנטושים וצירפו אותם לארוחות הערב שלהם.
אחת האטרקציות במרכאות המרכזיות באזור התעלה הייתה מה שכונה הצי הצהוב. זה השם שניתן לקבוצה של 14 אוניות משא שאיתרע מזלן והיו בדרכן לחצות את תעלת סואץ בדיוק ברגע שבו פרצה מלחמת ששת הימים ב-1967. מכיוון ששני פתחי התעלה נחסמו לתנועה, לאוניות לא הייתה ברירה אלא לעגון באגם המר הגדול, בקצה הדרומי של התעלה, ולהמתין.
חודשים התחלפו בשנים ומכיוון שהאוניות נותרו עדיין תקועות בלא תזוזה, צוותיהן פיתחו הווי מיוחד משלהם שכלל אירועים חברתיים, בולים בעיצוב עצמי, שהפכו במרוצת הזמן לפריטי אספנות מבוקשים ואפילו תחרויות ספורט. השם "הצי הצהוב" ניתן לאוניות בזכות החול המדברי שכיסה אותן במרוצת הזמן. חיילים וקצינים ישראלים נהגו להפליג בסירות קטנות אל אוניות הצי הצהוב כדי להעביר להן אספקה וגם כדי לשוחח ולהתיידד עם אנשי צוותן.
האטרקציות האחרות בסביבה היו קרוב לוודאי פחות נהנות ומבדרות. מאז נחרטה תעלת סואץ בסביבות אמצע המאה ה-19 ובזכות קרבתה היחסית לשדות הנפט של עיראק ואיראן, הפכה מצרים למשבצת חשובה מאוד במשחק השח מט הגלובלי שבין המעצמות השונות ולאורך השנים התנהלו על אדמתה קרבות קשים שגבו את חייהם של עשרות אלפי חיילים.
מעניין לשער אילו מחשבות חלפו בראשם של הלוחמים הישראלים כשהם צפו במשקפת באנדרטה שהקימו הבריטים בעיר ישמעאליה לזכרם של החיילים הבריטים, שנהרגו חמישים שנים קודם לכן, בקרבות מול העותמנים במלחמת העולם הראשונה או בבית הקברות הצבאי בעיירה פאיד, שם נטמנו שרידיהם של כאלף חיילים של בעלות הברית במלחמת העולם השנייה וביניהם גם לוחמים יהודים רבים.
הקצינים והחיילים שביקרו בבית ה/ברות בפאיד הניחו זרים וכתובות זיכרון על הקברים שסומנו באמצעות מגן דוד. עוד אטרקציה עגומה הייתה העיר המצרית סואץ שלחופי מפרץ סואץ בדרום התעלה. סואץ הייתה העיר השלישית בגודלה במצרים עם למעלה מרבע מיליון תושבים, אבל חלק ניכר מהם נמלטו ממנה עוד בימי מלחמת ההתשה שלפני מלחמת יום הכיפורים.
בימיה האחרונים של המערכה הופצצו בתי הזיקוק ומכלי הדלק ששימשו את הצבא המצרי. וביום האחרון של הלחימה, ממש לפני כניסת הפסקת האש לתוקף הורא שר ביטחון משה דיין, בניגוד להחלטת ממשלה מיום קודם, לכבוש אותה.
התכנון החפוז של מבצע הכיבוש עלה לצה"ל ביוקר. 80 חיילים נפלו בקרב הכושל על העיר סואץ ו120 נפצעו. בסרטונים הביתיים תיעדו החיילים את עצמם מסתובבים בעיר הרפאים ההרוסה והחרבה. מתהלכים בינות לבניינים המחוררים, מדוושים באופניים נטושות וכדומה, כמעין גן משחקים אבסורדי.
קשה להשוות בין החזיתות, אבל סביר להניח שחייהם של לוחמי הסדיר והמילואים בגזרת הצפון היו קשים יותר מאלו של חבריהם בדרום, לפחות על פי המשתקף מהסרטים הביתיים שהגיעו לידי הארכיון.
ביומה השישי של המלחמה ברמת הגולן עבר צה"ל ממגננה למתקפה. כוחות שריון ישראלים חצו את הקו הסגול, קו הגבול שלפני המלחמה, והחלו להתקדם צפונה ומזרחה לעבר דמשק. הסורים ובעלי בריתם העיראקים והירדנים ניסו לבלום את ההתקדמות הזו, אבל בהצלחה חלקית בלבד. למרות מספר מתקפות עזות על הכוחות הישראלים, הצליחה ישראל להשתלט על שטח ברוחב של כ-20 ק"מ בעומק השטח הסורי ולהתקרב לכדי 40 ק"מ בלבד מעיר הבירה דמשק.
הכוחות הצה"ליים שהוא במובלעת הסורית כשמונה חודשים שבמהלכן ניהלו הסורים מולם מלחמת התשה בלתי פוסקת. הפגזות תותחים ומרגמות היו דבר שבשגרה, כמו גם תקיפות קומנדו של הסורים בניסיון להשתלט מחדש על העמדות שאיבדו בחרמון.
בין החודשים מרץ ומאי בלבד, ארעו למעלה מאלף תקריות ירי שונות. החיים במוצבים דרשו ערנות בלתי פוסקת ושרידי הטנקים, הג'יפים והתותחים שהיו זרועים לצדי הדרך היוו תזכורת קבועה לצורך הזה.
אויב מר לא פחות בגזרה הצפונית היה מזג האוויר. החורף היכה במובלעת הסורית במלוא עוזו עד כדי סכנת מוות ממשית. בנובמבר 1973 למשל, קפאו למוות שני חיילי מילואים ששהו בחרמון ונהרג גם חייל מהכוח שנשלח לחלץ אותם.
השלג והבוץ היוו מטרד קבוע לכלי הרכב ולחיילים במובלעת.
פרט מעניין במיוחד שאפשר למצוא בסרטים הבייטיים שצולמו במובלעת הסורית הוא נוכחותם של תושבים מקומיים. בעוד שבאזור סואץ רוב התושבים נטשו את בתיהם עוד בתקופת מלחמת ההתשה והותירו מאחוריהם עיירות רפאים ריקות, הכפרים הסורים נותרו עדיין מאוכלסים חלקית בתום המלחמה, ובסרטונים אפשר לראות את פניהם החיוורות של נשים סוריות מציצות מתוך הריסות בתיהם.
ב-18 בינואר 1974 חתמו ישראל ומצרים על הסכם הפרדת כוחות וסיכמו על נסיגת הכוחות הישראלים בחזרה אל צידה המזרחי של התעלה.
בבסיס חיל האוויר נחשון, שהיה למעשה שדה התעופה המצרי פאיד, שהוסב לבסיס לוגיסטיקה ורפואה של צה"ל, ערכו החיילים טקס מיוחד לציון סיום שהותם בארץ גושן.
המבנים בבסיס סיימו את חייהם בסדרה של פיצוצים מרשימים והלוחמים החלו חוזרים ארצה בשיירות של מסייעות ואוטובוסים שעל חלקם הוצמדו שלטים כדוגמת "פרעה גרש אותנו", "אריק שרון הכניס אותנו קיסינג'ר הוציא אותנו ממצרים", "שלום לך אפריקה". חבריהם ברמת הגולן נאלצו להמתין עוד ארבעה חודשים נוספים לפני שחזרו הביתה בשלהי מאי 1974
הלוחמים שחזרו משדה הקרב הביאו עמם זעם אדיר על הכשלים שהובילו למלחמה הקשה הזו והזעם הזה הוביל לשינויים מרחיקי לכת בפוליטיקה ובחברה הישראלית. הסרטים שצילמו אותם לוחמים במצלמותיהם האישיות הם עדות אילמת לחוויות הקשות שעברו ועוזרים לנו, אלה שמשקיפים על המאורעות האלה במרחק של שני דורות, להבין טוב יותר מה עבר עליהם במלחמה הארורה ההיא.
אז בפעם הבאה שאתם מגיעים להורים, אולי לארוחת יום שישי, זיכרו לשאול אותם אם במקרה הם שמרו סרטים ישנים שכאלה בבוידם או באיזה מדף גבוה ואם כן פנו לארכיון הסרטים כדי שימיר אותם לפורמט דיגיטלי וישמר אותם עבור הדורות הבאים שלנו.
תודה רבה.
לעוד פרקים של הפודקאסט לחצו על שם הפודקאסט למטה
Comments