תמלולי האזנות סתר: חיבור בין 5 גורמי חקירה

שעת לילה. אתה עובר על חומר הראיות בתיק 4217/26. יש לך 5 צרורות של תמלולי האזנות סתר, כל אחד מיחידת חקירה אחרת. המטרה: להוכיח שהחשוד לא הכיר עד מרכזי לפני התאריך הנטען.

החשוד, המכונה 'אלפא' בתמלולי יחידה א', מכחיש כל קשר. אבל אתה זוכר במעורפל שיחה שבה הוא מוזכר. הבעיה: בתמלולי יחידה ב', הוא נקרא 'היעד'. ביחידה ג', שמו המלא מופיע בערבית, מתועתק לעברית בשני כתיבים שונים. ביחידה ד', הוא פשוט 'הדובר'.

יש שיחה אחת, קבורה איפשהו ב־240 עמודי תמלול, שמקשרת את 'אלפא' לשיחה על 'המחסן' שבוע לפני האירוע. אבל אתה לא יודע באיזה כינוי לחפש, באיזה קובץ, או באיזה תאריך. השעון מתקתק, והחיפוש הידני מרגיש כמו לחפש מחט לא בערימת שחת, אלא בחמש ערימות שונות.

מה זה אמור להיראות

תמונה מחוברת של כל השיחות היא לא פנטזיה. היא דורשת מערכת שמסתכלת על כל חמשת המקורות כסיפור אחד, ומבינה את השפה שמאחורי המילים. כך זה נראה בפועל:

ציר זמן מאוחד — כל השיחות מכל המקורות מסודרות על ציר זמן אחד. לא צריך לקפוץ בין PDF-ים. אתה רואה את שיחת הבוקר מיחידה א' ואת שיחת הצהריים מיחידה ב' באותו מסך, לפי הסדר הכרונולוגי.
פרופיל ישות לכל דובר — המערכת מבינה ש'אלפא', 'היעד', 'מ.ס.' ושמו המלא הם אותו אדם. היא בונה לו 'פרופיל' מאחורי הקלעים ומקשרת אליו אוטומטית כל אזכור שלו, לא משנה באיזה כינוי השתמשו.
קישור סמנטי בין נושאים — המערכת מזהה ששיחה על 'העברת הסחורה' ושיחה על 'הפגישה במחסן' קשורות כנראה לאותו אירוע, גם אם המילים המדויקות שונות. היא מציעה את הקשר, ואתה מחליט אם הוא רלוונטי.

התוצאה היא יכולת לשאול שאלות על כל התיק בבת אחת, ולקבל תשובה שמורכבת מראיות מכל המקורות.

איפה זה נשבר ידנית

הגישה הידנית נשברת לא בגלל העומס, אלא בגלל שלוש נקודות כשל מבניות שקיימות בכל תיק עם ריבוי מקורות:

שמות וכינויים לא עקביים המתמלל ביחידה א' שמע 'מוחמד' וכתב עם ואו. המתמלל ביחידה ב' כתב 'מחמד' בלי. החוקרים בשטח קראו לו 'אלפא'. Ctrl+F רואה שלושה אנשים שונים, ומחמיץ את הקשר הקריטי.
טרמינולוגיה וסלנג כל חוליית חקירה וכל קבוצת נחקרים משתמשת בז'רגון משלה. 'הציוד', 'הסחורה', 'החבילה' – כולם יכולים להתייחס לאותו מוצג. חיפוש טקסטואלי לעולם לא יבין את ההקשר הזה.
הפניות זמן יחסיות בתמלול אחד כתוב 'נפגשנו אתמול בערב'. בתמלול אחר, מאותו יום, כתוב 'הפגישה ב־21:00'. כדי לקשר ביניהם, צריך לפתוח את שני המסמכים, להצליב את תאריכי התמלול, ולבצע את החישוב ידנית. על פני 50 שיחות, זה הופך למשימה מתישה.

איך זה עובד בפיזי על תיק 4217/26

בואו נחזור לתיק 4217/26. העלינו את כל 5 צרורות תמלולי ההאזנות למערכת. במקום לדפדף, אנחנו שואלים שאלה פשוטה:

"כל השיחות שבהן 'אלפא' או 'היעד' מוזכרים בהקשר של המחסן בשבוע שלפני ה־14.02"

המערכת מחזירה תוך 3 שניות רשימה של 4 שיחות. שתיים מהן מגיעות מתמלולי יחידה א', שם הדובר נקרא 'אלפא'. שיחה שלישית מגיעה מיחידה ב', שם הוא נקרא 'היעד'. השיחה הרביעית, הקריטית ביותר, מגיעה מיחידה ג', שם שמו המלא מופיע בערבית. היא כוללת את הציטוט: "הוא אישר שיגיע למחסן לקחת את הציוד". לחיצה על הציטוט פותחת את ה־PDF המקורי בעמוד הנכון, והנה הראיה שחיפשת.

מתי זה לא שווה

אם יש לך תמלול אחד של שיחה בודדת, אין צורך במערכת מורכבת – פשוט תקרא אותו. הכוח האמיתי נכנס לפעולה כשיש לפחות 3 מקורות שונים, עשרות שיחות, וצורך לקשר בין ישויות ואירועים על פני כל החומר.

שאלות נפוצות

כמה שפות התמלול תומך?

המערכת תומכת בעברית, ערבית, רוסית ואנגלית בתמלולי האזנות. היא מזהה את השפה אוטומטית פר מסמך ויודעת לקשר בין ישויות (כמו שמות) גם אם הן מופיעות בשפות שונות במסמכים שונים.

האם המערכת מזהה ניבים וסלנג?

כן. המודלים אומנו על ז'רגון משפטי וגם על סלנג רחוב ישראלי וערבי. היא מבינה ש'לסגור את הסחורה' ו'להעביר את החבילה' יכולים להתייחס לאותה פעולה, ומציפה את הקשרים האלה כרמזים סמנטיים.

מה קורה אם שני תמלולים סותרים זה את זה?

המערכת לא 'פותרת' סתירות אלא מציפה אותן. אם תמלול אחד אומר 'היעד היה במחסן ב־21:43' והשני אומר 'היעד היה בבית ב־21:45', שאילתה על מיקומו של היעד תציג את שתי הגרסאות זו לצד זו, עם ציטוטים מלאים. מציאת הסתירה היא המטרה.

חברו את ההאזנות בתיק 4217/26 בעצמכם

תיק הדמו שלנו כולל 62 מסמכים מ־5 גורמי חקירה, כולל תמלולי האזנות. נסו לשאול על 'אלפא' ו'המחסן' ותראו איך התשובה נבנית מכמה קבצים שונים. זה ממחיש גם את החשיבות של איתור פערים בשרשרת המוצג שמוזכרת באותם מסמכים.

לדמו ←

תמלולי האזנות סתר מ־5 גורמי חקירה — איך מחברים?

מה זה אמור להיראות

איפה זה נשבר ידנית

איך זה עובד בפיזי על תיק 4217/26

מתי זה לא שווה

שאלות נפוצות

כמה שפות התמלול תומך?

האם המערכת מזהה ניבים וסלנג?

מה קורה אם שני תמלולים סותרים זה את זה?

חברו את ההאזנות בתיק 4217/26 בעצמכם

שרשרת מוצג שבורה — איך לאתר את הפער הראשון

הכנת חקירה נגדית — 10 שאלות מ־7 עדויות

מה זה אמור להיראות

איפה זה נשבר ידנית

איך זה עובד בפיזי על תיק 4217/26

מתי זה לא שווה

שאלות נפוצות

כמה שפות התמלול תומך?

האם המערכת מזהה ניבים וסלנג?

מה קורה אם שני תמלולים סותרים זה את זה?

חברו את ההאזנות בתיק 4217/26 בעצמכם

מאמרים קשורים

שרשרת מוצג שבורה — איך לאתר את הפער הראשון

הכנת חקירה נגדית — 10 שאלות מ־7 עדויות