הצצה לשימוש מעשי ב-Ai במחלקות הכספים

הצצה לשימוש מעשי ב-Ai במחלקות הכספים

שיתוף

במטרה לסייע לכם להוביל תהליכי ייעול במחלקות הכספים והתפעול, אנחנו נציג במאמר זה את אופן השימוש המעשי שאפשרי באמצעות הטכנולוגיה הקיימת, כולל דוגמאות לשימוש מהעולם האמיתי, איך משתמשים ובאיזה כלים, מהם המגבלות, מה החשיפות לשימוש ומה הפוטנציאל העתידי. ההתמקדות תהיה בכלים, פרוטוקולים ופתרונות שבנויים עבור חברות ועסקים, בדגש על שימוש במחלקות כספים ותפעול, על אף שניתן ליישם בכל מסגרת תאגידית ועסקית.

רקע מאקסל ל-Ai

כרואה חשבון צעיר נחשפתי לשימוש בכלי שכולנו מכירים, Microsoft Excel, ומיד התמכרתי. ככל שלמדתי להפעיל את התוכנה, הבנתי כמה כוח יש לכלי זה שמאפשר ניתוח ועיבוד נתונים, ויותר מזאת, הבנתי את היתרון הגדול שיש למי שמכיר את התוכנה על פני מי שנרתע משימוש. מטלות ניתוח נתונים חייבו אותי ללמוד נוסחאות חדשות ולהבין מה נדרש לבניית קבצים שלמים, מעין 'אדריכלות', ויצא לי שם במשרד של מומחה אקסל. לאחר שקיבלתי שיחות מעמיתים לעבודה ששאלו בעיקר על נוסחאות באקסל, הכנתי וידאו שמסביר איך משתמשים ב Vlookup למי שמכיר מדובר באחת הפונקציות השימושיות ביותר ברמה הבסיסית של האקסל. את הוידאו שיתפתי במשרד, ולהפתעתי במקום לפנות לי זמן עם פחות שאלות, כמות הפניות רק עלתה… הבנתי שכתוצאה מסרטון ההדרכה אלו שנחשפו אליו הבינו את היתרונות מהשימוש בתוכנה. בעקבות זאת, פתחתי קבוצה בפייסבוק שנקראת 'אקסל עזרה' בה העליתי סרטוני הדרכה ונתתי מענה לשאלות.

היום, כשקיימת טכנולוגיית ה-Ai הקיימת, אתר מסוג 'אקסל עזרה' נראה מיושן כמו עגלה וסוסים בעידן של רכב אוטונימי. היום מומחה אנושי הפך למיותר ואפשר פשוט לשאול את הבוט הידידותי שרק נעשה חכם יותר ויותר עם הזמן. בפרק זמן של שנתיים, משנת 2021 והופעת ChatGPT 3 ועד שנת 2023 והשקת GPT-4 העולם השתנה והצפי שהשינוי בעתיד יהיה משמעותי ונרחב אף יותר.

הסיפור האישי שלי עם האקסל ממחיש את התפתחות הכלים הטכנולוגיים במחלקות הכספים – מהימים בהם נדרש מומחה אנושי שיסביר כיצד להשתמש בפונקציית Vlookup, ועד היום בו Ai מספק מענה מקצועי ומיידי לשאלות מורכבות הרבה יותר. אבל כדי להבין איך להשתמש בטכנולוגיה החדשה באופן אפקטיבי, וכדי להימנע מטעויות שעלולות לעלות ביוקר במחלקת הכספים, חשוב להבין את הבסיס הטכנולוגי ואת המגבלות.

הגורמים לנסיקה בשימוש ב-Ai

בניגוד לדעה הרווחת, טכנולוגיית Ai איננה חדשה. המונח artificial intelligence הוטבע כבר בשנות החמישים, כמו גם המחקר בנושא neural networks שמהווה בסיס לטכנולוגיה הקיימת היום.

המגמה העכשווית של הנסיקה ביכולות ה-Ai מיוחסת לשלושה גורמים עיקריים. הראשון הוא כוח מחשוב – שיפור ביכולות המעבדים החל משנת 2010, בדגש על מעבדים מסוג GPU המותאמים לדרישות הספציפיות של Ai הוביל לאפשרות להגדיל משמעותית את סדר גודל הנתונים שהמודל יכול לעבד, וכתוצאה מכך, להגדיל את היכולות של המודל.

הגורם השני הוא במבנה המודל. בעבודה שפורסמה על ידי חוקרי גוגל בשם 'attention is all you need' הניחו החוקרים את הקרקע באמצעות הצגת ארכיטקטורת Transformer ומנגנון Self-attention mechanism.  באמצעות הבסיס הקיים, מספר מעבדות מחקר, ביניהן OpenAI, פיתחו מודל שפה (גדול) הידוע גם בתור LLM – Large Language Model. המודל מתאמן על נתונים מבוססי שפה בהיקפים עצומים, לומד להכיר דפוסים בשפה אנושית, ספציפית על ידי ניסיון לחזות את המילה הבאה במשפט. מתוך האימון הזה נמצא כי מגיחות יכולות קוגניטיביות של מתן תשובות הגיוניות לבעיות ממגוון דיסציפלינות, החל ממתמטיקה, דרך ביולוגיה ועד פסיכולוגיה.

הגורם השלישי הוא חידוש של OpenAI בתחום אופן התקשורת עם המודל. עם ChatGPT-3 הוצג לראשונה ממשק מהפכני שהפך את ה'שיח' עם המודל לאינטואיטיבי בצורת התכתבות, ופרצו את הדרך לטכנולוגיה שאנו מכירים היום.

התפתחות ה-Ai

מדוע סיפור הרקע חיוני ליישום הפרקטי שלנו בתהליכי העבודה השוטפים? כדי שנעשה שימוש אפקטיבי ב Ai-עלינו להבין באופן מדויק את המודל ולמפות את המטלות שהוא יכול לבצע עבורנו ואת אלו שבהם יכולותיו מוגבלות.

הטכנולוגיה הקיימת המסתמכת על מודלים שאומנו על שפה (אך גם על תמונות, וידאו וקול) עובדת בצורה הבאה: הזינו כמות עצומה של נתונים והזינו אותם לתוך המודל באופן שהמודל 'למד' את הקשרים והדפוסים ויכול להסיק מסקנות. המשמעות היא שעל אף ההבדלים בביצועים, כל המודלים מבוססים בפועל על טכנולוגיה דומה – בין אם זה ChatGPT, Claude או Llama . ההבדלים ביכולות נובעים בעיקר מסדרי הגודל של הנתונים עליהם אומנו המודלים, והמגבלה של המודלים השונים היום היא ברמת המחשוב. ככל שיש לחברה המפתחת יותר גישה למעבדי Ai (תחום שנשלט באופן כמעט אבסולוטי על ידי (Nvidia, המודל שייצרו יהיה בעל מסוגלות ויכולות גבוהות יותר.

כאשר GPT-3 הושק, אנשים הופתעו מיכולות השפה והאינטליגנציה של המודל. פתאום היה אפשר לשוחח עם תוכנה באופן שיכל לדמות שיחה עם בן אדם. אך בשלב זה המודל התקשה לענות בצורה טובה על שאלות בתחום המקצועי, ולכן היה קשה לשלב את התוצרים ברמה תהליכית בחברות. במרץ 2023 הושק GPT-4 שהציג קפיצה משמעותית ביכולות ולראשונה אפשר מתן מענה גם ברמה המקצועית. התשובות שנתן נוסחו תוך שימוש בשפה ברמה שמשתווה או עולה על ניסוח של אדם, וגורמים רבים התחילו להיעזר במודל לצורך כתיבת טקסט, מענה למיילים מקצועיים, תרגום ותשובות לשאלות מקצועיות.

מהר מאוד, אותם מאמצים ראשונים של היכולות החדשות של המודל נתקלו באחת הבעיות העיקריות, המהווה אחד האתגרים המרכזיים בשימוש מקצועי כיום – בעיית ההזיות (כן, זהו המונח הטכני Hallucinations ). אחד המאפיינים של מודל שפה הוא היצירתיות, שמצד אחד מאפשרת לו גמישות במענה ומצד שני מייצרת המצאה של תשובות שאינן בהכרח מתיישבות עם נתוני הבסיס עליו אומן. התכונה הזו מקשה על אמינות השימוש במודל ומונעת יישומים מעשיים רבים, אם כי ישנן דרכים להקטין את ההשפעות של מאפיין זה, בהן נדון בהמשך.

אז איך משלבים את הטכנולוגיה הזו בעבודה שלנו ומדוע להתחיל עכשיו?

במסגרת מאמר זה נתמקד בשימוש ככלי בתהליכי עבודה תפעוליים עבור חברות, בדגש על תהליכים במחלקות הכספים והתפעול הפיננסי. תהליכים אלו כוללים בין היתר פעולות בתחום החשבות והדיווח הכספי כגון תחשיבים פיננסיים ורישום תנועות בספרים לפי תקנים חשבונאיים, הכנת דוחות כספיים ועסקיים, עיבוד וניתוח נתונים פיננסיים, השוואות והתאמות.

בתחום הנהלת החשבונות הכלים החדשים יכולים לסייע בקליטת חשבוניות, ביצוע מעקב תשלומים, סיווג הוצאות, התאמות בנק, התאמות לקוח וספק, דיווחים לרשויות ועוד. גם בתחום האדמיניסטרציה הפיננסית יש שימושים רבים, כמו ביצוע תשלומים, איסוף נתונים להכנת תלושי שכר, טיפול בהזמנות עבודה, הצעות מחיר, תנאי שירות וחיובים. בנוסף, קיימים שימושים במשימות כלליות כמו מענה למיילים, סיכום שיחות וישיבות, ושאלות הנוגעות למאגרי מידע פנימיים.

למרות שנתייחס באופן ספציפי לשימוש במחלקות הכספים, אופן היישום יעבוד גם עבור סגמנטים מקצועיים אחרים תוך התאמות רלוונטיות.

מהו השימוש האפשרי ב-AI בתוך מחלקות הכספים?

את השימוש ניתן לחלק לשלוש קטגוריות עיקריות, לגביהן נתייחס לאפשרויות הקיימות היום כולל יתרונות וחסרונות, הסיכונים, אופן השימוש המומלץ והצפי לעתיד.

בקטגוריה הראשונה -נכלול את השימוש בכלים ותוכנות הכוללות רכיב Ai. לדוגמה, כלים כמו DOKKA המאפשרת זיהוי וקליטה של חשבוניות ספק, או Trullion הישראלית שמייצרת רישום חשבונאי לפי תקן חכירות על ידי קליטה של הסכם השכירות, וכך חוסכת שעות חשב יקרות ומייעלת תהליכים בחברות בהן יישום התקן מהותי ודורש דיוק והשקעה. תוכנות אלו, על אף שמשתמשות ברכיב Ai לצורך ניתוח, עיבוד ופעולה, מאופיינות כ'אינטליגנציה צרה', כלומר, מתאימות למשימה ספציפית שאינה כללית. הפתרון של Datarails  למשל, מאפשר ניתוחים עסקיים וכלכליים, ייעול בהכנת תקציבים וממשק למערכות ה-ERP. הבסיס לכך הוא תוכנה שפותחה על ידי מהנדסים במטרה לספק פתרון ספציפי בעולמות ה- FP&A. אם נרצה להוסיף פונקציונליות, לעשות שינויים, לכלול מקרי קצה חדשים וכדומה, נאלץ להסתמך על המפתחים של התוכנה בעדכוני גרסה. בגדול, התוכנה בנויה לתת פתרון נקודתי וספציפי. קטגוריה זו של שימוש דורשת זיהוי תהליכים מהותיים בארגון, שבדרך כלל מובלים על ידי מנהלי צוותים, שעלולים להתנגד למהלך אוטומציה ספציפית עקב ההשלכות על צוות העובדים שלהם (ולמרות ההבטחה להתייעלות), ולכן יש פה קונפליקט מובנה.

בנוסף, הארגון צריך להתחייב ולעבור תהליך הטמעה, שלרוב יהיה מורכב, והיכרות ספציפית עם הכלים. למרות הקושי ביישום הראשוני, ארגונים יכולים לייעל רכיבים ותהליכים מהותיים ולהוביל להתייעלות ושיפור הן מבחינת כוח אדם והן מבחינת מהירות ואיכות ביצוע. כדי ליישם אנו ממליצים להתחיל עם מיפוי ומציאת פתרון שהוכח כאפקטיבי בארגונים אחרים. המפתחים היום שמחים להביא מקרי שימוש ודוגמאות לארגונים שיישמו את הטכנולוגיה ויעידו על אפקטיביות השימוש.

הקטגוריה השנייה והחדשה יותר היא שימוש ב-Generative Ai  בין אם על גבי ממשק צ'אט דוגמת ChatGPT או באמצעות תוכנה עוטפת כגון Microsoft CoPilot. ההבדל המהותי מול הקטגוריה הראשונה הוא שמדובר ב'אינטליגנציה רחבה', כלומר, תיאורטית יכולת מענה לסוגיות כלליות.

הקטגוריה השלישית, והמתקדמת ביותר, היא שימוש בסוכני Ai. איך מגדירים סוכן Ai ? מתן אפשרות לפעולה על ידי Ai הופכת אותו לסוכן. לדוגמה, מתן הרשאה ל-Ai לשלוח מיילים מתיבת הדואר האלקטרוני שלנו. היתרון התפעולי עצום – במקום ממשק של תשובה-שאלה, שמאפשר רק החלפת אינפורמציה, ניתן באמצעות סוכנים לייצר תהליכי עבודה דינמיים ומלאים יותר.

ולפני שנרחיב בנושא השימוש בכלים מהקטגוריות השנייה והשלישית במחלקות הכספים, חשוב שנבין קודם את המגבלות והסיכונים.

חשיפות, סיכונים ומגבלות

מגבלות באבטחת מידע

כשאנו משתמשים בממשק מול מודל Ai, מבחינת דרך פעולה, מדובר בעיבוד נתונים בענן של ספק המודל. כלומר, אם כתבנו שאילתה ל- ChatGPT, השאילתה עוברת לשרתי OpenAI שם המודל מעבד את השאילתה ומחזיר תשובה בחזרה. למרות ששליחת השאילתה מבוצעת באמצעות חיבור מאובטח, גורם צד שלישי, הספק של המודל, מקבל את המידע. במקרה של מידע רגיש, כגון דיווחים כספיים, שכר עובדים וכו', קיימת חשיפה.

חברות כמו OpenAI משתמשות במידע שנשלח אליהן כדי לאמן את המודלים שלהם. מודל שאומן על מידע כלשהו יכול בעתיד להתייחס למידע הזה אם נשאל בנושא. ב-OpenAI נותנים אפשרות לחסום שימוש במידע לצורך אימון המודל ואף מציעים תוכנית מנוי לתאגידים הכוללת מדיניות פרטיות מידע, כמו גם ספקי מודלים אחרים (וכו' Google, Anthropic). אנו מציעים לבחון את הנושא מול מומחה ה-IT שלכם ולוודא שתנאי השימוש ומדיניות הפרטיות, כולל הדרישות הרגולטיביות מבחינת שמירה על נתונים, מובנת כדי להקטין את החשיפה.

מבחינת מודלים, קיימת אפשרות להשתמש במודל קוד פתוח, כמו Llama של Meta, באופן בו לא שולחים נתונים לצד שלישי. איך זה עובד? Meta נקטו בשיטה של open source ופרסמו בחינם את המודל הראשי שלהם Llama. כל אחד יכול להוריד את המודל הזה ולהשתמש בו מבלי להתחבר לאינטרנט. המגבלה היא שכדי להריץ את המודל הגדול Llama 3.1 405B נדרשת תשתית מחשוב רצינית בעלויות גבוהות, ולכן האופציה הזו אינה כלכלית עבור רוב הארגונים. ישנה אפשרות לשימוש במודלים קטנים יותר ובשימוש מקומי, אך הם לא יהיו ברמת אינטליגנציה וקוגניציה כמו המודלים הגדולים. שימוש במודלים קטנים ובאופן מקומי יתאים למשימות ספציפיות עבורן לא נדרשת אינטליגנציה גבוהה, משימות כמו סיווג, סיכומים, תרגום פשוט.

מגבלה ברמת האמינות

מגבלה וסיכון נוסף שצריך להכיר הוא ברמת האמינות תשובות המודל. אחת הדרכים לקבוע את אמינות המודל היא למדוד 'הזיות', כלומר תשובות מודל שאינן מבוססות עובדות. כפי שהסברנו בתחילת המאמר, בגלל שמודל שפה בנוי בצורה אורגנית כדי להשלים טקסט בצורה הגיונית ולא נבנה על ידי מהנדסים ספציפית כדי לענות תשובה נכונה או לא נכונה, בחלק מהמקרים התשובה שלו תהיה 'יצירתית' עד כדי סילוף עובדות, חוסר בהיגיון ותשובות שגויות לחלוטין. "באופן כללי, ככל שהמודל מתקדם יותר, שיעור ההזיות שלו קטן. עם זאת, בעיה זו טרם נפתרה. בנוסף, ניתן לראות כי אין מדד אחד להזיות, אלא ניתן למדוד בדרכים שונות. בבדיקות המוצגות נבדקה יכולת הסיכום של מודלים מתוך טקסט (vectara) שם מוצגת רמה של בין 1-4% הזיות מודל (תרשים 1), בהשוואה לבדיקת מודל על שאלות ספציפיות מתוך טקסט שקיבל, שם נרשמו רמה גבוהה יותר של הזיות (תרשים 2).

המשמעות היא שאמינות תשובות המודל קשורה לאופן הפעלתו. ישנם הבדלים ברמת האמינות הנדרשת בכל פעולה. עבור סיכומים יש רמת אמינות מסוימת, ועבור שאלות מתוך טקסט יש רמת אמינות אחרת. מבחינת השימוש שלנו בפרקטיקה, המשמעות היא שאנו צריכים לבחון כל פתרון ושיטת עבודה בנפרד כדי להעריך את רמת האמינות ומהן הבקרות הדרושות בשימוש.

תרשים 1 – בדיקת דיוק ליכולת סיכום מטקסט לפי מודל

https://github.com/vectara/hallucination-leaderboard/?utm_source=chatgpt.com

תרשים  2 – שיעור הזיות מטקסטים לפי מודל

https://github.com/lechmazur/confabulations/?utm_source=chatgpt.com

מהן מגבלות השימוש בסוגי משימות?

מגבלה נוספת שיש לציין היא פערים ביכולות המודל בסוגי משימות שונות. במדידות ביצועי המודל במבחנים הבודקים שפה, הנדסת תוכנה, היסטוריה, פסיכולוגיה, סטטיסטיקה, בחינות לשכת עורכי הדין – המודלים החדישים מצליחים להציג תוצאות המקבילות לעשירון העליון של הנבחנים האנושיים. מנגד, המודלים מתקשים בכל מה שנוגע להיגיון בסיסי ותכנון רב שלבי. (תרשים 3)

המשמעות עבורנו היא שלמרות שנראה כי בבחינות המודל מצטיין, ביישום משימות אמיתיות בפועל, יש לנו לבחון אותן ולהעריך בעצמנו, פר משימה. מומלץ לבצע בדיקות של כל משימה שנותנים למודל לבצע, בין אם כשאילתה ובין אם משימה לסוכן, ולבדוק אותה מספר פעמים כדי להעריך שיעור הצלחה במשימה הספציפית. (תרשים 4)

תרשים 3 – בדיקת ביצועים שלפי נושא למודלים של OpenAI

https://openAI.com/index/gpt-4-research

תרשים 4 – בדיקת ביצועים לפי נושא, השוואה של המודלים המובילים

https://www.vellum.AI/blog/llm-benchmarks-overview-limits-and-model-comp…

שימוש מעשי – איך מיישמים את הטכנולוגיה במחלקת כספים?

לאחר שהבנו את היכולות והמגבלות של הטכנולוגיה, השאלה המתבקשת היא – איך מתרגמים את כל זה להתייעלות אמיתית במחלקת הכספים? התשובה מתחילה בהיכרות מעמיקה עם הכלים העומדים לרשותנו. כיום קיים מגוון רחב של פתרונות Ai, החל ממודלי שפה מתקדמים, דרך כלים ייעודיים למחלקות כספים, ועד סוכני Ai אוטומטיים. כל אחד מהכלים הללו מתאים למשימות ספציפיות ודורש הבנה של אופן השימוש המיטבי בו.

מהם הכלים העיקריים העומדים לרשותנו כיום?

מבחינת LLM (המודלים המוכרים של שפה) המובילים בשוק מבית OpenAI הם ChatGP4o ומודל נוסף בשם o1,  עבור השימושים שלנו אלו שני מודלים רלוונטיים מהמשפחה הזו (אכן שמות דומים ומבלבלים, אך מדובר בשני מודלים שונים). ChatGPT4O הוא מודל שמסוגל לקבל טקסט, תמונות וקבצים, ומסוגל גם לחפש ברשת. מודל o1 הוא מהראשונים מסוגו אשר אומן לצורך מתן מענה כולל היגיון באמצעות תכנון הצעדים שלו (Chain of thought). ההבדל ניכר ברמת היכולות בטיפול בנושאים מורכבים יותר, ולכן שימושי מאוד לתוצרים הדורשים תכנון רב צעדים וייצור קוד) עבורנו Python, VBA רלוונטיים, ניגע בזה בהמשך).

המודל של Anthropic שנקרא Claude 3.5 נחשב למודל הכי חזק מבחינת יכולות שפה, בעיקר בייצור קוד, אם כי מודל o1 שהושק באמצע דצמבר עקף אותו. בנוסף יש ל Anthropic -פרוטוקול שימוש בסוכנים שנקרא MCP אותו ניתן גם לחבר למודלים של חברות אחרות.

מבית גוגל יש את משפחת ,Gemini כשגרסה 1.5 נחשבת נחותה למודלים הקודמים שהזכרנו. גוגל הדביקו את הפער וגרסה 2 של מודל הדגל שלהם צפויה להיות שיפור משמעותי. כלי חזק במיוחד שהושק לאחרונה בחודש דצמבר 2024 הוא .Google Deep Research הכלי שולח את ה-Ai  לעשות מחקר ב-100 אתרים שונים באינטרנט ולחזור עם דוח מסכם על הפעילות. כלי זה נבחן ונבדק על ידי מומחים בתחומים שונים ונכנס לשימוש ככלי עזר למחקר.

אחרון ברשימה זו יש לנו את Llama 3.1 מבית Meta, מה שמבדיל אותו זה שהוא קוד פתוח, כלומר כל אחד יכול להוריד ולהשתמש בו מבלי להתקשר עם Meta. אם זאת, כפי שהסברנו, מודל הדגל מצריך כוח מחשוב שאין ברשות חברות קטנות ובינוניות, ולכן הפתרון היחיד הוא התקשרות דרך הענן  (אם כי לא חובה מול Meta, אלא מול כל נותן שירותי מחשוב בענן). מבחינת יכולות הוא נחשב נחות למודלים המובילים.

כלים אלו מהווים בסיס עליו אפשר לבצע פעולות או להפעיל סוכנים. אחת הבעיות ביישום בפועל היא בעיית ממשק. אם לדוגמה רוצים להשתמש במודלים האלו לצורך תרגום ומענה למיילים, צריך להעתיק מתוך המייל, להדביק, להעתיק שוב את התשובה ולהדביק במייל. על פניו, מדובר באי נוחות קטנה, אבל כשמתחילים לייצר תהליכים מורכבים יותר, לכל חיכוך מסוג זה יש 'עלות' שנרצה לצמצם.

אחד הכלים החשובים היום הוא Microsoft Copilot 365, או הגרסה שמחוברת באופן ישיר לתוכנות מיקרוסופט, כולל Excel, PowerPoint, Teams, Outlook ועוד. המשמעות הפרקטית עצומה – לא רק שהחיכוך בשימוש קטן מאחר ואנחנו מפעילים את ה- Ai בתוך האפליקציות, אנחנו גם נמנעים מחשיפה ושומרים על הנתונים הפרטיים שלנו מאובטחים כחלק מהתהליך. צריך לציין כי מדובר בגרסה שונה מה-CoPilot שאתם רואים כמוצג בחינם בדפדפן Edge או כחלק מה-Windows. הגרסה של 365 מתלבשת על התוכנות ומאפשרת גם פעולות – למשל ב-Excel ניתן לבקש באופן מילולי שינויים ולקבל את השינויים בתוך הקובץ. בנוסף, ה-CoPilot מאפשר ייצור של סוכנים, כלומר הגדרת גורם בתהליך שמקבל תפקיד ויכול לבצע פעולות בתוכנות של מיקרוסופט או בממשקים לתוכנות אחרות.

הכלי האחרון בו אליו נתייחס הוא סוכנים. המושג מתאר שימוש במודל בסיס LLM לדוגמה ChatGPT 4o ומתן הגדרות של תפקיד, אופן ביצוע התפקיד ופעולות. לדוגמה, סוכן סיכום וסיווג מיילים. הגדרת הסוכן תהיה 'תפקידך לעבור על המיילים הנכנסים לתיבת דואר X, את המיילים תסווג לשלוש קטגוריות: דחופים, שוטף וזבל. כאשר מיילים מקטגוריית דחופים, תשלח למנהל Y, תשתמש בטון מקצועי ותסכם את מהות המייל הדחוף'.

במקרה הזה הגדרנו עבור הסוכן את תפקידו, הגדרנו את הפעולות שעליו לבצע והגדרנו אופן מענה. ניתן כמובן לרדת לרמת פירוט יותר ספציפית. השימוש והממשק היום להקמת סוכנים עלול להיות מורכב ובאמצעות קוד, באמצעות מסגרות כמו Crew.Ai או במסגרות של תכונות מבוססות כמו סוכנים שבנויים לתוך Salesforce וגם כמו אלה שהזכרנו  Microsoft Copilot 365.

צריך להזכיר את הפרוטוקול של Anthropic שנקרא MCP – Model Context Protocol, שמהווה מסגרת לחיבור סוכנים. השימוש בפרוטוקול הזה מאפשר, בין היתר, לסוכן מוגדר לבצע פעולות במחשב האישי כמו פתיחת תיקיות, קבצים, ביצוע פעולות בדפדפן ועוד. מדובר בכלי חזק מאוד אך כרגע מוגבל מבחינת היכולת. המגבלה העיקרית היום בשימוש בסוכנים היא הקושי של המודלים לבצע תכנון רב שלבי ושימוש בהיגיון. מלבד מודל o1 של OpenAI, רוב המודלים נכשלים כסוכנים בפעולות מורכבות מדי. o1 מהווה שינוי ובסיס לפיתוח עתידי של סוכנים בעלי מסוגלות גבוהה יותר שצפויים להיות משמעותיים בשנת 2025.

כלי אחרון שיש להזכיר, אחד השימושיים ביותר עבורנו, מהווה כלי טיפה מעט שונה מאלו שהזכרנו ונקרא Perplexity . מדובר בכלי חיפוש, סגנון גוגל, רק שבמקום להפנות לאתר הוא מספק תשובות בהסתמך על אתרים. בסך הכל מדובר בממשק יעיל מאוד לקבלת מידע מקצועי, שעונה על צרכים של אמינות ויעילות ולכן מומלץ לשלב בתהליכים הבסיסיים של חיפוש מידע.

איך משתמשים בכלים שעומדים לרשותנו?

עכשיו שהבנו באיזה כלים נוכל נשתמש, נעבור להסביר איך משתמשים. כדי לנצל את הפוטנציאל העצום הזה בפרקטיקה קבענו מסגרת שכוללת מספר שלבים: מיפוי תהליכים ארגוניים, בחינת כדאיות טרום יישומית, ניסוי פתרון בסביבת בקרה, הערכה והמלצות, ויישום בשטח.

תהליך המיפוי כולל הגדרת תהליכי מפתח בארגון (בדומה ל-SOX) תוך חלוקה לגורמים המבצעים, אופן הביצוע, הממשקים מול תוכנות, רמת רגישות המידע והפוטנציאל הגלום באוטומציה של התהליך.

בחינת הכדאיות, כמובן שככל שהתהליך מהותי בחברה, שווה להשקיע יותר בתכנון ויישום של Ai. כפי שהבנו מהמאמר, המודלים היום מתמחים בסוגים שונים של בעיות ומתקשים בסוגים אחרים, ולכן עלינו לפרוט כל תהליך לתתי תהליכים ככל שניתן.

ניסוי ובקרה של התהליך, המפתח ליישום אפקטיבי של Ai בתהליכי עבודה חייב לכלול, מעבר למיפוי פרטני, גם שלב של ניסוי. רק במסגרת בחינת אופן השימוש המעשי נוכל להעריך האם המשימה מתאימה ל-Ai,  מה האיכות שמייצר, האם נדרשות בקרות נוספות, מה השיפור ביעילות וכו'. צריך לזכור שטכנולוגיית Ai מאופיינת בשונות, כלומר, גם אם הצלחנו להפיק תוצאה רצויה בניסוי, חשוב שננסה מספר פעמים ובווריאציות שונות כדי לקבל הערכה מציאותית של יישום עתידי בשטח.

חשוב לזכור את נושא ההזיות, כך שאם נדרשת תוצאה הכוללת נתונים מאומתים, צריך לייצר פתרון אמין. הערכות והמלצות, בחלק הדוגמאות של המאמר נתייחס לדרכים לשפר את אמינות התוצרים. הערכת הפתרון בסביבת הבקרה תייצר עבורכם הערכה של התאמת הפתרון לשיטת העבודה שלכם. ברגע שרואים שיש ערך בפתרון לפי פרמטרים של ייעול זמן, איכות ו/או נוחות שימוש, ניתן להמליץ על יישום כללי ורוחבי עבור העובדים והממשקים הנוגעים לתהליך. לפני היישום מומלץ להדריך את העובדים שישתמשו או יבואו בממשק כדי לייצר תנאים אופטימליים.

יישום, הכרנו את הכלים העיקריים העומדים לרשותנו, אך ההבדל בין להכיר כלי לבין להשתמש בו באופן אפקטיבי הוא משמעותי מאד. במיוחד במחלקות כספים, שם הדיוק והאמינות הם קריטיים ביותר, חשוב לדעת איך מיישמים את הטכנולוגיה הלכה למעשה. הדוגמאות הבאות לקוחות מניסיון אמיתי בשטח – מקרים בהם בחנו, יישמנו והטמענו את הטכנולוגיה בתהליכי עבודה קיימים. אין מדובר ברשימה ממצה או בשימושים נפוצים דווקא, אלא בהדגמה של אפשרויות מעשיות שכבר עובדות היום. מטרתנו פה היא להראות כיצד ניתן לשלב את הטכנולוגיה באופן פרקטי ומיידי, תוך התמודדות עם האתגרים והמגבלות שהכרנו. כל ארגון יכול למצוא את השימושים המתאימים לו, ולהתחיל ליישם אותם כבר עכשיו.

כדי להמחיש נעבור למספר דוגמאות ליישומים:

שאילתות מידע  במחלקות כספים מחייבות לעמוד דרישות מקצועיות לעבוד בסטנדרטים ועל פי ונהלים מקצועיים משתנים ומורכבים. עולם המיסים למשל כולל התפתחויות ומתעדכן באופן שוטף. החומר המקצועי שמופק, הן מרשויות המס, מומחים בתחום, פסקי דין ועוד, הינו מורכב ומרובה. כאשר אנו מחפשים פתרון, חיפוש פשוט לפי מילת מפתח לא מספק מענה אמיתי – אנחנו רוצים לקבל תשובה מתוך מבוססת על נתונים. לצורך מתן מענה לשאלות שהיו לנו בנושא מס לקחנו את ספרון עדכוני מס לשנת 2025 של BDO (שימושי ומומלץ) ושאלנו את המודל שאלות בנושאים שונים. כמו כן, כדי למנוע הזיות, ביקשנו מהמודל שיצטט את המיקום ממנו לקח את התשובה בתוך הטקסט. במקרה זה אין מניעה לחשוף את הקובץ למודלים הציבוריים ולכן אפשר לקבל מענה איכותי מהמודלים המובילים. בדוגמה זו המודלים מצליחים לייצר תשובות מדויקות יחסית ובצורה יעילה, כך שגם זמן הביצוע מתקצר משמעותית וגם מרוויחים עלייה באיכות.

תוצרים מקצועיים – החשבים שלנו נדרשים לבצע רישום חשבונאי לפי תקנים. בין אם זה תקינת IFRS, US-GAAP או ישראלית, נדרשת רמה מקצועית גבוהה. חשבים מנוסים מכירים גם את ה'פינות' בתקנים, אך באופן שוטף וכולל עולות הרבה שאלות בנוגע ליישום החשבונאי. תקן IFRS16 נחשב תקן שכיח ואופי יישומו טכני. שוב, ניתן לקחת את נתוני הבסיס (בתקן הזה עלויות בהסכם שכירות, תקופה, שיעור היוון וכו') ולבקש מהמודלים להכין לא רק את התחשיב, אלא גם את פקודות היומן הנדרשות לכל תקופה. המודלים המובילים יפיקו תשובות מפורטות הכוללות גם את דרך הפתרון, כך שאפשר לשלב בביקורות של הדוחות הכספיים. אופן פתרון זה מניב תוצאות טובות אבל גם חשוף במידה מסוימת להזיות. בבדיקה שלנו, ניסינו להריץ מספר שאלות מהאקדמיה, והמודל הצליח להניב תוצאות טובות. למרות זאת, גם שיטה זו חשופה להזיות מודל, בטח כשמדובר בביצוע תחשיבים, ולכן יש דרך חזקה יותר כשמדובר בתקנים טכניים. במקרה הזה, במקום לבקש פתרון, ביקשנו מ o1 לייצר קוד Python שכשמקבל את הפרמטרים הבסיסיים, מניב טבלת סילוקין ופקודות יומן לתקופה. המודל הפיק קוד אותו הרצנו ב-Google Colab  וקיבלנו מיני תוכנה שמפיקה תוצר חשבונאי מקצועי. מאחר ומדובר בקוד שמבצע את החישוב, השתמשנו במודל לייצור תוכנה במקום לייצור תוצאה. המודלים המובילים היום מעולים בייצור קוד שמיש. אופן שימוש זה פותח אפשרויות רבות לצורך פתרונות מקצועיים.

בדיקת דוחות כספיים. במקרה של נתונים רגישים תמיד מומלץ להתייעץ עם מומחה ה-IT שלכם בנוגע לחשיפה. כיום בשימוש הבילט-אין של CoPilot אנחנו לא צריכים לצאת מתוכנת הוורד ויכולים לבחון מלל בדוח כספי לטעויות ושגיאות, התאמות מספרים או השוואות בין גרסאות. במקרה הזה, ה-CoPliot לא מבצע עבודה איכותית, ויש הרבה מקום לשיפור, אבל בכל זאת, שווה להכיר את הפתרון כי קצב השיפור של CoPilot הוא אדיר והצפי הוא שכבר באמצע שנת 2025 יהיה ניתן לתת לו חלק מהותי בעריכת דוחות כספיים.

ממשקים ועריכת נתונים במקרה של Excel נדרש ידע ברישום נוסחאות. היום אפשר לבקש מהמודלים או ישירות ב-CoPilot  את התוצאה הרצויה ולקבל נוסחה מתאימה. אפשר להרחיב את השימוש בצורה הזאת לכלים חזקים יותר, למשל PowerBI או PowerPivot בהם נדרש להכיר שפות קוד מורכבות יותר, שבדרך כלל לא מוכרות לאנשי כספים. במאגרי מידע רבים ניתן להפיק שאילתת SQL לצורך הפקת נתונים ישירה. אנחנו מבקשים מהמודל להפיק את השאילתה ובעזרתה מקבלים תוצר מעובד. בשימוש בפרויקטים שכללו עיבוד נתונים מורכב, ובהם השתמשנו ב-PowerPivot המודלים יצרו את הנוסחאות המורכבות הדרושות לעיבוד המידע. כמו כן, כאשר נדרש סידור של מידע, למשל קובץ שמגיע בפורמט מסוים אותו רוצים להמיר לפורמט אחר, בדרך כלל משתמשים בפקודת מאקרו באקסל. פקודות מאקרו נרשמות ב-BVA ואנחנו משתמשים במודלים לצורך כתיבת הקוד הנדרש להפעלת פקודות מאקרו מורכבות, כך שניתן להמיר פורמטים מורכבים בצורה שבעבר לא היינו מסוגלים.

ניתוח נתונים ומציאת חריגים. במקרים של בחינת חיובים (לקוחות/ספקים) שלנו בתור ארגון, אנחנו מפעילים את המודל על מקבץ נתונים גדול כדי לבחון חריגים. למשל, קובץ אקסל של רישום שעות עובדים שמכיל עשרות אלפי שורות, כאשר כל רישום נעשה באופן ידני (ולכן קשה לחפש בצורה אבסולוטית). אנחנו מפעילים את המודל לניתוח ומגדירים לו מה לחפש כחריג. בביצוע משימה זו קיבלנו תוצאות מעורבות, כשה-Ai לפעמים מתקשה למצוא באופן מלא ושלם את מה שרצינו והגדרנו.

דוגמאות אלו באות להמחיש מקרים בהם בחנו את אופן השימוש והערכנו את ההצלחה והיעילות של כלי Ai. מבחינת שימוש בסוכנים, הנושא חדש מאוד וכרגע רחוק מלהיות יעיל, אבל צפוי לקפוץ מדרגה בשנת 2025 ולהיות שימושי כבר החל מאמצע השנה.

המלצות

תוכלו לדעת אם היישומים רלוונטיים לעסק שלכם רק אם תנסו, וגם אם הכלים לא מצליחים בגרסתם הנוכחית לבצע מאה אחוז מהמטלה, חשוב לדעת שהתחום כולו עושה קפיצות מדרגה בקצב שרק מתגבר. הגרסה החדשה של o1, ניתנה למומחה בתחום הפיסיקה בעל PhD, ובניסיון שלו התוכנה הצליחה לייצר פתרון למחקר שהוא עבד עליו במשך 10 חודשים, בזמן של מספר שעות.

המשמעות היא שיש מקרי שימוש אמיתיים, בהם ה-Ai הולך לשנות את הדרך בה אנחנו עובדים. התבוננות מעמיקה בטכנולוגיה, על יתרונותיה ומגבלותיה, מראה שהמפתח להצלחה טמון ביישום מושכל ומדורג. במחלקות הכספים של היום, השילוב בין הבנה מקצועית לבין שימוש נכון בטכנולוגיה יכול להוביל להתייעלות משמעותית. אנחנו ממליצים לכולם להרחיב את הניסיון ולהתנסות, במו ידיכם, בשימוש בטכנולוגיה הזאת במסגרת העסקית.

כפי שג'נסן וונג, מנכ"ל Nvidia (בציטוט של ריצ'ארד בלדווין, כלכלן)  אמר לאחרונה:

 'Ai won't take your job, it's somebody using Ai that will take your job.'

*מאמר זה נכתב באופן ידני, ולאחר שנכתב שוכתב על ידי Ai. לאחר מכן, שוכתב שוב על ידי אדם אחר ומהווה תוצר של אדם+מכונה.

שיתוף

בואו נדבר

אנחנו עונים, לא בוט!

מלאו את הטופס ונחזור אליכם בהקדם עם מידע ופתרונות מותאמים אישית