למידת מכונה לאנליסטים
עקרונות תיאורטיים ויישום פרקטי בפייתון
אודות הקורס
למידת מכונה (Machine Learning) היא תחום רחב המתרכז ביצירת תהליכים המאפשרים למכונות ללמוד מבלי לתכנת אותן באופן ספציפי לכך. תהליכים אלו נותנים לנו את היכולת לחלץ ידע מתוך נתונים גולמיים.
ה"ידע" יכול להיות תשובה לשאלה שאנחנו שואלים, הפקת תובנות מסויימות או זיהוי דפוסים ומגמות.
למידת מכונה נמצאת היום כמעט בכל תחום עסקי שניתן לחשוב עליו והיא לוקחת חלק מרכזי בתהליכי קבלת החלטות של ארגונים גדולים וקטנים כמו גם בניית מודלים סטטיסטיים לחיזוי של גורמים שונים, בינה מלאכותית (Artificial Intelligence), נהיגה אוטונומית, ניתוח שפה (Natural Language Processing), ראיית מחשב (Computer Vision) ועוד ועוד.
קורס זה עוסק בלמידת מכונה בסיסית מזווית טהורה של ניתוח נתונים. הקורס מיועד לבניית תשתית תיאורטית חזקה לתחום כמו גם מימוש של העקרונות המוצגים בשפת פייתון.
ייחודו של קורס זה הוא בכך שהוא אינו דורש רקע אקדמי מעמיק. במהלך הקורס נפשט את העקרונות מאחורי האלגוריתמים הנפוצים ביותר בתחום ונציג אותם בצורה אינטואיטיבית ונוחה להבנה.
במקום להתעסק במשוואות מתמטיות, נבין את ההיגיון מאחורי המתודולוגיות השונות ונתרגל אותן באופן מעשי.
קהל היעד
אנליסטים, כלכלנים, סטטיסטיקאים, מפתחי בינה עסקית ואנשי מקצוע נוספים אשר מסתמכים, משתמשים ועובדים עם נתונים באופן מסיבי.
-
עובדים אשר מעוניינים להכנס לתחום של Data Science ומעוניינים להבין עקרונות ושימושים פרקטיים של למידת מכונה.
-
מפתחי פייתון המעוניינים להתפתח לתחום נוסף ולהוסיף למידת מכונה לאוסף היכולות שלהם בשפה.
יעדי הקורס
מטרת הקורס להקנות למשתתפים את היכולות הבאות:
-
הבנה טובה של עקרונות סטטיסטיים בלמידת מכונה.
-
היכרות עם הסוגים השונים של למידת מכונה ועם מושגים חשובים.
-
היכרות עם אלגוריתמים נפוצים, מתי מתאים להשתמש בהם וכיצד לממש אותם בשפת פייתון.
-
הכנת נתונים לתהליכי למידת מכונה (Preprocessing)
-
כיצד לבדוק יעילות של מודל, כיצד להשוות מול מודלים אחרים וכיצד לבצע אופטימיזציה כדי לשפר את המודל שיצרנו.
-
תרגול מעשי של תהליכי למידת מכונה end-to-end
דרישות קדם
במהלך הקורס נכסה מגוון רב של נושאים ומושגים מתחום הסטטיסטיקה על מנת להבין טוב יותר כיצד הדברים עובדים "מאחורי הקלעים", אך נושאים אלה ילמדו תוך כדי הכרות עם המודלים עצמם. מיקוד הקורס הוא בהבנת ההיגיון מאחורי המודלים ומימושם בפייתון, פחות במתמטיקה שמאחורי או בכתיבה אלגוריתמית מ-0. לכן ידע קודם במתמטיקה או סטטיסטיקה אינו נדרש.
לעומת זאת יש צורך בהיכרות בסיסית לפחות עם שפת פייתון מאחר והחלק המעשי כולו מתבצע בשפה. ידע קודם בספריות המיועדות לעבודה עם נתונים כגון NumPy או Pandas לא הכרחי אך מומלץ.
סילבוס
הכנת הנתונים
בקרת איכות
-
חשיבות תהליכי QA לתהליכי ML
-
הבנת סוגי משתנים
-
טיפול בערכים חסרים / ריקים ושגיאות
-
זיהוי וטיפול בערכי קיצון
-
בדיקות שכיחות, טווחים והבנת התפלגויות
ביצוע Univariate Profiling
-
משתנים קטגוריים מול משתנים מספריים (מדדים)
-
משתנים בדידים מול משתנים רציפים
-
יצירת היסטוגרמות
-
ממוצע, חציון, שכיח
-
אחוזונים, הטיות ושונות
ביצוע Multivariate Profiling
-
מתאמים (קורלציות)
-
הצגת יחסים בין משתנים מסוגים שונים
-
מפות חום
למידת מכונה מונחית (Supervised Learning)
מבוא ללמידת מכונה
-
מה זה למידת מכונה ומהם העקרונות בבסיסה
-
סוגים שונים של למידת מכונה
-
דוגמאות ללמידת מכונה בעולם האמיתי
סיווג (Classification)
-
מהו סיווג
-
פיצול נתונים והימנעות מהתאמת יתר
-
מודלים נפוצים לסיווג
-
KNN
-
Naïve Bayes
-
עצי החלטה (Decision Trees)
-
Random Forest
-
רגרסיה לוגיסטית
-
Sentiment Analysis
-
בחירת מודל מתאים והשוואה בין ביצועי מודלים
-
ביצוע אופטימיזציה ו-Parameter Tuning
-
הנדסת תכונות ( Feature Engineerin
רגרסיה (Regression)
-
מבוא לחיזוי באמצעות רגרסיה
-
מקרי שימוש נפוצים
-
סוגי רגרסיה שונים
-
רגרסיה לינארית פשוטה (Univariate Linear Regression)
-
רגרסיה לינארית מורכבת (Multiple Linear Regression)
-
רגרסיה בלתי לינארית
-
שימוש ברגרסיה לחיזוי על פני ציר זמן (Time Series)
-
זיהוי מגמות ועונתיות
-
למידת מכונה בלתי-מונחית (Unsupervised Learning)
מבוא ללמידת מכונה בלתי-מונחית
-
למידת מכונה מונחית VS בלתי-מונחית
-
מקרי שימוש נפוצים
-
טכניקות נפוצות
-
יצירת מקבצים וסגמנטציה
מבוא ליצירת מקבצים (Clustering)
-
K-Means
-
קיבוץ היררכי
-
איתור תצפיות חריגות
-
איתור תצפיות חריגות על סדרת זמן