מהי הטיה-שונות בלימוד מכונה?



מאמר זה עוסק במושג הטיה ושונות בלימוד מכונה עם קשר ביניהם הקובע את דיוק הניבוי של המודל.

ב , ביצועי המודל מבוססים על התחזיות שלו ועל מידת ההכללה שלו כלפי נתונים בלתי נראים ועצמאיים. אחת הדרכים למדוד את הדיוק של המודל היא על ידי ניהול חשבון על ההטיה והשונות במודל. במאמר זה נלמד כיצד הטיה-שונות ממלאת תפקיד חשוב בקביעת האותנטיות של המודל. הנושאים הבאים נדונים במאמר זה:

שגיאה בלתי ניתנת להפחתה

כל דגם ב מוערך על סמך שגיאת החיזוי על מערך נתונים עצמאי ובלתי נראה. שגיאה אינה אלא ההבדל בין הפלט בפועל לפלט החזוי. כדי לחשב את השגיאה אנו מבצעים סיכום של שגיאה הניתנת להפחתה ובלתי ניתנת להפחתה, א.ק.א.





שגיאה בלתי הפיכה אינה אלא שגיאות שלא ניתן לצמצם ללא קשר שאתה משתמש במודל. זה נגרם על ידי משתנים חריגים בעלי השפעה ישירה על משתנה הפלט. אז כדי להפוך את המודל שלך ליעיל, נותרנו עם השגיאה הניתנת להפחתה שעלינו לייעל בכל מחיר.

שגיאה הניתנת לצמצום כוללת שני מרכיבים - הטיה ושונות , נוכחות של הטיה ושונות משפיעות על דיוק המודל בכמה דרכים כמו התאמת יתר, תת-התאמה , וכו.בואו נסתכל על הטיה ושונות כדי להבין כיצד להתמודד עם השגיאה הניתנת להפחתה ב- .



מהי הטיה בלימוד מכונה?

הטיה היא בעצם עד כמה ניבאנו את הערך מהערך בפועל. אנו אומרים כי ההטיה גבוהה מדי אם התחזיות הממוצעות רחוקות מהערכים בפועל.

הטיה גבוהה תגרום לאלגוריתם להחמיץ דפוס או קשר דומיננטי בין משתני הקלט והפלט. כאשר ההטיה גבוהה מדי, ההנחה היא שהמודל פשוט למדי ואינו מבין את מורכבות מערך הנתונים כדי לקבוע את הקשר וכך,גורם לבגד.

שונות במודל למידת מכונה?

על מערך נתונים עצמאי ובלתי נראה או מערך אימות. כאשר מודל אינו מתפקד באותה מידה שהוא מבצע עם מערך הנתונים המאומן, קיימת אפשרות שיש למודל שונות. זה בעצם מספר עד כמה מפוזרים הערכים החזויים מהערכים בפועל.



שונות גבוהה במערך הנתונים פירושה שהמודל התאמן עם הרבה רעש ונתונים לא רלוונטיים. כך גורם להתאמת יתר במודל. כאשר למודל שונות גבוהה, הוא הופך לגמיש מאוד ועושה חיזויים שגויים לנקודות נתונים חדשות. מכיוון שהוא כיוון את עצמו לנקודות הנתונים של מערך האימונים.

בואו ננסה גם להבין את המושג הטיה-שונות באופן מתמטי. תן למשתנה שאנחנו צופים להיות Y ולמשתנים הבלתי תלויים האחרים להיות X. עכשיו נניח שיש קשר בין שני המשתנים כך:

Y = f (X) + e

במשוואה לעיל, הנה הוא הוא השגיאה המשוערת עם הערך הממוצע 0. כאשר אנו מייצרים מסווג באמצעות אלגוריתמים כמו רגרסיה לינארית , וכו ', שגיאת הריבוע הצפויה בנקודה x תהיה:

שגיאה (x) = הטיה2+ שונות + שגיאה בלתי ניתנת להפחתה

הבה נבין גם כיצד ההטיה-השונות תשפיע על א למידת מכונה ביצועי המודל.

למזג עץ החלטות מיון 4 אלמנטים

איך זה משפיע על מודל למידת המכונה?

אנו יכולים לשים את הקשר בין הטיה-שונות בארבע קטגוריות המפורטות להלן:

  1. שונות גבוהה - הטיה גבוהה - המודל אינו עקבי וגם אינו מדויק בממוצע
  2. הטיה בשונות נמוכה - הדגמים עקביים אך נמוכים בממוצע
  3. שונות גבוהה-הטיה נמוכה - מדויק מעט אך לא עקבי בממוצע
  4. שונות נמוכה-הטיה נמוכה - זהו התרחיש האידיאלי, המודל עקבי ומדויק בממוצע.

הטיה-שונות בלימוד מכונה-אדוריקה

למרות שזיהוי הטיה ושונות במודל הוא די ברור. במודל עם שונות גבוהה תהיה שגיאת אימון נמוכה ושגיאת אימות גבוהה. ובמקרה של הטיה גבוהה, במודל תהיה שגיאת אימון גבוהה ושגיאת אימות זהה לשגיאת אימון.

אמנם הגילוי נראה קל, אך המשימה האמיתית היא לצמצם אותו למינימום. במקרה כזה נוכל לבצע את הפעולות הבאות:

  • הוסף עוד תכונות קלט
  • מורכבות רבה יותר על ידי הצגת תכונות פולינומיות
  • הקטן את תקופת ההסדרה
  • קבלת נתוני אימון נוספים

כעת, כשאנו יודעים מהי הטיה ושונות וכיצד היא משפיעה על המודל שלנו, בואו נסתכל על פשרה בין שונות-הטיה.

פיתרון הטיה-שונות

מציאת האיזון הנכון בין ההטיה והשונות של המודל נקראת פשרה של הטיה-שונות. זו בעצם דרך לוודא שהדגם אינו מצויד יתר על המידה ובכל מקרה.

אם המודל פשוט מדי ובעל מעט מאוד פרמטרים, הוא יסבול מהטיה גבוהה ושונות נמוכה. מצד שני, אם למודל יש מספר רב של פרמטרים, יהיה לו שונות גבוהה והטיה נמוכה. פשרה זו אמורה לגרום ליחס מאוזן לחלוטין בין השניים. באופן אידיאלי, הטיה נמוכה ושונות נמוכה הן היעד לכל מודל למידת מכונה.

שגיאה כוללת

בכל מודל למידת מכונה, איזון טוב בין ההטיה והשונות משמש כתרחיש מושלם מבחינת דיוק ניבוי והימנעות מהתאמה יתרה, חוסר התאמה מוחלטת. איזון אופטימלי בין ההטיה והשונות, מבחינת מורכבות האלגוריתם, יבטיח שהמודל לעולם לא יתאים יותר מדי או תתאים כלל.

השגיאה הממוצעת בריבוע במודל סטטיסטי נחשבת כסכום ההטיה בריבוע ושונות ושונות הטעות. ניתן להכניס את כל זה לשגיאה כוללת שבה יש לנו הטיה, שונות ושגיאות בלתי ניתנות להפחתה במודל.

בואו נבין כיצד אנו יכולים להפחית את הטעות הכוללת בעזרת יישום מעשי.

יצרנו א מסווג רגרסיה ליניארית בתוך ה רגרסיה לינארית בלימוד מכונה מאמר על אדוריקה באמצעות מערך נתוני הסוכרת במודול מערכי הנתונים של ללמוד סקיקיט סִפְרִיָה.

כאשר הערכנו את השגיאה הממוצעת בריבוע של המסווג, קיבלנו שגיאה כוללת בסביבות 2500.

כדי להפחית את השגיאה הכוללת, הזנו יותר נתונים למסווג ובתמורה השגיאה הממוצעת בריבוע צומצמה ל -2000.

זהו יישום פשוט של צמצום הטעות הכוללת על ידי הזנת נתונים יותר אימונים למודל. באופן דומה אנו יכולים ליישם טכניקות אחרות להפחתת השגיאה ולשמירה על איזון בין הטיה ושונות במודל למידת מכונה יעילה.

זה מביא אותנו לסוף מאמר זה בו למדנו הטיה-שונות במאךלמידה ine עם יישומה ומקרה השימוש. אני מקווה שברור לך עם כל מה ששותף איתך במדריך זה.

אם מצאת מאמר זה בנושא 'הטיה-שונות בלימוד מכונה' רלוונטי, עיין בכתובת חברת למידה מקוונת אמינה עם רשת של יותר מ -250,000 לומדים מרוצים הפרוסים ברחבי העולם.

אנחנו כאן כדי לעזור לך בכל שלב בדרכך ולהביא תוכנית לימודים המיועדת לסטודנטים ואנשי מקצוע שרוצים להיות . הקורס נועד לתת לך יתרון בתכנות פייתון ולהכשיר אותך למושגי ליבה מרכזיים ומתקדמים יחד עם מגוון כמו , , וכו.

אם אתה נתקל בשאלות כלשהן, אל תהסס לשאול את כל השאלות שלך בקטע ההערות של 'הטיה-שונות בלימוד מכונה' והצוות שלנו ישמח לענות.