סטטיסטיקה ללימוד מכונה: מדריך למתחילים



מאמר זה בנושא סטטיסטיקה ללמידת מכונה הוא מדריך מקיף על המושגים השונים של סטטיסטיקה עם דוגמאות.

הבנת נתונים ויכולת ליצור מהם ערך היא מיומנות העשור. למידת מכונה היא מיומנות ליבה כזו שעוזרת לחברות להגשים אותה. עם זאת, כדי להתחיל, עליך לבנות את היסודות שלך נכון. לכן, במאמר זה אעסוק בכמה מושגים בסיסיים ואספק לך הנחיות להתחלת המסע שלך בלימוד מכונה. לכן, במאמר זה על סטטיסטיקה ללמידת מכונה, יידונו הנושאים הבאים:

  1. הִסתַבְּרוּת
  2. סטָטִיסטִיקָה
  3. אלגברה ליניארית

הסתברות וסטטיסטיקה למידת מכונה:





מהי הסתברות?

ההסתברות מכמתת את הסבירות להתרחשות אירוע. לדוגמה, אם אתה מגלגל מת, לא משוחד, ההסתברות לכך אחד הופעה היא 1/6 . עכשיו, אם אתה תוהה wהיי? ואז התשובה די פשוטה!

הסיבה לכך היא שיש שש אפשרויות וכולם צפויים באותה מידה (למות הוגן). לכן אנחנו יכולים להוסיף 1 + 1 + 1 + 1 + 1 + 1 = 6. אבל מכיוון שאנחנו מעוניינים ב אירוע שבו 1 מופיע . יש רק דרך אחת בה האירוע יכול להתרחש. לָכֵן,



ההסתברות של הופעה אחת = 1/6

דומה לזה של כל המספרים האחרים מכיוון שכל האירועים צפויים באותה מידה. פשוט, נכון?

ובכן, הגדרה של תכיפות של הסתברות לדוגמא זו תישמע כמו - ההסתברות של הופעה אחת היא היחס בין מספר הפעמים ש -1 הופיע למספר הפעמים הכולל שבו התגלגל למות אם התגלגל מספר אינסופי של פִּי.איך זה הגיוני?



בואו נעשה את זה יותר מעניין. שקול את שני המקרים - התגלגלת למות הוגנת 5 פעמים. במקרה אחד רצף המספרים המופיע הוא - [1,4,2,6,4,3]. במקרה השני, אנו מקבלים - [2,2,2,2,2,2]. איזה מהם סביר יותר?

שניהם צפויים באותה מידה. נראה מוזר נכון?

עכשיו שקול מקרה אחר שבו כל 5 הגלילים בכל מקרה הם עצמאי . כלומר, גליל אחד לא משפיע על השני. במקרה הראשון, כאשר 6 הופיעו, לא היה לו מושג ש -2 הופיעו לפניו. לפיכך, כל 5 הלחמניות צפויות באותה מידה.

באופן דומה ניתן להבין את ה- 2 הישרים במקרה השני כרצף של אירועים עצמאיים. וכל האירועים הללו צפויים באותה מידה. בסך הכל, מכיוון שיש לנו את אותן הקוביות, ההסתברות שמספר מסוים יופיע במקרה אחד זהה למקרה השני. לאחר מכן, במאמר זה על סטטיסטיקה למידת מכונה, הבה נבין את המונח עצמאות.

עצמאות

שני אירועים אומרים ש- A ו- B הם עצמאיים אם התרחשות A אינה משפיעה על האירוע B . לדוגמא, אם אתה זורק מטבע ומגלגל מת, לתוצאת המוות אין כל השפעה אם המטבע מראה ראשים או זנבות. גם בשביל שני אירועים עצמאיים A ו- B , ה ההסתברות ש- A ו- B יכולים להתרחש יחד . כך למשל, אם אתה רוצה שההסתברות שמטבע מראה ראשים ומתים מראה 3.

P (A ו- B) = P (A) * P (B)

לכן P = & frac12 (הסתברות ראשים יופיעו) * ⅙ (הסתברות של 3 יופיעו) = 1/12

בדוגמה הקודמת, בשני המקרים, P = ⅙ * ⅙ * ⅙ * ⅙ * ⅙ * ⅙.

עכשיו בואו נדבר על אירועים שאינם עצמאיים. שקול את הטבלה הבאה:

שָׁמֵן מְאֹד לא שמנים
בעיות לבארבע חמשחֲמֵשׁ עֶשׂרֵה
אין בעיות לב1030

נערך סקר של 100 איש. ל- 60 היו בעיות לב ול- 40 לא. מתוך 60 הסובלים מבעיית לב, 45 סבלו מהשמנת יתר. מתוך 40 ללא בעיות לב, 10 היו שמנים. אם מישהו שואל אותך -

  1. מה הסבירות לבעיית לב?
  2. מה הסבירות לבעיית לב ולא להשמנת יתר?

התשובה לשאלות הראשונות קלה - 60/100. עבור השני, זה יהיה 15/100. עכשיו שקול את השאלה השלישית - אדם נבחר באופן אקראי. נמצא שהוא סובל ממחלת לב. מה הסבירות שהוא סובל מהשמנת יתר?

דפוס עיצוב mvc בג'אווה

עכשיו חשוב על המידע שנמסר לך - ידוע שיש לו מחלת לב. לכן הוא לא יכול להיות מבין 40 שאינם סובלים ממחלת לב. יש רק 60 אפשרויות אפשריות (השורה העליונה בטבלה). כעת, בין האפשרויות המצומצמות הללו, ההסתברות שהוא סובל מהשמנת יתר היא 45/60. כעת, לאחר שידעתם, מהם אירועים עצמאיים, הבא במאמר זה בנושא סטטיסטיקה ללימוד מכונה, הבה נבין את ההסתברויות המותנות.

הסתברויות מותנות

כדי להבין את ההסתברויות המותנות, בואו נמשיך בדיון שלנו עם הדוגמה לעיל. מעמד של השמנת יתר ומעמד של סבל מבעיית לב אינו עצמאי. אם השמנת יתר לא השפיעה על בעיות לב, הרי שמספר המקרים הסובלים מהשמנת יתר ולא של אנשים הסובלים מבעיות לב היה זהה.

כמו כן, קיבלנו כי לאדם יש בעיות לב ונאלצנו לגלות את ההסתברות שהוא סובל מהשמנת יתר. לכן, נאמר כי ההסתברות, במקרה זה, מותנית בכך שיש לו בעיית לב. אם ההסתברות לקרות אירוע A מותנית באירוע B, אנו מייצגים אותו כ-

P (A | B)

כעת, יש משפט שעוזר לנו לחשב את ההסתברות המותנית הזו. זה נקרא שלטון בייס .

P (A | B) = P (A ו- B) / P (B)

אתה יכול לבדוק משפט זה על ידי חיבור הדוגמה שרק דנו בה. אם הבנתם עד כה, תוכלו להתחיל עם הדברים הבאים - נאיביות . היא משתמשת בהסתברויות מותנות כדי לסווג אם דוא'ל הוא ספאם או לא. זה יכול לבצע משימות סיווג רבות אחרות. אך למעשה, ההסתברות המותנית היא לבו של .

סטָטִיסטִיקָה:

הסטטיסטיקה היא משמש לסיכום והסקת מסקנות לגבי מספר רב של נקודות נתונים. במדעי נתונים ולמידת מכונה, לעתים קרובות תתקלו במינוח הבא

  • אמצעי ריכוז
  • הפצות (במיוחד רגילות)

מדדי ריכוז ומדדי התפשטות

מתכוון:

ממוצע הוא רק ממוצע מספרים . כדי לברר פירוש, עליך לסכם את המספרים ולחלק אותו למספר המספרים. לדוגמא, הממוצע של [1,2,3,4,5] הוא 15/5 = 3.

mean-statistics-for-machine-learning

חֲצִיוֹן:

חציון הוא ה אלמנט אמצעי של קבוצת מספרים כאשר הם מסודרים בסדר עולה. לדוגמא, מספרים [1,2,4,3,5] מסודרים בסדר עולה [1,2,3,4,5]. האמצעי מבין אלה הוא 3. לכן החציון הוא 3. אבל מה אם מספר המספרים יהיה שווה ולכן אין לו מספר אמצעי? במקרה כזה אתה לוקח את הממוצע של שני המספרים האמצעיים ביותר. עבור רצף של מספרים 2n בסדר עולה, ממוצע nth ו- (n + 1)המספר כדי לקבל את החציון. דוגמא - ל- [1,2,3,4,5,6] יש חציון (3 + 4) / 2 = 3.5

מצב:

מצב הוא פשוט ה המספר הנפוץ ביותר בקבוצת מספרים . לדוגמה, מצב של [1,2,3,3,4,5,5,5] הוא 5.

שׁוֹנוּת:

שונות אינה מדד מרכזיות. זה בטוח איך הנתונים שלך מתפשטים סביב הממוצע . זה לכמת כ

איקסהוא הממוצע של מספרים N. אתה לוקח נקודה, מפחית את הממוצע, לוקח את הריבוע של ההבדל הזה. עשה זאת לכל המספרים N וממוצע אותם. השורש הריבועי של השונות נקרא סטיית התקן. לאחר מכן, במאמר זה על סטטיסטיקה למידת מכונה, הבה נבין את ההפצה הרגילה.

הפצה רגילה

הפצה עוזרת לנו להבין כיצד הנתונים שלנו מופצים . לדוגמא, במדגם של גילאים, ייתכן שיש לנו צעירים יותר ממבוגרים מבוגרים ומכאן ערכים קטנים יותר של גיל יותר מערכים גדולים יותר. אך כיצד נגדיר התפלגות? שקול את הדוגמה שלהלן

ציר ה- y מייצג את הצפיפות. אופן ההתפלגות הזה הוא 30 מכיוון שהוא השיא ומכאן השכיח ביותר. אנו יכולים לאתר את החציון. חציון נמצא בנקודה על ציר ה- x שבו מכוסה מחצית השטח מתחת לעיקול. השטח תחת כל התפלגות נורמלית הוא 1 מכיוון שסיכום ההסתברויות לכל האירועים הוא 1. לדוגמא,

החציון במקרה הנ'ל הוא בסביבות 4. המשמעות היא ששטח מתחת לעיקול לפני 4 זהה לזה שאחרי 4. שקול דוגמה אחרת

כיצד ליצור jframe

אנו רואים שלוש התפלגויות רגילות. לכחולים ולאדומים אותו ממוצע. לאדום יש שונות גדולה יותר. לפיכך, הוא פרוש יותר מהכחול. אך מכיוון שהשטח צריך להיות 1, שיא העקומה האדומה קצר מהעקומה הכחולה, כדי לשמור על האזור קבוע.

מקווה שהבנת את הסטטיסטיקה הבסיסית וההפצות הרגילות. כעת, הבא במאמר זה על סטטיסטיקה למידת מכונה, הבה נלמד על אלגברה לינארית.

אלגברה ליניארית

AI מודרני לא יהיה אפשרי ללא אלגברה לינארית. זה מהווה את הליבה של למידה עמוקה והיה בשימוש אפילו באלגוריתמים פשוטים כמו . ללא כל עיכוב נוסף, בוא נתחיל.

אתה חייב להכיר וקטורים. הם סוג של ייצוגים גיאומטריים בחלל. לדוגמא, לווקטור [3,4] יש 3 יחידות לאורך ציר ה- x ו -4 יחידות לאורך ציר ה- y. שקול את התמונה הבאה -

בווקטור d1 יש 0.707 יחידות לאורך ציר ה- x ו- 0.707 יחידות לאורך ציר ה- y. לווקטור יש מימד אחד. בהכרח יש לזה גודל וכיוון. לדוגמה,

לתמונה שלעיל יש וקטור (4,3). גודלו 5 והוא עושה 36.9 מעלות עם ציר ה- x.

עכשיו, מהי מטריצה? מטריקס הוא מערך רב מימדי של מספרים. למה זה שימש? נראה קדימה. אבל ראשית, בואו נסתכל על אופן השימוש בו.

מַטרִיצָה

למטריצה ​​יכולות להיות ממדים רבים. בואו ניקח בחשבון מטריצה ​​דו ממדית. יש בו שורות (מ ') ועמודות (n). לכן יש בו אלמנטים m * n.

לדוגמה,

מטריצה ​​זו כוללת 5 שורות ו -5 עמודות. בואו נקרא לזה A. לכן A (2,3) הוא הערך בשורה השנייה ובעמודה השלישית שהוא 8.

כעת, כשתדעו מהי מטריצה, נוכל לבדוק את הפעולות השונות של המטריצה.

פעולות מטריקס

תוספת מטריצות

שתי מטריצות של אותו ניתן להוסיף מידות. התוספת מתרחשת מבחינה אלמנטית.

כפל סקלרים

ניתן להכפיל מטריצה ​​בכמות סקלרית. מכפל כזה מוביל לכך שכל ערך במטריקס יוכפל בסקלר. סקלר הוא רק מספר

ההבדל העיקרי בין האקר להאקר אתי הוא:

מטריקס טרנספוז

טרנספוזיה של מטריקס היא פשוטה. עבור מטריצה ​​A (m, n), תן A 'להיות השינוי שלה. לאחר מכן

A '(i, j) = A (j, i)

לדוגמה,

כפל מטריקס

זה כנראה קצת מסובך מפעולות אחרות. לפני שנצלול לתוכו, נגדיר מוצר נקודתי בין שני וקטורים.

שקול וקטור X = [1,4,6,0] וקטור Y = [2,3,4,5]. ואז נקודת המוצר בין X ל- Y מוגדרת כ-

X.Y = 1 * 2 + 4 * 3 + 6 * 4 + 0 * 5 = 38

אז זהו כפל ותוספת מבחינה אלמנטית. עַכשָׁיו,בואו ניקח בחשבון שתי מטריצות A (m, n) ו- B (n, k), כאשר m, n, k הם ממדים ומכאן מספרים שלמים. אנו מגדירים את כפל המטריצות כ-

בדוגמה שלעיל, האלמנט הראשון של המוצר (44) מתקבל על ידי המוצר הנקודתי של השורה הראשונה של המטריצה ​​השמאלית עם העמודה הראשונה של המטריצה ​​הימנית. באופן דומה, 72 מתקבל על ידי המוצר הנקודתי של השורה הראשונה של המטריצה ​​השמאלית עם העמודה השנייה של המטריצה ​​הימנית.

שים לב כי עבור המטריצה ​​השמאלית, מספר העמודות צריך להיות שווה למספר השורות בעמודה הימנית. במקרה שלנו, המוצר AB קיים אך לא BA מכיוון ש- m אינו שווה ל- k. עבור שתי מטריצות A (m, n) ו- B (n, k), מוגדר המוצר AB ומימד המוצר הוא (m, k) (הממדים החיצוניים ביותר של (m, n), (n, k )). אך BA אינו מוגדר אלא אם כן m = k.

בכך, נגמר לסוף מאמר זה בנושא סטטיסטיקה למידת מכונה. אני מקווה שהבנתם חלק מז'רגון Machine Learning. זה אמנם לא נגמר כאן. כדי לוודא שאתה מוכן לתעשייה, תוכל לבדוק את הקורסים של אדוריקה בנושא מדע נתונים ו- AI. ניתן למצוא אותם