מהם התנאים המוקדמים ללמידת מכונה?



בלוג זה בנושא דרישות קדם ללימוד מכונה יעזור לך להבין את המושגים הבסיסיים שאתה צריך לדעת לפני שתתחיל לעבוד עם למידת מכונה.

למידת מכונה היא ללא ספק הטכנולוגיה המבוקשת ביותר בעידן! אם אתה מתחיל שמתחיל בלמידת מכונה, חשוב שתכיר את התנאים המוקדמים ללימוד מכונה. בלוג זה יעזור לך להבין את המושגים השונים שעליך לדעת לפני שתתחיל עם Machine Learning.

כדי לקבל ידע מעמיק בנושא בינה מלאכותית ולמידת מכונה, אתה יכול להירשם לשידור חי מאת אדוריקה עם תמיכה 24/7 וגישה לכל החיים.





הנה רשימת נושאים מכוסה בבלוג זה:

  1. תנאים מוקדמים ללימוד מכונה
  2. הבנת למידת מכונה עם מקרה שימוש

תנאים מוקדמים ללימוד מכונה

כדי להתחיל איתולמידה מכונה עליכם להכיר את המושגים הבאים:



  1. סטָטִיסטִיקָה
  2. אלגברה ליניארית
  3. חֶשְׁבּוֹן
  4. הִסתַבְּרוּת
  5. שפות תכנות

סטָטִיסטִיקָה

הסטטיסטיקה מכילה כלים שניתן להשתמש בהם כדי להשיג תוצאה מסוימת מהנתונים. יש נתונים סטטיסטיים תיאוריים המשמשים להפיכת נתונים גולמיים למידע חשוב כלשהו. כמו כן, ניתן להשתמש בסטטיסטיקה מסקנת כדי לקבל מידע חשוב ממדגם נתונים במקום להשתמש במערך נתונים מלא.

ללמוד עוד על סטטיסטיקה אתה יכול לעבור על הבלוגים הבאים:

אלגברה ליניארית

עסקאות אלגברה לינאריתעם וקטורים, מטריצות ותמורות לינאריות. חשוב מאוד בלימוד מכונה מכיוון שהוא יכול לשמש לשינוי וביצוע פעולות במערך הנתונים.



חֶשְׁבּוֹן

חשבון הוא תחום חשוב במתמטיקה והוא ממלא תפקיד בלתי נפרד באלגוריתמים רבים של למידת מכונה. מערך הנתונים בעל מספר תכונות הואהמשמש לבניית מודלים של למידת מכונה כתכונות הן מספר רב-משתני של חשבון ממלא תפקיד חשוב לבניית מודל למידת מכונה. אינטגרציות והתמיינות הן חובה.

הִסתַבְּרוּת

ההסתברות עוזרת לחזות את הסבירות להתרחשויות, היא מסייעת לנו לנמק את הסיבה שהמצב עלול להתרחש או לא. עבור למידת מכונה, ההסתברות היא א קרן.

Mathematics

למידע נוסף על הסתברות, תוכל לעבור על כך בלוג.

מה זה hashset בג'אווה

שפת תכנות

חיוני להכיר שפות תכנות כמו R ו- Python על מנת ליישם את כל תהליך למידת המכונה. Python ו- R שניהם מספקים ספריות מובנות שמאפשרות מאוד ליישם אלגוריתמים של Machine Learning.

מלבד ידע בסיסי בתכנות, חשוב שתדע כיצד לחלץ, לעבד ולנתח נתונים. זו אחת הכישורים החשובים ביותר הדרושים לצורך למידת מכונה.

למידע נוסף על התכנות שפות ללימוד מכונה, תוכלו לעבור על הבלוגים הבאים:

  1. ספריות הפיתון הטובות ביותר למדע נתונים ולמידת מכונה

מקרה שימוש במכשירי למידה

למידה ממוחשבת היא כולה יצירת אלגוריתם שיכול ללמוד מנתונים כדי לחזות כמו איזה סוג של אובייקטים יש בתמונה, או מנוע המלצה, השילוב הטוב ביותר של תרופות לריפוי המחלה או סינון דואר זבל.

לימוד מכונה בנוי על דרישות קדם מתמטיות ואם אתה יודע מדוע משתמשים במתמטיקה בלמידת מכונה זה יהפוך אותו למהנה. עליכם לדעת את המתמטיקה שמאחורי הפונקציות בהן תשתמשו ואיזה מודל מתאים לנתונים ולמה.

אז בואו נתחיל בבעיה מעניינת של חיזוי מחירי הדירות, שיש בה מערך נתונים המכיל היסטוריה של מאפיינים ומחירים שונים, בינתיים נשקול את שטח חלל המגורים ברגל מרובע ואת המחירים.

כעת יש לנו מערך נתונים המכיל שתי עמודות כמוצג להלן:

חייב להיות קורלציה כלשהי בין שני המשתנים הללו כדי לגלות שנצטרך לבנות מודל שיוכל לחזות את מחיר הבתים, כיצד נוכל לעשות זאת?

Java Addactionlistener (זה)

בואו נתווה גרף לנתונים אלו ונראה כיצד הם נראים:

כאן ציר ה- X הוא המחיר למ'ר שטחי מגורים וציר ה- Y הוא מחיר הבית. אם נשרטט את כל נקודות הנתונים נקבל עלילת פיזור אשר ניתן לייצג על ידי קו כפי שמוצג באיור לעיל ואם נקליט כמה נתונים אז הוא ינבא תוצאה כלשהי. באופן אידיאלי, עלינו למצוא קו שיחתוך את נקודות הנתונים המרביות.

כאן אנו מנסים ליצור קו המכונה:

Y = mX + c

שיטה זו לחיזוי הקשר הליניארי בין המטרה (משתנה תלוי) למשתנה מנבא (משתנה עצמאי) מכונה רגרסיה לינארית. זה מאפשר לנו ללמוד ולסכם קשר בין שני משתנים.

  • X = משתנה עצמאי
  • Y = משתנה תלוי
  • c = יירוט y
  • m = שיפוע קו

אם ניקח בחשבון את המשוואה יש לנו ערכים עבור X שהוא משתנה עצמאי, ולכן כל שעלינו לעשות הוא לחשב ערכים עבור m ו- c על מנת לחזות את הערך של Y.

אז איך נמצא את המשתנים האלה?

על מנת למצוא משתנים אלה, אנו יכולים לנסות חבורה של ערכים ולנסות למצוא קו החוצה את המספר המרבי של נקודות נתונים. אבל, איך נוכל למצוא את קו ההתאמה הטובה ביותר?

אז כדי למצוא את השורה המתאימה ביותר, נוכל להשתמש בפונקציית השגיאה הכי קטנה בריבועים שתמצא את השגיאה בין הערך האמיתי של y לבין הערך החזוי y`.

system.exit (0)

ניתן לייצג את פונקציית השגיאה הקטנה בריבועים באמצעות המשוואה הבאה:

באמצעות פונקציה זו אנו יכולים לגלות את השגיאה עבור כל נקודת נתונים חזויה על ידי השוואתה לערך האמיתי של נקודת הנתונים. לאחר מכן אתה לוקח את סיכום כל השגיאות הללו ומרובע אותן כדי לגלות את הסטייה בחיזוי.

אם נוסיף לגרף שלנו את הציר השלישי שמכיל את כל ערכי השגיאה האפשריים ונתווה אותו במרחב תלת מימדי, הוא ייראה כך:

בתמונה לעיל, הערכים האידיאליים יהיו בחלק השחור התחתון שיחזה את המחירים הקרובים לנקודת הנתונים בפועל. השלב הבא הוא למצוא את הערכים הטובים ביותר האפשריים עבור m ו- c. ניתן לעשות זאת על ידי שימוש בטכניקת האופטימיזציה הנקראת ירידת שיפוע.

ירידה בהדרגה היא שיטה איטרטיבית, בה אנו מתחילים לאתחל קבוצה כלשהי של ערכים עבור המשתנים שלנו ומשפרים אותם לאט על ידי מזעור השגיאה בין הערך בפועל לערך החזוי.

כעת, אם אנו חושבים כי מחירי הדירה אינם תלויים באמת רק במחיר למ'ר, ישנם גורמים רבים כגון מספר חדרי השינה, חדרי הרחצה וכו '. אם ניקח בחשבון גם את התכונות הללו, המשוואה תראה משהו ככה

Y = b0 + b1x1 + b2x2 + & hellip .. + bnxn + c

זו רגרסיה רב-קווית זו שייכת לאלגברה לינארית, כאן נוכל להשתמש במטריצות בגודל mxn כאשר m הן תכונות ו- n הן נקודות נתונים.

בואו ניקח בחשבון סיטואציה אחרת שבה נוכל להשתמש בהסתברות כדי למצוא את מצבו של הבית על מנת לסווג בית על סמך אם הוא במצב טוב או במצב רע. לשם כך, כדי לעבוד נצטרך להשתמש בטכניקה הנקראת רגרסיה לוגיסטית הפועלת על ההסתברות להתרחשויות המיוצגות על ידי פונקציה סיגמואידית.

במאמר זה סקרנו את התנאים המוקדמים של למידת מכונה וכיצד הם מיושמים בלימוד מכונה. אז בעצם, הוא מורכב מסטטיסטיקה, חשבון, אלגברה לינארית ותורת ההסתברות. לחשבון יש טכניקות המשמשות לאופטימיזציה, לאלגברה לינארית יש אלגוריתמים שיכולים לעבוד על מערכי נתונים ענקיים, עם הסתברות שנוכל לחזות את הסבירות להתרחשויות וסטטיסטיקה עוזרת לנו להסיק תובנות שימושיות ממדגם ערכות הנתונים.

עכשיו שאתה יודע את התנאים המוקדמים ללמידת מכונה, אני בטוח שאתה סקרן ללמוד עוד. להלן מספר בלוגים שיעזרו לך להתחיל לעבוד עם מדע הנתונים:

אם ברצונך להירשם לקורס שלם בנושא בינה מלאכותית ולמידת מכונה, אדוריקה אוצרת במיוחד שיגרום לך להיות בקיאים בטכניקות כמו למידה מפוקחת, למידה ללא פיקוח ועיבוד שפה טבעית. הוא כולל הדרכה בנושא ההתקדמות האחרונה והגישות הטכניות בתחום הבינה המלאכותית ולמידת מכונה כגון למידה עמוקה, מודלים גרפיים ולמידת חיזוק.