טכניקות דוגמנות בניתוח עסקי עם R



הבלוג נותן הקדמה קצרה של טכניקות דוגמנות בניתוח עסקי עם ר.

טכניקות דוגמנות שונות:

אנו יכולים לחלק כל בעיה לתהליכים קטנים יותר:





מִיוּן - הוא המקום בו אנו מסווגים את הנתונים. לְמָשָׁל. מחלות כל המחלות מציגות התנהגות מסוימת, ואנחנו יכולים לסווג אותן עוד יותר.

לדוגמא: מחלות המפחיתות חסינות, מחלות שמעוררות כאב ראש וכו '.



נְסִיגָה - כרוך בבירור הקשר בין מספר משתנים.

לדוגמא: איך המשקל של בן אדם קשור לגובה שלו.

אנומוליאיתור - הוא בעצם תנודה.



לדוגמא: במקרה של מתח גבוה או מתח נמוך.

דוגמה נוספת יכולה לכלול התנהגות מוסדרת הכוללת נהיגה בצד ימין או בצד שמאל על פי מדינה. האנומולי כאן הוא מישהו שנוסע מההפך.

ההבדל בין משתנה ללא שינוי

דוגמה נוספת יכולה להיות חדירת רשת. הנה, משתמש מאומת נכנס לאתר החברה שלך, ואז אם מישהו לא מאומת נכנס, זהAn0moly.

חשיבות תכונה - זה בעצם נותן תכונות מרובות, כגון גובה, משקל, טמפרטורה, פעימות לב. נקודה שיש לציין היא שכל התכונות הללו חשובות למשימה.

לדוגמא: מישהו מנסה לחזות, באיזו שעה אדם יגיע לתפקיד. לכל תכונה תפקיד חשוב אך לא כל התכונות חשובות.

כללי האגודה - במונחים פשוטים יותר, זה לנתח או לחזות את ההתנהגות הבאה, שם היא סובבת סביב מנוע ההמלצות.

לדוגמא: אדם שקונה לחם יכול גם לקנות חלב. אם אנו מנתחים את התנהגויות הקניות בעבר, לכל הפריטים בסל יש קשר. במקרה זה, יכולה להיות סבירות שגם מי שקונה לחם יקנה חלב.

אשכולות - זו אחת הטכניקות הוותיקות ביותר בסטטיסטיקה. למעשה, תמיד ניתן לדגמן כל בעיה, בין אם מדובר בסיווג או באשכולות, שמשמעותם קיבוץ ישויות דומות.

לדוגמה:

1) קח סלסלת תפוחים ותפוזים, בה נוכל להבדיל תפוחים מתפוזים.

2) מקרה שימוש חשוב לאשכולות הוא שירותי בריאות. כמעט כל הנתונים הסטטיסטיים והניתוחים החלו במקרי שימוש בבריאות. כדי להעמיק, יש מונח מקבץ הנקרא קבוצות (אנשים עם מחלות דומות), כך שניתן יהיה ללמוד אותם בנפרד מהלקוחות הקיימים. לדוגמא, אם 10 אנשים סובלים מחום ועוד 10 אנשים מכאבי ראש, אנו נמצא את המשותף ביניהם ונפיק תרופות.

חילוץ תכונה - בדיוק דיוק מיצוי תכונות, תוקף וכישלון די רלוונטי. במילים אחרות, ניתן לכנות חילוץ תכונות כהכרה בתבנית.

לדוגמה:

בחיפוש בגוגל, כאשר משתמש מזין מונח, הוא מגיע לתוצאות. כעת, שאלה חשובה שיש לשאול היא כיצד היא ידעה, איזה דף רלוונטי ולא רלוונטי למונח? ניתן לענות על זה באמצעות חילוץ תכונות וזיהוי תבניות, שם הוא מוסיף תכונות בולטות. בואו נגיד שניתן תמונה, מצלמות מסוימות מזהות פנים, מדגישות פנים כדי לתת תמונות יפות, שמשתמשות גם בזיהוי תכונות.

כיצד להמיר כפול ל- int Java

למידה מפוקחת לעומת למידה ללא פיקוח

ל) קטגוריית חיזוי - הטכניקות כוללות רגרסיה, רשתות לוגיסטיות, עצביות ועצי החלטה. כמה דוגמאות כוללות גילוי הונאות (כאשר המחשב לומד ומנבא את ההונאה הבאה מההיסטוריה הקודמת של הונאה). בלימוד ללא פיקוח, אי אפשר לנבא עם דוגמאות מכיוון שאין נתונים היסטוריים.

ב) קטגוריית סיווג אם ניקח דוגמא, בין אם העסקה הונאה ובין אם לא, היא נכנסת לקטגורית הסיווג. כאן, אנו לוקחים נתונים היסטוריים ומסווגים אותם בעצי החלטה או במקרה שאיננו לוקחים נתונים היסטוריים כלל, אז אנו מתחילים ישירות על נתונים ומנסים לנצל תכונות בעצמנו. לדוגמא, אם עלינו להכיר את העובדים, אשר עשויים לעזוב את הארגון או להישאר. במקרה שמדובר בארגון חדש, בו איננו יכולים להשתמש בנתונים היסטוריים, אנו תמיד יכולים להשתמש באשכולות לצורך חילוץ נתונים.

ג) קטגוריית חיפושים - זו שיטה ישר קדימה, לבוא, מה המשמעות של ביג דאטה. בלמידה ללא פיקוח, זה נקרא רכיבים עקרוניים ואשכולות.

ד) קטגוריית זיקה - כאן מעורבים מספר אלמנטים כגון מכירה / מכירה מוצלבת, ניתוח סל שוק. בניתוח הסל אין למידה מפוקחת מכיוון שאין נתונים היסטוריים. אז אנחנו לוקחים נתונים ישירות ומוצאים אסוציאציות, רצף וניתוח גורמים.

יש לך שאלה עבורנו? הזכר אותם בסעיף ההערות ונחזור אליך.

פוסטים קשורים: