מטושטש K- אמצעי אשכולות במאהוט



בלוג זה נותן מבוא לאשכולות מטושטשים של K-Means ב- Apache Mahout.

K-Means מטושטש הוא בדיוק אותו אלגוריתם כמו K-means, שזו טכניקת אשכולות פשוטה ופופולרית. ההבדל היחיד הוא שבמקום להקצות נקודה אך ורק לאשכול אחד בלבד, היא יכולה להיות מטושטשת כלשהי או חופפת בין שני אשכולות או יותר. להלן נקודות המפתח המתארות את אמצעי ה- F Fuzzy K:





  • בניגוד ל- K-Means, המחפש אשכול קשה, שבו כל אחת מהנקודות שייכת לאשכול אחד, K-Means Fuzzy מחפש את האשכולות הרכים יותר לחפיפה.
  • נקודה אחת באשכול רך יכולה להשתייך ליותר מאשכול אחד בעל ערך זיקה מסוים כלפי כל אחת מהנקודות.
  • הזיקה פרופורציונאלית למרחק של אותה נקודה מהאשכול המרכזי.
  • בדומה ל- K-Means, K-Means Fuzzy עובד על האובייקטים שמוגדר מרחק המרחק וניתן לייצג אותם n- מרחב וקטורי ממדי.

מטושטש K- אמצעי MapReduce זרימה

אין הרבה הבדל בין זרימת MapReduce של K-Means לבין K-Means Fuzzy. היישום של שניהם במאהוט דומה.

להלן פרמטרים חיוניים ליישום K-Means Fuzzy:



אלגוריתמי למידת מכונה ב- r
  • אתה זקוק לערכת נתונים וקטורית לצורך קלט.
  • חייב להיות ה- RandomSeedGenerator כדי לזרוע את אשכולות k הראשוניים.
  • למדידת מרחק נדרש מדידה SquaredEuclideanDistanceMeasure.
  • ערך גדול של סף ההתכנסות, כגון –cd 1.0, אם נעשה שימוש בערך בריבוע של מדד המרחק
  • ערך עבור maxIterations ערך ברירת המחדל הוא -x 10.
  • מקדם הנורמליזציה או גורם המטושטש, עם ערך גדול מ- 1.0 מ '

יש לך שאלה עבורנו? הזכר אותם בסעיף ההערות ונחזור אליך.

פוסטים קשורים



למידה מפוקחת באפאצ'י מהוט