מהי רשת עצבית? מבוא לרשתות עצביות מלאכותיות



בלוג זה בנושא רשתות עצביות יציג בפניכם את המושגים הבסיסיים של רשתות עצביות וכיצד הם יכולים לפתור בעיות מורכבות מונעות נתונים.

עם ההתקדמות בלימוד מכונה, עבר דרך גבוהה. למידה עמוקה נחשבת לטכנולוגיה המתקדמת ביותר שנבנתה כדי לפתור בעיות מורכבות המשתמשות בערכות נתונים מסיביות. בלוג זה בנושא רשתות עצביות יציג בפניכם את המושגים הבסיסיים של רשתות עצביות וכיצד הם יכולים לפתור בעיות מורכבות מונעות נתונים.

כדי לקבל ידע מעמיק בבינה מלאכותית ולמידה עמוקה, אתה יכול להירשם לשידור חי מאת אדוריקה עם תמיכה 24/7 וגישה לכל החיים.





הנה רשימה של נושאים שיוסקרו בנושא זה בלוג:

  1. מהי רשת עצבית?
  2. מהי למידה עמוקה?
  3. ההבדל בין AI, ML ו- DL
  4. צורך בלימוד עמוק
  5. מקרה שימוש למידה עמוקה
  6. כיצד פועלות רשתות עצביות?
  7. רשת עצבית מוסברת בדוגמה

הגדרה פשוטה של ​​רשת עצבית

מעוצב בהתאם למוח האנושי, א רשת עצבית נבנתה כדי לחקות את הפונקציונליות של מוח אנושי . המוח האנושי הוא רשת עצבית המורכבת ממספר נוירונים, באופן דומה, רשת עצבית מלאכותית (ANN) מורכבת ממספר תפיסונים (מוסבר בהמשך).



רשת עצבית - מהי רשת עצבית - אדוריקה

רשת עצבית מורכבת משלוש שכבות חשובות:

  • שכבת קלט: כפי שהשם מרמז, שכבה זו מקבלת את כל הקלטים שמספק המתכנת.
  • שכבה נסתרת: בין קלט לשכבת הפלט נמצאת קבוצה של שכבות המכונה שכבות מוסתרות. בשכבה זו מבצעים חישובים שמביאים לפלט.
  • שכבת פלט: התשומות עוברות סדרה של טרנספורמציות דרך השכבה הנסתרת אשר סוף סוף גורמת לפלט שמועבר באמצעות זה שִׁכבָה.

לפני שנכנס לעומק האופן שבו רשת עצבית מתפקדת, בואו להבין מהי למידה עמוקה.



מהי למידה עמוקה?

למידה עמוקה הוא תחום מתקדם של למידת מכונה המשתמשת במושגים של רשתות עצביות כדי לפתור מקרי שימוש מאוד חישוביים הכוללים ניתוח נתונים רב מימדיים. זה הופך את תהליך מיצוי התכונות לאוטומטי, ומוודא שיש צורך בהתערבות אנושית מינימלית מאוד.

הבדלים בין מעמד מופשט וממשק

אז מהי בעצם למידה עמוקה?

למידה עמוקה היא מתקדמת תת-שדה של Machine Learning המשתמש באלגוריתמים בהשראת המבנה והתפקוד של המוח הנקראים רשתות עצביות מלאכותיות.

ההבדל בין AI, ML ו- DL (בינה מלאכותית לעומת למידת מכונה לעומת למידה עמוקה)

לעתים קרובות אנשים נוטים לחשוב כך , , ו למידה עמוקה זהים מכיוון שיש להם יישומים נפוצים. לדוגמה, סירי הוא יישום של AI, Machine Learning ו- Deep Learning.

אז איך קשורות הטכנולוגיות הללו?

  • בינה מלאכותית הוא המדע להשגת מכונות לחיקוי התנהגותם של בני אדם.
  • למידת מכונה היא תת קבוצה של בינה מלאכותית (AI) המתמקדת בקבלת מכונות לקבל החלטות על ידי הזנת נתונים.
  • למידה עמוקה היא תת-קבוצה של Machine Learning המשתמשת במושג רשתות עצביות כדי לפתור בעיות מורכבות.

לסיכום AI, למידת מכונה ולמידה עמוקה הם תחומים מקושרים זה לזה. למידה ממוחשבת ולמידה עמוקה מסייעות לבינה מלאכותית על ידי אספקת קבוצה של אלגוריתמים ורשתות עצביות לפתרון בעיות מונעות נתונים.

עכשיו שאתה מכיר את היסודות, בואו נבין מה הוביל לצורך בלימוד עמוק.

צורך בלימוד עמוק: מגבלות של אלגוריתמים וטכניקות של למידת מכונה מסורתית

למידת מכונה הייתה פריצת דרך עיקרית בעולם הטכני, היא הובילה לאוטומציה של משימות מונוטוניות וגוזלות זמן, היא סייעה בפתרון בעיות מורכבות ובקבלת החלטות חכמות יותר. עם זאת, היו כמה חסרונות בלימוד מכונה שהובילו להופעת למידה עמוקה.

להלן מספר מגבלות של למידת מכונה:

  1. לא ניתן לעבד נתונים ממדיים גבוהים: למידת מכונה יכולה לעבד רק ממדים קטנים של נתונים המכילים קבוצה קטנה של משתנים. אם ברצונך לנתח נתונים המכילים 100 משתנים, לא ניתן להשתמש בלמידת מכונה.
  2. הנדסת תכונות ידנית: שקול מקרה שימוש בו יש לך 100 משתני ניבוי ועליך לצמצם רק את המשמעותיים. לשם כך עליכם ללמוד ידנית את הקשר בין כל אחד מהמשתנים ולהבין אילו חשובים בחיזוי הפלט. משימה זו היא מייגעת מאוד וגוזלת זמן עבור מפתח.
  3. לא אידיאלי לביצוע איתור אובייקטים ועיבוד תמונה: מכיוון שזיהוי אובייקטים דורש נתונים ממדיים גבוהים, לא ניתן להשתמש במכונת למידה מכונה לעיבוד ערכות נתוני תמונה, היא אידיאלית רק עבור ערכות נתונים עם מספר מוגבל של תכונות.

לפני שנכנס לעומק רשתות עצביות, בואו ניקח בחשבון מקרה שימוש אמיתי שבו מיושם למידה עמוקה.

מקרה שימוש / יישומים לשימוש למידה עמוקה

האם ידעת ש- PayPal מעבדת מעל 235 מיליארד דולר בתשלומים מארבעה מיליארד עסקאות של יותר מ -170 מיליון לקוחותיה? היא משתמשת בכמות נתונים עצומה זו כדי לזהות פעילויות הונאה אפשריות בין היתר.

בעזרת אלגוריתמים של Deep Learning, מכרה PayPal נתונים מהיסטוריית הרכישות של הלקוח שלהם בנוסף לבדיקת דפוסי הונאה ככל הנראה המאוחסנים במאגרי המידע שלה כדי לחזות אם עסקה מסוימת היא הונאה או לא.

החברה מסתמכת על טכנולוגיית Deep Learning & Machine Learning מזה כ -10 שנים. בתחילה צוות פיקוח ההונאה השתמש במודלים פשוטים, ליניאריים. אך עם השנים החברה עברה לטכנולוגיה מתקדמת יותר של Machine Learning בשם Deep Learning.

מנהל סיכוני הונאה ומדעני נתונים בפייפאל, Ke Wang, ציטט:

'מה שאנחנו נהנים מלימוד מכונה מודרני ומתקדם יותר הוא היכולת שלו לצרוך הרבה יותר נתונים, להתמודד עם שכבות ושכבות של הפשטה ולהיות מסוגלים 'לראות' דברים שטכנולוגיה פשוטה יותר לא תוכל לראות, אפילו בני אדם עשויים לא מסוגלים לראות. ”

מודל לינארי פשוט מסוגל לצרוך כ -20 משתנים. עם זאת, בטכנולוגיית Deep Learning ניתן להריץ אלפי נקודות נתונים. לכן, על ידי יישום טכנולוגיית Deep Learning, PayPal יכולה סוף סוף לנתח מיליוני עסקאות כדי לזהות כל הונאה פעילות.

עכשיו בואו ניכנס לעומק של רשת עצבית ונבין איך הם עובדים.

איך עובדת רשת עצבית?

כדי להבין רשתות עצביות, עלינו לפרק אותה ולהבין את היחידה הבסיסית ביותר של רשת עצבית, כלומר פרספטרון.

מהו פרספטרון?

Perceptron היא רשת עצבית שכבתית אחת המשמשת לסיווג נתונים לינאריים. יש בו 4 מרכיבים חשובים:

  1. תשומות
  2. משקולות והטיה
  3. פונקציית סיכום
  4. הפעלה או שינוי פונקציה

ההיגיון הבסיסי שמאחורי פרספרטרון הוא כדלקמן:

הקלטים (x) המתקבלים משכבת ​​הקלט מוכפלים במשקולות שלהם שהוקצו w. לאחר מכן מוסיפים את הערכים המוכפלים ליצירת הסכום המשוקלל. הסכום המשוקלל של הקלטים ומשקולותיהם בהתאמה מוחל על פונקציית הפעלה רלוונטית. פונקציית ההפעלה ממפה את הקלט לפלט המתאים.

משקולות והטיה בלמידה עמוקה

מדוע עלינו להקצות משקולות לכל קלט?

לאחר שמשתנה קלט מוזן לרשת, נקבע ערך שנבחר באופן אקראי כמשקל קלט זה. המשקל של כל נקודת נתוני קלט מציין עד כמה קלט זה חשוב בחיזוי התוצאה.

לעומת זאת, פרמטר ההטיה מאפשר לך להתאים את עקומת פונקציית ההפעלה באופן שתשיג תפוקה מדויקת.

פונקציית סיכום

לאחר שהוקצה לתשומות משקל כלשהו, ​​נלקח תוצר הקלט והמשקל המתאימים. הוספת כל המוצרים הללו נותנת לנו את הסכום המשוקלל. זה נעשה על ידי פונקציית הסיכום.

פונקציית הפעלה

המטרה העיקרית של פונקציות ההפעלה היא למפות את הסכום המשוקלל לפלט. פונקציות הפעלה כגון tanh, ReLU, sigmoid וכן הלאה הן דוגמאות לפונקציות טרנספורמציה.

כדי ללמוד עוד על הפונקציות של Perceptrons, תוכלו לעבור על כך בלוג.

לפני שאנחנו נסכם את הבלוג הזה, ניקח דוגמה פשוטה כדי להבין כיצד פועלת רשת עצבית.

רשתות עצביות מוסברות בדוגמה

שקול תרחיש שבו אתה אמור לבנות רשת עצבית מלאכותית (ANN) המסווגת תמונות לשתי מחלקות:

  • מחלקה א ': תמונות המכילות עלים שאינם חולים
  • מחלקה B: מכילים תמונות של עלים חולים

אז איך יוצרים רשת עצבית שמסווגת את העלים לגידולים חולים ולא חולים?

התהליך מתחיל תמיד בעיבוד והפיכת הקלט בצורה כזו שניתן לעבד אותו בקלות. במקרה שלנו, כל תמונת עלה תתפרק לפיקסלים בהתאם למימד התמונה.

לדוגמא, אם התמונה מורכבת מ- 30 על 30 פיקסלים, אז המספר הכולל של הפיקסלים יהיה 900. פיקסלים אלה מיוצגים כמטריצות, אשר מוזנות לאחר מכן לשכבת הקלט של רשת העצבים.

בדיוק כמו איך שיש במוח שלנו נוירונים שעוזרים לבנות ולחבר מחשבות, ל- ANN יש פרספרונים שמקבלים תשומות ומעבדים אותם על ידי העברתם משכבת ​​הקלט לשכבת הפלט ולבסוף.

כאשר הקלט מועבר משכבת ​​הקלט לשכבה הנסתרת, מוקצה משקל אקראי ראשוני לכל קלט. לאחר מכן מכפילים את התשומות במשקולות המתאימות שלהן וסכומן נשלח כקלט לשכבה הנסתרת הבאה.

כאן מוקצה לכל פרספטרון ערך מספרי הנקרא הטיה, המשויך למשקל של כל קלט. יתר על כן, כל פרספטרון מועבר באמצעות הפעלה או פונקציית טרנספורמציה הקובעת אם פרספטרון מסוים הופעל או לא.

משתמשים בפרספטרון מופעל להעברת נתונים לשכבה הבאה. באופן זה, הנתונים מועברים (התפשטות קדימה) דרך הרשת העצבית עד שהפרספרונים מגיעים לשכבת הפלט.

בשכבת הפלט נגזרת הסתברות המחליטה אם הנתונים שייכים למחלקה A או למחלקה B.

נשמע פשוט, לא? ובכן, הרעיון מאחורי רשתות עצביות מבוסס אך ורק על תפקוד המוח האנושי. אתה זקוק להכרה מעמיקה של מושגים ואלגוריתמים מתמטיים שונים. הנה רשימה של בלוגים כדי להתחיל:

  1. מהי למידה עמוקה? תחילת העבודה עם למידה עמוקה
  2. למידה עמוקה עם פיתון: מדריך למתחילים ללמידה עמוקה

אם מצאת את הבלוג הזה רלוונטי, עיין ב מאת אדוריקה, חברת למידה מקוונת מהימנה עם רשת של יותר מ -250,000 לומדים מרוצים הפזורים ברחבי העולם. קורס ההדרכה של למידה עמוקה של אדוריקה עם TensorFlow עוזר ללומדים להתמחות באימון ובאופטימיזציה של רשתות עצביות בסיסיות והתפתחות באמצעות פרויקטים ומשימות בזמן אמת יחד עם מושגים כגון פונקציית SoftMax, רשתות עצביות מקודדות אוטומטיות, מכונת בולצמן מוגבלת (RBM).