R הוא אחד מכלי הניתוח הפופולריים ביותר. אך מלבד השימוש בו לניתוח, R היא גם שפת תכנות.עם צמיחתה בענף ה- IT, יש ביקוש משגשג למיומנים או עם הבנה של R כשניהם, כלי ניתוח נתונים ושפת תכנות.בבלוג זה, אעזור לך להבין את היסודות השונים של תכנות R. בשלנו עמ ' מתחנף בלוג ,דנו מדוע אנו זקוקים לניתוח, מהי ניתוח עסקי, מדוע ומי משתמש ב- R.
בבלוג זה נבין את מושגי הליבה הבאים של תכנות R ברצף הבא:
תוכל לעבור על הקלטת ה- webinar של שפת התכנות R, שם המדריך שלנו הסביר את הנושאים בצורה מפורטת עם דוגמאות שיעזרו לך להבין טוב יותר את תכנות ה- R.
תכנות R למתחילים | R הדרכת שפת תכנות | אדוריקה
אז בואו נתקדם ונראה את הרעיון הראשון של תכנות R - משתנים.
תכנות R: משתנים
משתנים אינם אלא שם למיקום זיכרון המכיל ערך. משתנה ב- R יכול לאחסן ערכים מספריים, ערכים מורכבים, מילים, מטריצות ואפילו טבלה. מפתיע, נכון?
תאנה: יצירהשל משתנים
התמונה לעיל מראה לנו כיצד משתנים נוצרים וכיצד הם מאוחסנים בבלוקי זיכרון שונים. ב- R, אנחנו לא צריכים להכריז על משתנה לפני שאנחנו משתמשים בו, בניגוד לשפות תכנות אחרות כמו Java, C, C ++ וכו '.
הבה נתקדם וננסה להבין מהו סוג הנתונים ואת סוגי הנתונים השונים הנתמכים ב- R.
תכנות R: סוגי נתונים
ב- R, משתנה עצמו אינו מוכרז מכל סוג נתונים, אלא הוא מקבל את סוג הנתונים של האובייקט R שהוקצה לו. אז R נקראת שפה שהוקלדה באופן דינמי, מה שאומר שאנחנו יכולים לשנות סוג נתונים של אותו משתנה שוב ושוב כאשר משתמשים בו בתוכנית.
סוגי נתונים מציין איזה סוג ערך יש למשתנה ואיזה סוג של פעולות מתמטיות, יחסיות או לוגיות ניתן להחיל עליו מבלי לגרום לשגיאה. ישנם סוגי נתונים רבים ב- R, אולם להלן אלו הנפוצים ביותר:
בואו נדון כעת בכל אחד מסוגי הנתונים הללו בנפרד, החל מווקטורים.
וקטורים
וקטורים הם אובייקטי הנתונים R הבסיסיים ביותר ויש שישה סוגים של וקטורים אטומיים. להלן ששת הווקטורים האטומיים:
כיצד להשתמש בשיטת פיצול ב- Java
הגיוני : הוא משמש לאחסון ערך לוגי כמו נָכוֹן אוֹ שֶׁקֶר .
מספרי : הוא משמש לאחסון מספרים חיוביים ושליליים, כולל מספר אמיתי.
למשל: 25, 7.1145, 96547
מספר שלם : הוא מכיל את כל הערכים השלמים כלומר את כל המספרים השלמים החיוביים והשליליים.
למשל: 45.479, -856.479, 0
מורכב : אלה הם בצורת x + yi, כאשר x ו- y הם מספריים ו- i מייצג את השורש הריבועי -1.
למשל: 4 + 3i
אופי : הוא משמש לאחסון של תו יחיד, קבוצת תווים (מילים) או קבוצת מילים יחד. ניתן להגדיר את התווים במרכאות בודדות או במרכאות כפולות.
למשל: 'אדוריקה', 'R כיף ללמוד'.
באופן כללי, וקטור מוגדר ומאותחל באופן הבא:
Vtr = c (2, 5, 11, 24) אוֹ Vtr<- c(2, 5, 11 , 24)
הבה נתקדם ונבין סוגי נתונים אחרים ב- R.
רשימה
רשימות דומות למדי לווקטורים, אך רשימות הן אובייקטים R שיכולים להכיל אלמנטים מסוגים שונים כמו מספרים מינוס, מחרוזות, וקטורים ורשימה אחרת בתוכו.
לְמָשָׁל:
Vtr<- c('Hello', 'Hi','How are you doing') mylist <- list(Vtr, 22.5, 14965, TRUE) mylist
תְפוּקָה:
[[1]] [1] 'שלום' 'היי' 'איך אתה עושה '[[2]] [1] 22.5 [[3]] [1] 14965 [[4]] [1] נכון
מַטרִיצָה
מטריקס הוא האובייקט R בו האלמנטים מסודרים במערך מלבני דו ממדי.
התחביר הבסיסי ליצירת מטריצה ב- R הוא & מינוס
מטריצה (נתונים, nrow, ncol, byrow, dimnames)
איפה:
- נתונים הוא וקטור הקלט שהופך לאלמנטים הנתונים של המטריצה.
- לא הוא מספר השורות שייווצרו.
- ncol הוא מספר העמודות שייווצרו.
- byrow הוא רמז הגיוני. אם נכון, אלמנטים וקטוריים קלט מסודרים לפי שורה.
- dimname הוא השמות שהוקצו לשורות ולעמודות.
דוגמא:
כיצד לסגור תוכנית ב - Java
מימטריקס<- matrix(c(1:25), nrow = 5, ncol = 5, byrow = TRUE) Mymatrix
תְפוּקָה:
[, 1] [, 2] [, 3] [, 4] [, 5] [1,] 1 2 3 4 5 [2,] 6 7 8 9 10 [3,] 11 12 13 14 15 [4, ] 16 17 18 19 20 [5,] 21 22 23 24 25
מַעֲרָך
מערכים ב- R הם אובייקטים נתונים שבהם ניתן להשתמש כדי לאחסן נתונים ביותר משני ממדים. זה לוקח וקטורים כקלט ומשתמש בערכים ב- לא פרמטר ליצירת מערך.
התחביר הבסיסי ליצירת מערך ב- R הוא & מינוס
מערך (נתונים, עמום, שמות)
איפה:
- נתונים הוא וקטור הקלט שהופך לאלמנטים הנתונים של המערך.
- לא הוא הממד של המערך, שבו אתה מעביר את מספר השורות, העמודה ומספר המטריצות שייווצרו על ידי הממדים שהוזכרו.
- dimname הוא השמות שהוקצו לשורות ולעמודות.
דוגמא:
מייריי<- array( c(1:16), dim=(4,4,2)) Myarray
תְפוּקָה:
, , אחד [, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16 ,, 2 [, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16
מסגרת נתונים
מסגרת נתונים היא טבלה או מבנה דמוי מערך דו מימדי שבו כל עמודה מכילה ערכים של משתנה אחד וכל שורה מכילה קבוצת ערכים אחתלכל עמודה. להלן כמה מהמאפיינים של מסגרת נתונים שיש לקחת בחשבון בכל פעם שאנחנו עובדים איתם:
- שמות העמודות צריכים להיות לא ריקים.
- כל עמודה צריכה להכיל את אותה כמות פריטי נתונים.
- הנתונים המאוחסנים במסגרת נתונים יכולים להיות מסוג מספרי, גורם או תו.
- שמות השורות צריכים להיות ייחודיים.
דוגמא:
emp_id = c (100: 104) emp_name = c ('John', 'Henry', 'Adam', 'Ron', 'Gary') dept = c ('Sales', 'Finance', 'Marketing', 'HR ',' מו'פ ') אמפ. נתונים<- data.frame(emp_id, emp_name, dept) emp.data
תְפוּקָה:
emp_id emp_name dept 1 100 מכירות ג'ון 2 101 הנרי פיננסים 3 102 שיווק אדם 4 103 רון משאבי אנוש 5 104 פיתוח גארי
אז עכשיו אחרי שהבנו את סוגי הנתונים הבסיסיים של R, הגיע הזמן שנצלול עמוק לתוך R על ידי הבנת המושגים של מפעילי נתונים.
תכנות R: מפעילי נתונים
ישנם בעיקר 4 מפעילי נתונים ב- R, כפי שהם נראים להלן:
מפעילי חשבון : אופרטורים אלה עוזרים לנו לבצע פעולות חשבון בסיסיות כמו חיבור, חיסור, כפל וכו '.
שקול את הדוגמה הבאה:
num1 = 15 num2 = 20 num3 = 0 # תוספת num3 = num1 + num2 num3 # הסחתית num3 = num1 - num2 num3 # ריבוי num3 = num1 * num2 num3 # חלוקה num3 = num1 / num2 num3 # מודול num3 = num1 %% num2 num3 #exponent num1 = 5 num2 = 3 num3 = num1 ^ num2 num3 # חלוקת קומה num3 = num1% /% num2 num3
תְפוּקָה:
[1] 35 [חֲמֵשׁ עֶשׂרֵה [1] 300 [1] 0.75 [1] 15 [1] 125 [אחת עשרה
מפעילים יחסיים : אופרטורים אלה עוזרים לנו לבצע פעולות יחסיות כמו לבדוק אם משתנה גדול יותר, קטן או שווה למשתנה אחר. התפוקה של פעולה התייחסותית היא תמיד ערך הגיוני.
שקול את הדוגמאות הבאות:
num1 = 15 num2 = 20 # שווה ל- num3 = (num1 == num2) num3 # לא שווה ל- num3 = (num1! = num2) num3 # פחות מ- num3 = (num1 num2) num3 # פחות משווה ל- num1 = 5 num2 = 20 num3 = (num1 = num2) num3
תְפוּקָה:
[1] FALSE [1] נכון [1] נכון [1] FALSE [1] נכון [1] FALSE
מפעילי מטלות: אופרטורים אלה משמשים להקצאת ערכים למשתנים ב- R. ניתן לבצע את ההקצאה באמצעות אופרטור ההקצאה(<-) או שווה למפעיל (=). ניתן להקצות את ערך המשתנה בשתי דרכים, הקצאה שמאלית והקצאה ימנית.
הגיונימפעילים: אופרטורים אלה משווים את שתי הישויות ומשמשים בדרך כלל עם ערכים בוליאניים (לוגיים) כגון 'ו', 'או'ו'לֹא'.
תכנות R: הצהרות מותנות
- הצהרה אם: המשפט אם מסייע לך בהערכת ביטוי יחיד כחלק מהזרם. כדי לבצע הערכה זו, אתה רק צריך לכתוב את מילת המפתח אם ואחריו את הביטוי שיש להעריך. תרשים הזרימה שלהלן ייתן מושג כיצד המשפט If שולט בזרימת הקוד: שקול את הדוגמה הבאה:
מספר 1 = 10 מספר 2 = 20 אם (מספר 1<=num2){ print('Num1 is less or equal to Num2')
תְפוּקָה:
[1] 'Num1 קטן או שווה ל- Num2'
- הצהרה אחרת אם: הצהרת Else if עוזרת לך להרחיב ענפים לזרם שנוצר על ידי הצהרת ה- If ולתת לך הזדמנות להעריך מספר תנאים על ידי יצירת ענפי זרימה חדשים. הזרימה שלהלן תתן לך מושג כיצד ההצהרה אחרת אם מסניפה את זרימת הקוד:
שקול את הדוגמה הבאה:Num1 = 5 Num2 = 20 if (Num1 Num2) {print ('Num2 is less than Num1')} אחר אם ('Num1 == Num2) {הדפס (' Num1 ו- Num2 שווים ')}
תְפוּקָה:
[1] 'Num1 הוא פחות מ- Num2'
- הצהרה אחרת: המשפט אחר משמש כאשר כל הביטויים האחרים נבדקים ונמצאים לא תקפים. זו תהיה ההצהרה האחרונה שתבוצע כחלק מסניף If - Else if. מתחת לזרימה ייתן לך מושג טוב יותר כיצד Else משנה את זרימת הקוד:
שקול את הדוגמה הבאה:
Num1 = 5 Num2 = 20 אם (Num1 Num2) {הדפס ('Num2 הוא פחות Num1')}} אחר הדפס ('Num1 ו- Num2 שווים')}
תְפוּקָה:
[1] 'Num1 ו- Num2 שווים'
תכנות R: לולאות
הצהרת לולאה מאפשרת לנו לבצע הצהרה או קבוצת הצהרות מספר פעמים. ישנם בעיקר 3 סוגים של לולאות ב- R:
תיאור התפקיד של מנהל מערכת לינוקס
- חזור על לולאה : הוא חוזר על הצהרה או על קבוצת הצהרות כאשר תנאי נתון הוא אמיתי. לולאה חוזרת היא הדוגמה הטובה ביותר לולאה מבוקרת יציאה שבה הקוד מבוצע תחילה ואז בודקים את התנאי כדי לקבוע אם השליטה צריכה להיות בתוך הלולאה או לצאת ממנה. להלן זרם השליטה בלולאה חוזרת:
בואו נסתכל על הדוגמה למטה כדי להבין כיצד נוכל להשתמש בלולאה חוזרת כדי להוסיף n מספרים עד שהסכום יעלה על 100:x = 2 חזור על {x = x ^ 2 הדפס (x) אם (x> 100) {break}
תְפוּקָה:
[1] 4 [1] 16 [1] 256
- ואילו לולאה : אניt עוזר לחזור על משפט או קבוצת הצהרות כאשר תנאי נתון הוא נכון. בעוד שלולאה, בהשוואה לולאה החוזרת שונה במקצת, זוהי דוגמה לולאה מבוקרת כניסה שבה התנאי נבדק תחילה ורק אם התנאי נמצא נכון, השליטה מועברת בתוך הלולאה לביצוע הקוד . להלן זרם השליטה בלולאת זמן:
בואו נסתכל על הדוגמה שלהלן כדי להוסיף את סכום הריבועים עבור 10 המספרים הראשונים ולהבין כיצד לולאת ה- while עובדת טוב יותר:מספר = סכום אחד = 0 בעוד (מספר<=11){ sumn =(sumn+ (num^2) num = num+1 print(sumn) }
תְפוּקָה:[אחת עשרה [חֲמֵשׁ עֶשׂרֵה [1] 14 [1] 30 [1] 55 [1] 91 [1] 140 [1] 204 [1] 285 [1] 385 [1] 506
- לולאה : הוא משמש לחזרה על הצהרה או קבוצה של מספר קבוע של פעמים. שלא כמו לולאה חוזרת ונשנית, לולאת ה- for משמשת במצבים בהם אנו מודעים למספר הפעמים שצריך לבצע את הקוד מראש. זה דומה ללולאת ה- while בה נבדק תחילה התנאי ואז רק הקוד שנכתב בפנים מתבצע. בוא נראה את זרימת השליטה ב- for loop כעת:
הבה נבחן דוגמה בה נשתמש בלולאת ה- for להדפיס את 10 המספרים הראשונים:
עבור (x ב -1: 10) {הדפס (x)}
תְפוּקָה:
[אחת עשרה [1] 2 [1] 3 [1] 4 [חֲמֵשׁ עֶשׂרֵה [1] 6 [1] 7 [1] 8 [1] 9 [1] 10
תכנות R: פונקציות
פונקציה היא גוש של קוד מאורגן, רב פעמי המשמש לביצוע פעולה קשורה אחת. ישנם בעיקר שני סוגים של פונקציות ב- R:
פונקציות מוגדרות מראש : אלה מובנים בפונקציות שיכולות לשמש את המשתמש לצורך ביצוע עבודתו קלותר. למשל: meaנ( איקס) , שuM( איקס) , מ'רt ( איקס ), טופר( איקס ), וכו.
משתמש הוגדר פונקציות: פונקציות אלה נוצרות על ידי המשתמש כדי לעמוד בדרישה ספציפית של המשתמש. להלן התחביר ליצירת פונקציה ב-R:
פונק שם שם <– פוּנקצִיָה (arg_1, arg_2, & hellip){ // גוף פונקציה }
שקול את הדוגמה הבאה לפונקציה פשוטה להפקת סכום הריבועיםשֶׁל2 מספרים:
סכום_ריבוע<- function(x,y) { x^2 + y^2 } sum_of_sqares(3,4)
תפוקה: [1] 25
אני מקווה שנהניתם לקרוא את בלוג התכנות R הזה. סקרנו את כל יסודות ה- R במדריך זה, כך שתוכל להתחיל להתאמן כעת. אחרי הבלוג הזה לתכנות R, אעלה עוד בלוגים ב- R עבור Analytics אז הישאר מעודכן.
כעת לאחר שהבנתם את היסודות של R, בדקו את מאת אדוריקה, חברת למידה מקוונת מהימנה עם רשת של יותר מ -250,000 לומדים מרוצים הפזורים ברחבי העולם. ניתוח הנתונים של אדוריקה עם אימון R יסייע לכם לצבור מומחיות בתכנות R, מניפולציה של נתונים, ניתוח נתונים חקר, ויזואליזציה של נתונים, כריית נתונים, רגרסיה, ניתוח סנטימנטים ושימוש ב- RStudio למחקרי מקרה אמיתיים על קמעונאות, מדיה חברתית.
יש לך שאלה עבורנו? אנא הזכיר זאת בסעיף ההערות בבלוג 'תכנות R' ונחזור אליך בהקדם האפשרי.