הדרכת פיתון סיבון: מהו סיבורן וכיצד להשתמש בו?



הדרכה של פיתון סיבורן לאורך ההבדל בין ים ים למטפלוטליב. למד גם על הפונקציות השונות והתאמות האישיות הזמינות אצל ים ים.

פייתון הוא מחסן של ספריות ומסגרות רבות עוצמה. ביניהם, הוא ים ים, שהוא דומיננטי נתונים להדמיה הספרייה, ומעניקה סיבה נוספת להשלמת המתכנתים . במדריך זה של פייתון סיבורן, תשען את כל הכישורים של הדמיית נתונים באמצעות Seaborn.

לפני שנמשיך הלאה, נסתכל על כל נושאי הדיון במאמר זה:





אז בואו נתחיל בהתחלה בנימוק את החשיבות של פייתון סיבורן.

מדוע להשתמש ב- Python Seaborn?

כפי שצוין קודם לכן, נעשה שימוש בספריית Python Seaborn כדי להקל על המשימה המאתגרת של הדמיית נתונים והיא מבוססת על . Seaborn מאפשר ליצור גרפיקה סטטיסטית באמצעות הפונקציות הבאות:



המרת כפול ל- int בג'אווה
  • API המבוסס על מערכי נתונים המאפשרים השוואה בין מספר רב של משתמשים משתנים

  • תומך ברשתות מרובות מגרשים שמקלות על בניית הדמיות מורכבות

  • ויזואליזציות חד-משתנות ודו-משתנות זמינות להשוואה בין קבוצות משנה של נתונים



  • זמינות של לוחות צבע שונים כדי לחשוף סוגים שונים של דוגמאות

  • אומדנים ועלילות באופן אוטומטי

לכן, אם תהיתם מדוע להשתמש בסיבורן כאשר כבר יש לכם מטפלוטליב, הנה התשובה לכך.

פייתון סיבורן מול מטפלוטליב:

'אם מטפלוטליב' מנסה להפוך דברים קלים לדברים קלים וקשים לאפשרים ', סיבורן מנסה להפוך גם סט מוגדר היטב של דברים קשים לקלים' - מיכאל ווסקום (בורא סיברן).
עובדתית, Matplotlib הוא טוב אבל Seaborn הוא טוב יותר. יש בעצם שני חסרונות של מטפלוטליב שמתקן סיבורן:

  1. ניתן להתאים אישית את Matplotlib אך קשה להבין אילו הגדרות נדרשות כדי להפוך את העלילות לאטרקטיביות יותר. מצד שני, Seaborn מגיע עם נושאים מותאמים אישית רבים וממשקים ברמה גבוהה כדי לפתור בעיה זו.

  2. כשעובדים עם פנדות , Matplotlib לא משרת היטב כשמדובר בהתמודדות עם DataFrames, בעוד שפונקציות Seaborn אכן עובדות על DataFrames.

כיצד להתקין Seaborn?

כדי להתקין את ספריית Python Seaborn, אתה יכול להשתמש בפקודות הבאות בהתבסס על הפלטפורמה שבה אתה משתמש:

pip להתקין ים ים

אוֹ

conda להתקין ים ים

לאחר התקנת זה, רק הקפד להתקין את החבילות והספריות ש- seaborn תלוי בהן.

התקנת תלות של פיתון ים לידים:

תלות חובה עבור ים ים הם:

יש גם תלות מומלצת אחת והיא:

  • מודלים ממלכתיים

כדי להתקין ספריות אלה, תוכל להשתמש באותן פקודות כפי שהוצגו קודם לכן עבור Seaborn עם שמותיהן בהתאמה. לאחר ההתקנה, ניתן לייבא אותם בקלות. Seaborn מאפשר לך לטעון כל מערך נתונים מ- משתמש ב load_dataset () פוּנקצִיָה. תוכל גם להציג את כל מערכי הנתונים הזמינים באמצעות פונקציית get_dataset_names () באופן הבא:

דוגמא:

ייבא ים ים כמו sns sns.get_dataset_names ()

פעולה זו תחזיר רשימה של כל מערכי הנתונים הזמינים.
עכשיו שהגדרת את הסביבה שלך לעבודה עם ים ים, בוא נמשיך הלאה כדי לראות כיצד להשתמש בפונקציות העלילה שלה ב .

פונקציות זממת ים ים

הדמיה של קשרים סטטיסטיים:

תהליך הבנת הקשרים בין משתנים של מערך נתונים וכיצד קשרים אלה, בתורו, תלויים במשתנים אחרים מכונה ניתוח סטטיסטי. בואו נסתכל עמוק יותר על הפונקציות הדרושות לכך:

עלילה מחדש ():

זוהי פונקציה ברמת הדמות שעושה שימוש בשני פונקציות צירים אחרות לצורך הדמיה של קשרים סטטיסטיים שהם:

  • גרף פיזור()
  • קו עלילה()

ניתן לציין פונקציות אלה באמצעות הפרמטר 'kind' של relplot (). במקרה שניתן פרמטר זה, הוא לוקח את ברירת המחדל שהיא scatterplot (). לפני שתתחיל לכתוב את הקוד שלך, דאג לייבא את הספריות הנדרשות באופן הבא:

ייבא numpy כמו np יבוא פנדות כ- pd ייבא matplotlib.pyplot כ plt ייבוא ​​seaborn כמו sns sns.set (style = 'darkgrid')

שים לב שתכונת הסגנון ניתנת להתאמה אישית ויכולה לקחת כל ערך כגון רשת כהה, קרציות וכו 'שעליהם אדון בהמשך החלק האסתטי בעלילה. בואו נסתכל על דוגמה קטנה:

דוגמא:

f = sns.load_dataset ('טיסות') sns.relplot (x = 'נוסעים', y = 'חודש', נתונים = f)

תְפוּקָה:

Flights1-Python Seaborn Tutorial-Edureka

כפי שניתן לראות, הנקודות מתוות דו מימדיות. עם זאת, ניתן להוסיף מימד נוסף באמצעות סמנט 'גוון'. בואו נסתכל על דוגמה לאותו דבר:

דוגמא:

f = sns.load_dataset ('טיסות') sns.relplot (x = 'נוסעים', y = 'חודש', גוון = 'שנה', נתונים = f)

תראה את הפלט הבא:

תְפוּקָה:

עם זאת, ישנם התאמות אישיות רבות נוספות שתוכלו לנסות, כגון צבעים, סגנונות, גודל וכו '. הרשו לי רק להראות כיצד תוכלו לשנות את הצבע בדוגמה הבאה:

דוגמא:

sns.set (style = 'darkgrid') f = sns.load_dataset ('טיסות') sns.relplot (x = 'נוסעים', y = 'חודש', גוון = 'שנה', לוח = 'ch: r = - .5, l = .75 ', נתונים = f)

תְפוּקָה:

קו עלילה():

פונקציה זו תאפשר לך לצייר קו רציף לנתונים שלך. אתה יכול להשתמש בפונקציה זו על ידי שינוי הפרמטר 'kind' באופן הבא:

דוגמא:

a = pd.DataFrame ({'יום': [1,2,3,4,5,6,7], 'מכולת': [30,80,45,23,51,46,76], 'בגדים' : [13,40,34,23,54,67,98], 'כלים': [12,32,27,56,87,54,34]}, אינדקס = [1,2,3,4,5 , 6,7]) g = sns.relplot (x = 'יום', y = 'בגדים', סוג = 'קו', נתונים = a) g.fig.autofmt_xdate ()

תְפוּקָה:

ברירת המחדל עבור lineplot היא y כפונקציה של x. עם זאת, ניתן לשנות זאת אם ברצונך לעשות זאת. ישנן אפשרויות רבות נוספות שתוכל לנסות עוד יותר.

עכשיו בואו נסתכל כיצד לשרטט נתונים קטגוריים.

זממה עם נתונים קטגוריים:

גישה זו נכנסת לתמונה כאשר המשתנה העיקרי שלנו מחולק עוד יותר לקבוצות דיסקרטיות (קטגוריות). ניתן להשיג זאת באמצעות הפונקציה catplot ().

מזימה ():

זוהי פונקציה ברמת הדמות כמו relplot (). זה יכול להיות מאופיין בשלוש משפחות של פונקציות ברמת הצירים, כלומר:

  1. Scatterplots - אלה כוללים stripplot (), swarmplot ()

  2. עלילות תפוצה - שהן boxplot (), violinplot (), boxenplot ()

  3. הערכות עלילות - כלומר pointplot (), barplot (), countplot ()

בואו ניקח כמה דוגמאות כדי להדגים זאת:

דוגמא:

יבוא ים כמו sns ייבא matplotlib.pyplot כמו plt sns.set (style = 'ticks', color_codes = True) a = sns.load_dataset ('tips') sns.catplot (x = 'day', y = 'total_bill', נתונים = א)

תְפוּקָה:

כפי שאתה יכול לראות, בדוגמה שלעיל לא הגדרתי את הפרמטר 'סוג'. לכן הוא החזיר את הגרף כעל פיזור ברירת המחדל. אתה יכול לציין כל אחת מפונקציות רמת הצירים כדי לשנות את הגרף לפי הצורך. ניקח דוגמה לכך גם:

דוגמא:

יבוא ים כמו sns ייבא matplotlib.pyplot כמו plt sns.set (style = 'ticks', color_codes = True) a = sns.load_dataset ('tips') sns.catplot (x = 'day', y = 'total_bill', סוג = 'כינור', נתונים = א)

תְפוּקָה:

הפלט שלעיל מראה את הכינור של מערך העצות. בואו ננסה למצוא כיצד להמחיש את הפצת מערך הנתונים.

הדמיה של הפצת מערך נתונים:

זה בעצם עוסק בהבנת מערכי נתונים בהקשר להיות חד-משתני או דו-משתני. לפני שתתחיל עם זה, פשוט ייבא את הדברים הבאים:

ייבא numpy כ- np יבוא פנדות כ- pd ייבוא ​​seaborn כמו sns ייבא matplotlib.pyplot כ- plt מסטטיסטיקות ייבוא ​​scipy sns.set (color_codes = True)

לאחר שתסיים זאת, תוכל להמשיך לתכנן הפצות חד-משתנות ודו-משתנות.

תכנון הפצות חד-משתנות:

כדי לשרטט אותם, תוכלו להשתמש בפונקציה distplot () באופן הבא:

דוגמא:

a = np.random.normal (loc = 5, size = 100, scale = 2) sns.distplot (a)

תְפוּקָה:

כפי שניתן לראות בדוגמה לעיל, תכננו גרף עבור המשתנה שערכיו נוצרים על ידי הפונקציה הרגילה () באמצעות distplot.

תכנון הפצות דו-משתנות:

זה נכנס לתמונה כאשר יש לך שני משתנים עצמאיים אקראיים וכתוצאה מכך אירוע אפשרי כלשהו. הפונקציה הטובה ביותר לשרטט גרפים מסוג זה היא jointplot (). בואו נתווה כעת גרף דו-משתני באמצעות מגרש משותף ().

דוגמא:

x = pd.DataFrame ({'יום': [1,2,3,4,5,6,7], 'מכולת': [30,80,45,23,51,46,76], 'בגדים' : [13,40,34,23,54,67,98], 'כלים': [12,32,27,56,87,54,34]}, אינדקס = [1,2,3,4,5 , 6,7]) y = pd.DataFrame ({'יום': [8,9,10,11,12,13,14], 'מכולת': [30,80,45,23,51,46, 76], 'בגדים': [13,40,34,23,54,67,98], 'כלים': [12,32,27,56,87,54,34]}, אינדקס = [8,9 , 10,11,12,13,14]) ממוצע, cov = [0, 1], [(1, .5), (.5, 1)] data = np.random.multivariate_normal (ממוצע, cov, 200 ) עם sns.axes_style ('לבן'): sns.jointplot (x = x, y = y, kind = 'kde', color = 'b')

תְפוּקָה:

כעת לאחר שהבנתם את הפונקציות השונות בפייתון סיבורן, נעבור לבניית רשתות מובנות בעלות מספר עלילות.

רשתות מרובות מגרשים:

Python Seaborn מאפשר לך לתכנן מספר רשתות זו לצד זו. אלה הם בעצם עלילות או גרפים שמתוות בעזרת אותו סולם וצירים כדי לסייע בהשוואה ביניהם. זה בתורו מסייע למתכנת להבדיל במהירות בין העלילות ולקבל כמויות גדולות של מידע.

שקול את הדוגמה הבאה לפונקציית facetgrid () כדי לשרטט גרפים אלה.

דוגמא:

sns.set (style = 'darkgrid') a = sns.load_dataset ('iris') b = sns.FacetGrid (a, col = 'species') b.map (plt.hist, 'sepal_length')

תְפוּקָה:

התפוקה לעיל מראה בבירור את ההשוואה בין הטיפים שניתנים בארוחות הצהריים והערב. אתה יכול גם לשרטט באמצעות פונקציית PairGrid כשיש לך זוג משתנים להשוואה. שקול את הדוגמה הבאה.

דוגמא:

sns.set (style = 'ticks') a = sns.load_dataset ('Flights') b = sns.PairGrid (a) b.map (plt. scatter)

תְפוּקָה:

כפי שאתה יכול לראות, התפוקה הנ'ל משווה בבירור בין השנה למספר הנוסעים בדרכים שונות.

Seaborn מאפשר גם התאמות אישיות לגבי אסתטיקה שנדון בהמשך.

עלילה-אסתטיקה:

קטע זה של הדרכת Python Seaborn עוסק בהפיכת העלילות שלנו לאטרקטיביות ומענגות יותר.

דמות אסתטיקה של פיתון סיבורן:

הפונקציה הראשונה שאדון בה היא מוגדרת (). השתמשתי בפרמטר 'סגנון' של פונקציה זו בעבר. פרמטר זה בעצם עוסק בתמות ים. נכון לעכשיו, ישנם חמישה מהם זמינים כלומר כהה, קרציות, לבן לבן, כהה.

שקול את הדוגמה הבאה המדגימה את הנושא הלבן.

דוגמא:

ייבא את ים הים כמו sns ייבא matplotlib.pyplot כמו plt sns.set (style = 'לבן', color_codes = True) a = sns.load_dataset ('טיפים') sns.boxplot (x = 'יום', y = 'סה'כ שטר', נתונים = א)

תְפוּקָה:

בפלט שלעיל, תוכלו להבחין כי הנושא שונה ללבן. תוכל לחקור אותם עוד יותר באמצעות הנושאים האחרים. אם שמתם לב בפלט הקודם, ישנם צירים מסביב לתרשים. עם זאת, ניתן להתאמה אישית גם באמצעות פונקציית despine (). עיין בדוגמה למטה.

דוגמא:

ייבא את ים הים כמו sns ייבא matplotlib.pyplot כמו plt sns.set (style = 'לבן', color_codes = True) a = sns.load_dataset ('טיפים') sns.boxplot (x = 'יום', y = 'סה'כ שטר', נתונים = a) sns.despine (קיזוז = 10, trim = True)

תְפוּקָה:



שימו לב להבדל בין שתי היציאות הקודמות. עם זאת, ישנן אפשרויות רבות נוספות שתוכלו לבחון בעצמכם.

פלטות צבעוניות של ים פיתון:

צבע הוא בעצם התכונה המתקרבת לעיני האדם מעבר לכל תכונה אחרת. Seaborn מאפשר לך לשחק עם צבעים באמצעות פונקציות שונות כגון color_palette (), hls_palette (), husl_palette () וכו '. התבונן בצבעים הקיימים כיום בתוך seaborn.

דוגמא:

ייבא מטומטם כ- np יבוא ים כמו sns ייבא matplotlib.pyplot כ- plt sns.set () presentcolors = sns.color_palette () sns.palplot (presentcolors)

תְפוּקָה:

כיצד ליצור מערך של אובייקטים

התמונה לעיל מציגה את הצבעים הקיימים בתוך ים ים. עשיתי את זה באמצעות הפונקציה palplot (). עבור וריאציות עמוקות יותר, תוכלו להשתמש ב- hls_palette (), husl_palette () וכו '.

זה מביא אותנו לסוף ההדרכה של Python Seaborn. אני מקווה שהבנת הכל בבהירות. דאג שתתאמן כמה שיותר .

יש לך שאלה עבורנו? אנא הזכיר זאת בקטע ההערות בבלוג זה 'הדרכת פיתון סיבורן' ונחזור אליך בהקדם האפשרי.

כדי לקבל ידע מעמיק על Python יחד עם היישומים השונים שלו, אתה יכול להירשם לשידור חי עם תמיכה 24/7 וגישה לכל החיים.