מדוע כדאי להתמזג כשאתה כבר יכול להצטרף לטבלה?



מיזוג נתונים בטבלאו - שיטה המשמשת כשיש נתונים קשורים במקורות נתונים מרובים, שאותם ברצונך לנתח יחד בתצוגה יחידה.

בעולם שמייצר וצורך 2.5 בתים של 500,000,000, ביום, ארגונים מחויבים לחפש שיטות חדשות לשינוי נתונים ושילובם על מנת להשיג יעילות מיטבית. שיטה אחת כזו לשילוב נתונים היא מיזוג נתונים בטבלה .

עכשיו, מכיוון שזה משרת מטרה כה חשובה במחזור הנתונים של כל ארגון נתון, זה מהווה מודול חיוני ביותר ברובו . בבלוג זה נדון במושגים הבאים:





מדוע אתה צריך מיזוג נתונים בטבלו?

נניח, אתה א שולחן מפתח אשר מאוחסנים בעסקאות נתוני עסקאות ונתוני מכסה מאוחסנים ב- Access. הנתונים שברצונך לשלב מאוחסנים בבסיסי נתונים שונים, והפירוט של הנתונים שנלכדים בכל טבלה שונה בשני מקורות הנתונים, ולכן מיזוג נתונים הוא הדרך הטובה ביותר לשלב נתונים אלה.

מיזוג נתונים שימושי בתנאים הבאים:



  1. ברצונך לשלב נתונים ממסדי נתונים שונים שאינם נתמכים על ידי הצטרפות בין מסדי נתונים.

    הצטרפות בין מסדי נתונים אינה תומכת בחיבורים לקוביות (למשל, Oracle Essbase) או לחיבורים מסוימים בלבד לחילוץ (למשל, Google Analytics). במקרה זה, הגדר מקורות נתונים בודדים עבור הנתונים שברצונך לנתח, ולאחר מכן השתמש במיזוג נתונים כדי לשלב את מקורות הנתונים בגיליון יחיד.

  2. הנתונים הם ברמות שונות של פירוט.

    לפעמים מערך נתונים אחד לוכד נתונים באמצעות שונים רמות פירוט כלומר פירוט גדול יותר או פחות ממערך הנתונים האחר.

    לדוגמה, נניח שאתה מנתח נתוני עסקאות ונתוני מכסה. נתוני עסקאות עשויים לתפוס את כל העסקאות. עם זאת, נתוני המכסות עשויים לצבור עסקאות ברבעון הרבעוני. מכיוון שערכי העסקאות נלכדים ברמות שונות של פירוט בכל מערך נתונים, עליך להשתמש במיזוג נתונים כדי לשלב את הנתונים.



מהי מיזוג נתונים בטבלאו?

מיזוג נתונים הוא תכונה חזקה מאוד ב- גלשן . משתמשים בו כאשר ישנם נתונים קשורים במקורות נתונים מרובים אותם ברצונך לנתח יחד בתצוגה יחידה. זוהי שיטה לשילוב נתונים המשלים טבלת נתונים ממקור נתונים אחד עם עמודות נתונים ממקור נתונים אחר.

בדרך כלל אתה משתמש בצירופים לביצוע שילוב של נתונים מסוג זה, אך ישנם זמנים, בהתאם לגורמים כמו סוג הנתונים והפרוטרליות שלהם, כאשר עדיף להשתמש במיזוג נתונים.

במה זה שונה מהצטרפות נתונים?

מיזוג נתונים מדמה הצטרפות שמאלית מסורתית. ההבדל העיקרי בין השניים הוא מתי ההצטרפות מבוצעת ביחס לצבירה.

שמאל מצטרף

כאשר אתה משתמש בצירוף שמאלי לשילוב נתונים, נשלחת שאילתה למסד הנתונים בו מבוצעת ההצטרפות. שימוש בצירוף שמאלי מחזיר את כל השורות מהטבלה השמאלית וכל שורות מהטבלה הימנית עם התאמה לשורה המתאימה בטבלה השמאלית. תוצאות ההצטרפות לאחר מכן נשלחות בחזרה ומצטברות על ידי טבלאו.

כיצד להגדיר מסלול Java

לדוגמה, נניח שיש לך את הטבלאות הבאות. אם העמודות הנפוצות הן תעודת זהות של המשתמש , צירוף שמאלי לוקח את כל הנתונים מהטבלה השמאלית, כמו גם את כל הנתונים מהטבלה הימנית מכיוון שלכל שורה יש התאמה לשורה המתאימה בטבלה השמאלית.

צירוף נתונים - מיזוג נתונים בטבלאו - אדוריקהמיזוג נתונים

כאשר אתה משתמש במיזוג נתונים לשילוב נתונים, נשלחת שאילתה למסד הנתונים עבור כל מקור נתונים המשמש בגליון. תוצאות השאילתות, כולל הנתונים המצטברים, נשלחות בחזרה ומשולבות על ידי Tableau. התצוגה משתמשת בכל השורות ממקור הנתונים הראשי, הטבלה השמאלית והשורות המצטברות ממקור הנתונים המשני, הטבלה הימנית, בהתבסס על הממד של שדות הקישור.

באפשרותך לשנות את שדה הקישור או להוסיף שדות קישור נוספים כדי לכלול שורות נתונים שונות או נוספות ממקור הנתונים המשני בתערובת, תוך שינוי הערכים המצטברים.

לדוגמה, נניח שיש לך את הטבלאות הבאות. אם שדות הקישור הם תעודת זהות של המשתמש בשתי הטבלאות מיזוג הנתונים שלך לוקח את כל הנתונים מהטבלה השמאלית, ומשלים את הטבלה השמאלית עם הנתונים מהטבלה הימנית. במקרה זה, לא כל הערכים יכולים להיות חלק מהטבלה המתקבלת בגלל הדברים הבאים:

  • בשורה בטבלה השמאלית אין התאמה בשורה המתאימה בטבלה הימנית, כפי שמצוין בערך null.
  • ישנם מספר ערכים תואמים בשורות בטבלה הימנית, כפי שמצוין בכוכבית (*).

נניח שיש לך אותן טבלאות כמו לעיל, אך מקור הנתונים המשני מכיל שדה חדש בשם מטרות . שוב, אם שדה הקישור הוא תעודת זהות של המשתמש , מיזוג הנתונים שלך לוקח את כל הנתונים מהטבלה השמאלית, ומשלים אותם עם נתונים מהטבלה הימנית. במקרה זה, אתה רואה את אותו ערך null וכוכביות בדוגמה הקודמת בנוסף לדברים הבאים:

  • בגלל ה מטרות שדה הוא מדד, אתה רואה את ערכי השורות עבורמטרותשדה מצטבר לפני שהנתונים בטבלה הימנית משולבים עם הנתונים בטבלה השמאלית.
  • כמו בדוגמה הקודמת, בשורה בטבלה השמאלית אין את השורה המתאימה עבור ה- מטרות שדה, כפי שמצוין בערך האפס השני.

מתי להחליף הצטרפות ל הִתמַזְגוּת

1. הנתונים זקוקים לניקוי.

אם הטבלאות שלך אינן מתאימות כראוי לאחר הצטרפות, הגדר מקורות נתונים לכל טבלה, בצע התאמות אישיות נחוצות (כלומר, שנה שמות של עמודות, שנה סוגי נתוני עמודות, צור קבוצות, השתמש בחישובים וכו '), ו ואז השתמש במיזוג נתונים כדי לשלב את הנתונים.

2. צירופים גורמים לנתונים כפולים.

נתונים כפולים לאחר הצטרפות הם סימפטום של נתונים ברמות שונות של פירוט. אם אתה מבחין בנתונים כפולים, במקום ליצור צירוף, השתמש במיזוג נתונים כדי למזג בממד משותף במקום זאת.

3. יש לך המון נתונים.

בדרך כלל צירופים מומלצים לשילוב נתונים מאותו מסד נתונים. ההצטרפות מטופלת על ידי מסד הנתונים, המאפשר לצירופים למנף חלק מהיכולות המקוריות של המאגר. עם זאת, אם אתה עובד עם קבוצות נתונים גדולות, הצטרפות עלולה להעיק על מסד הנתונים ולהשפיע באופן משמעותי על הביצועים. במקרה זה, מיזוג נתונים עשוי לעזור. מכיוון שטבלה מטפלת בשילוב הנתונים לאחר צבירת הנתונים, יש פחות נתונים לשילוב. כשיש פחות נתונים לשילוב, בדרך כלל הביצועים משתפרים.

מיזוג הנתונים שלך בטבלה

אתה יכול להשתמש במיזוג נתונים כאשר יש לך נתונים במקורות נתונים נפרדים שברצונך לנתח יחד על גיליון יחיד. לטבלאו שני מקורות נתונים מובנים בשם דוגמה-חנות-על ו רשת קפה לדוגמא. Mdb אשר ישמשו להמחשת מיזוג נתונים.

שלב 1: התחבר לנתונים שלך והגדר את מקורות הנתונים

כיצד להרכיב תוכנית Java
  • התחבר למערכת נתונים והגדר את מקור הנתונים בדף מקור הנתונים. אנימקור נתונים מובנה רשת קפה לדוגמא. Mdb ,שהוא קובץ מסד נתונים של MS Access, ישמש להמחשת מיזוג נתונים.
  • לך ל נתונים > מקור נתונים חדש, התחבר למערכת הנתונים השנייה.דוגמה זו משתמשת ב- מדגם - סופרסטור מקור מידע. טתרנגול להגדיר את מקור הנתונים.
  • לחץ על כרטיסיית הגיליונות כדי להתחיל לבנות את התצוגה שלך.

שלב 2: ייעד מקור נתונים ראשי

  • גרור לפחות שדה אחד ממקור הנתונים הראשי שלך לתצוגה כדי לייעד אותו כמקור הנתונים הראשי. בתוך ה נתונים בחלונית, לחץ על מקור הנתונים שברצונך לייעד כמקור הנתונים העיקרי. בדוגמה זו, רשת קפה לדוגמא נבחר.
  • צילום המסך הבא מציג את הטבלאות והצירופים השונים הזמינים בקובץ.

שלב 3: ייעד מקור נתונים משני

  • שדות המשמשים בתצוגה ממקורות נתונים שאינם מקור הנתונים העיקרי או קישורים פעילים מייעדים אוטומטית את מקורות הנתונים הבאים כמקור הנתונים המשני. במקרה זה, לדוגמא Superstore.

שלב 4: מיזוג נתונים

  • כעת תוכלו לשלב את הנתונים משני המקורות על בסיס מימד משותף ( מדינה , במקרה הזה). שימו לב שתמונת קישור קטנה מופיעה לצד הממד - State. זה מציין את המימד המשותף בין שני מקורות הנתונים.
  • נניח שאתה יוצר תרשים עמודות עם יחס רווח במדף העמודים ו מדינה במדף השורות, התרשים מראה כיצד יחס הרווח משתנה בין כל מדינה בחנויות העל והן ברשתות הקפה.

מגבלות של מיזוג נתונים בטבלו

  1. ישנן מגבלות על מיזוג נתונים סביב אגרגטים שאינם תוספים, כגון חֲצִיוֹן , ו RAWSQLAGG .
  2. מיזוג נתונים מתפשר על מהירות השאילתות בגרעיניות גבוהה.
  3. כאשר אתה מנסה למיין לפי שדה מחושב המשתמש בנתונים מעורבבים, השדה המחושב אינו מופיע ברשימה הנפתחת שדה בתיבת הדו-שיח מיון.
  4. ניתן להשתמש במקורות נתוני קוביות כמקור הנתונים העיקרי למיזוג נתונים ב- Tableau. לא ניתן להשתמש בהם כמקורות נתונים משניים.

אני מקווה שלכולכם, עכשיו, יהיה מושג הוגן לגבי מיזוג נתונים בטבלה מהבלוג הזה. רעבים לידע נוסף? אל תדאג, הסרטון הזה ייתן לך הבנה טובה יותר של הרעיון.