ארכיטקטורת HBase: מודל נתונים HBase ומנגנון קריאה / כתיבה של HBase



בלוג זה בנושא HBase Architecture מסביר את מודל הנתונים של HBase ונותן תובנה על HBase Architecture. זה גם מסביר מנגנונים שונים ב- HBase.

ארכיטקטורת HBase

בבלוג הקודם שלי ב מדריך HBase , הסברתי מה זה HBase ותכונותיו. הזכרתי גם את מקרה המקרה של שליח פייסבוק שיעזור לך להתחבר טוב יותר. עכשיו עוד יותר קדימה ב אני אסביר לך את מודל הנתונים של HBase ו- HBase Architecture.לפני שתמשיך, עליך לדעת שגם HBase הוא מושג חשוב המהווה חלק בלתי נפרד מה- להסמכת Big Data Hadoop.

הנושאים החשובים שאעביר אותך בבלוג אדריכלות HBase זה הם:





בואו נבין תחילה את מודל הנתונים של HBase. זה עוזר ל- HBase בקריאה / כתיבה וחיפושים מהירים יותר.



ארכיטקטורת HBase: מודל נתונים HBase

כידוע, HBase הוא מסד נתונים מבוסס NoSQL. אמנם זה נראה דומה למסד נתונים יחסי המכיל שורות ועמודות, אך הוא אינו בסיס נתונים יחסי. מאגרי מידע יחסיים מכוונים לשורות ואילו HBase מכוון לטורים. אז בואו נבין תחילה את ההבדל בין מסדי נתונים מונחים לטור לבין שורה:

מאגרי מידע מכווני-שורות לעומת עמודים:

  • מאגרי מידע מכווני שורה מאחסנים רשומות טבלה ברצף שורות. ואילו בסיסי נתונים מכווני עמודותאחסן רשומות טבלה ברצף של עמודות, כלומר הערכים בעמודה מאוחסנים במיקומים רצופים על דיסקים.

כדי להבין זאת טוב יותר, ניקח דוגמה ונשקול את הטבלה שלהלן.



טבלה - אדריכלות HBase - אדוריקה

אם טבלה זו מאוחסנת במסד נתונים מונחה שורות. הוא יאחסן את הרשומות כמוצג להלן:

אחד,פול ווקר,לָנוּ,231,אַבִּירִי,

2, וין דיזל,בְּרָזִיל,520,מוּסטָנג

בבסיסי נתונים מכווני שורות הנתונים נשמרים על בסיס שורות או כפולות כפי שניתן לראות לעיל.

בעוד שמאגרי המידע המוכנים לעמוד מאחסנים נתונים אלה כ:

אחד,2, פול ווקר,וין דיזל, לָנוּ,בְּרָזִיל, 231,520, אַבִּירִי,מוּסטָנג

במסדי נתונים המכוונים לעמודה, כל ערכי העמודות נשמרים יחד כמו שערכי העמודות הראשונים יאוחסנו יחד, ואז ערכי העמודות השנייה יאוחסנו יחד והנתונים בעמודות אחרות נשמרים באופן דומה.

  • כאשר כמות הנתונים היא עצומה מאוד, כמו מבחינת פטה-בייט או אקס-בייט, אנו משתמשים בגישה מכוונת עמודה, מכיוון שנתוני העמודה היחידה מאוחסנים יחד וניתן לגשת אליהם מהר יותר.
  • בעוד שגישה מכוונת-שורות מטפלת באופן יעיל במספר פחות של שורות ועמודות, שכן מאגר נתונים המכוון לשורות הוא פורמט מובנה.
  • כשאנחנו צריכים לעבד ולנתח קבוצה גדולה של נתונים חצי מובנים או לא מובנים, אנו משתמשים בגישה מכוונת עמודות. כגון יישומים העוסקים ב עיבוד אנליטי מקוון כמו כריית נתונים, אחסון נתונים, יישומים כולל ניתוח וכו '.
  • ואילו, עיבוד עסקאות מקוון כגון תחומי בנקאות ופיננסים המטפלים בנתונים מובנים ודורשים מאפייני עסקה (מאפייני ACID) משתמשים בגישה מכוונת שורה.

טבלאות HBase כוללות את המרכיבים הבאים, המוצגים בתמונה למטה:

  • שולחנות : הנתונים נשמרים בפורמט טבלה ב- HBase. אבל כאן הטבלאות הן בפורמט מכוון לטורים.
  • שׁוּרָה מַפְתֵחַ : מקשי שורה משמשים לחיפוש רשומות אשר הופכות את החיפושים למהירים. היית סקרן לדעת איך? אני אסביר את זה בחלק האדריכלות שמתקדם בבלוג זה.
  • טור משפחות : עמודים שונים משולבים במשפחת עמודים. משפחות עמודות אלה מאוחסנות יחד מה שהופך את תהליך החיפוש למהיר יותר משום שניתן לגשת לנתונים השייכים לאותה משפחת עמודות יחד בחיפוש אחד.
  • טור מוקדמות : השם של כל עמודה ידוע כמסמך העמודות שלו.
  • תָא : הנתונים נשמרים בתאים. הנתונים מושלכים לתאים שזוהו באופן ספציפי על ידי מוסמכים למפתחות שורה ועמודות.
  • חותמת זמן : חותמת זמן היא שילוב של תאריך ושעה. בכל פעם שנשמרים נתונים, הם מאוחסנים עם חותמת הזמן שלה. זה מאפשר לחפש בקלות גרסה מסוימת של נתונים.

בצורה פשוטה ומובנת יותר אנו יכולים לומר כי HBase מורכב מ:

  • ערכת שולחנות
  • כל טבלה עם משפחות עמודות ושורות
  • מקש שורה משמש כמפתח ראשי ב- HBase.
  • כל גישה לטבלאות HBase משתמשת במפתח ראשי זה
  • כל מוקד עמודות הקיים ב- HBase מציין תכונה המתאימה לאובייקט השוכן בתא.

כעת, כאשר ידוע לכם על HBase Data Model, הבה נראה כיצד מודל נתונים זה עולה בקנה אחד עם HBase Architecture והופך אותו למתאים לאחסון גדול ולעיבוד מהיר יותר.

ארכיטקטורת HBase: רכיבי אדריכלות HBase

ל- HBase שלושה מרכיבים עיקריים כלומר שרת HMaster , שרת HBase Region, אזורים ו שומר החיות .

האיור שלהלן מסביר את ההיררכיה של ארכיטקטורת HBase. נדבר על כל אחד מהם בנפרד.


עכשיו לפני שנלך ל- HMaster, אנו מבינים את Regions כי כל השרתים הללו (HMaster, Region Server, Zookeeper) ממוקמים לתאם ולנהל אזורים ולבצע פעולות שונות בתוך האזורים. אז היית סקרן לדעת מהם אזורים ולמה הם כל כך חשובים?

ארכיטקטורת HBase: אזור

אזור מכיל את כל השורות שבין מפתח ההתחלה למפתח הסיום שהוקצה לאזור זה. ניתן לחלק טבלאות HBase למספר אזורים באופן שכל עמודות משפחת העמודות נשמרות באזור אחד. כל אזור מכיל את השורות בסדר מיון.

אזורים רבים מוקצים לא שרת אזור , האחראית על טיפול, ניהול, ביצוע פעולות קריאה וכתיבה במערך אזורים זה.

אז, מסכמים בצורה פשוטה יותר:

  • ניתן לחלק טבלה למספר אזורים. אזור הוא טווח ממוין של שורות המאחסנות נתונים בין מפתח התחלה למפתח סיום.
  • לאזור יש גודל ברירת מחדל של 256MB אשר ניתן להגדיר בהתאם לצורך.
  • קבוצת אזורים מוגשת ללקוחות על ידי שרת אזורים.
  • שרת אזור יכול לשרת כ -1000 אזורים ללקוח.

כעת, החל מראשית ההיררכיה, ברצוני להסביר לך על HMaster Server שפועל באופן דומה כ- NameNode ב- HDFS . ואז, כשאני יורד בהיררכיה, אני אקח אותך דרך ZooKeeper ו- Region Server.

ארכיטקטורת HBase: HMaster

כמו בתמונה למטה, אתה יכול לראות את HMaster מטפל באוסף של שרת אזור שנמצא ב- DataNode. תן לנו להבין איך HMaster עושה את זה.

  • HBase HMaster מבצע פעולות DDL (יצירה ומחיקה של טבלאות) ומקצה אזורים לשרתי האזור כפי שניתן לראות בתמונה לעיל.
  • הוא מתאם ומנהל את שרת האזור (בדומה ל- NameNode שמנהל את DataNode ב- HDFS).
  • זה מקצה אזורים לשרתי האזור בעת ההפעלה ומקצה מחדש אזורים לשרתי האזור במהלך התאוששות ואיזון עומסים.
  • הוא עוקב אחר כל המופעים של שרת האזור באשכול (בעזרת Zookeeper) ומבצע פעילויות שחזור בכל שרת אזורי כלשהו.
  • הוא מספק ממשק ליצירה, מחיקה ועדכון טבלאות.

ל- HBase יש סביבה מבוזרת ועצומה שבה HMaster לבדו לא מספיק כדי לנהל הכל. אז תהיתם מה עוזר ל- HMaster לנהל את הסביבה הענקית הזו? שם נכנס ZooKeeper לתמונה. לאחר שהבנו כיצד HMaster מנהל את סביבת HBase, נבין כיצד Zookeeper עוזר ל- HMaster בניהול הסביבה.

ארכיטקטורת HBase: ZooKeeper - הרכז

תמונה זו למטה מסבירה את מנגנון התיאום של ZooKeeper.

  • Zookeeper מתנהג כמו רכז בסביבה המבוזרת של HBase. זה עוזר בשמירה על מצב השרת בתוך האשכול על ידי תקשורת דרך הפעלות.
  • כל שרת אזור יחד עם שרת HMaster שולח פעימות לב רציפות במרווח קבוע ל- Zookeeper והוא בודק איזה שרת חי וזמין כאמור בתמונה לעיל. הוא גם מספק התראות על כשל בשרת כך שניתן לבצע אמצעי שחזור.
  • בהתייחס לתמונה לעיל תוכלו לראות, יש שרת לא פעיל, המשמש כגיבוי לשרת פעיל. אם השרת הפעיל נכשל, הוא בא להצלה.
  • ה- HMaster הפעיל שולח פעימות לב ל- Zookeeper בעוד ה- HMaster הלא פעיל מקשיב להודעה שנשלחת על ידי HMaster פעיל. אם ה- HMaster הפעיל לא מצליח להעביר פעימות לב, ההפעלה נמחקת וה- HMaster הלא פעיל הופך פעיל.
  • בעוד שאם שרת אזור לא מצליח לשלוח פעימות לב, פג תוקף ההפעלה וכל המאזינים מקבלים הודעה על כך. לאחר מכן HMaster מבצע פעולות התאוששות מתאימות עליהן נדון בהמשך הבלוג הזה.
  • Zookeeper גם שומר על הנתיב של .META Server, המסייע לכל לקוח בחיפוש אחר אזור כלשהו. הלקוח צריך לבדוק תחילה עם שרת .META לאיזה שרת אזור שייך אזור והוא מקבל את הנתיב של שרת אזור זה.

כשדיברתי על שרת .META, תן לי להסביר לך קודם מה זה שרת .META? אז אתה יכול בקלות לקשר את העבודה של ZooKeeper ו- .META Server ביחד. בהמשך, כשאסביר לך את מנגנון החיפוש HBase בבלוג זה, אסביר כיצד שני אלה עובדים בשיתוף פעולה.

ארכיטקטורת HBase: מטא טבלה

  • טבלת META היא טבלה קטלוגית מיוחדת של HBase. היא מנהלת רשימה של כל שרתי האזורים במערכת האחסון HBase, כפי שניתן לראות בתמונה לעיל.
  • מסתכל על הדמות שאתה יכול לראות, .META קובץ שומר על הטבלה בצורה של מפתחות וערכים. מפתח מייצג את מפתח ההתחלה של האזור ואת מזהה שלו ואילו הערך מכיל את הנתיב של שרת האזור.

כפי שכבר דנתי, שרת האזור ופונקציותיו בזמן שהסברתי לך אזורים מכאן, כעת אנו עוברים במורד ההיררכיה ואני אתמקד ברכיב של שרת האזור ובפונקציות שלהם. בהמשך אדון במנגנון החיפוש, הקריאה, הכתיבה ואבין כיצד כל המרכיבים הללו עובדים יחד.

ארכיטקטורת HBase: רכיבי שרת אזור

תמונה זו למטה מציגה את הרכיבים של שרת אזור. כעת אדון בהם בנפרד.

שרת אזור שומר על אזורים שונים הפועלים בראשם . הרכיבים של שרת אזור הם:

  • וואל: כפי שניתן להסיק מהתמונה לעיל, כתיבת יומן קדימה (WAL) היא קובץ המצורף לכל שרת אזור בסביבה המבוזרת. ה- WAL מאחסן את הנתונים החדשים שלא נמשכו ולא התחייבו לאחסון הקבע. הוא משמש במקרה של כישלון שחזור מערכי הנתונים.
  • חסום מטמון: מהתמונה שלעיל ניתן לראות בבירור כי חסימת מטמון נמצאת בחלק העליון של שרת האזורים. הוא מאחסן את הנתונים הנקראים לעתים קרובות בזיכרון. אם נעשה שימוש לאחרונה בנתונים ב- BlockCache, הנתונים האלה יוסרו מ- BlockCache.
  • MemStore: זהו מטמון הכתיבה. הוא מאחסן את כל הנתונים הנכנסים לפני שהועבר אותם לדיסק או לזיכרון הקבוע. יש MemStore אחד לכל משפחת טור באזור. כפי שניתן לראות בתמונה, ישנם מספר MemStores לאזור מכיוון שכל אזור מכיל מספר משפחות עמודות. הנתונים ממוינים לפי סדר לקסיקוגרפי לפני שהם מעבירים אותם לדיסק.
  • HFile: מהאיור לעיל ניתן לראות ש- HFile מאוחסן ב- HDFS. כך הוא מאחסן את התאים בפועל בדיסק. MemStore מתחייב את הנתונים ל- HFile כאשר גודל MemStore עולה.

כעת, כשאנו מכירים מרכיבים עיקריים ומשניים של ארכיטקטורת HBase, אסביר את המנגנון ואת המאמץ השיתופי שלהם בכך. בין אם זה קריאה או כתיבה, ראשית עלינו לחפש מאיפה לקרוא או איפה לכתוב קובץ. אז בואו נבין את תהליך החיפוש הזה, מכיוון שזה אחד המנגנונים שהופכים את HBase לפופולרי מאוד.

ארכיטקטורת HBase: כיצד מתחיל חיפוש ב- HBase?

כידוע, Zookeeper מאחסן את מיקום הטבלה META. בכל פעם שלקוח מתקרב עם קריאה או כותב בקשות ל- HBase מתרחשת הפעולה הבאה:

  1. הלקוח מאחזר את המיקום של טבלת META מ- ZooKeeper.
  2. לאחר מכן הלקוח מבקש את מיקומו של שרת האזור של מפתח השורה המתאים מטבלת META כדי לגשת אליו. הלקוח שומר מידע זה במיקום טבלת META.
  3. ואז הוא יקבל את מיקום השורה על ידי בקשה משרת האזור המתאים.

לצורך הפניות עתידיות, הלקוח משתמש במטמון שלו כדי לאחזר את המיקום של טבלת META וקרא בעבר את שרת האזור של מפתח השורה. אז הלקוח לא יתייחס לטבלת META, אלא אם כן יש פספוס מכיוון שהאזור מוסט או מועבר. ואז הוא יבקש שוב לשרת META ולעדכן את המטמון.

כמו בכל פעם, לקוחות לא מבזבזים זמן באחזור המיקום של שרת אזור משרת META, לפיכך, הדבר חוסך זמן והופך את תהליך החיפוש למהיר יותר. עכשיו, תן לי לספר לך איך הכתיבה מתרחשת ב- HBase. מהם המרכיבים הכרוכים בכך וכיצד הם מעורבים?

ארכיטקטורת HBase: HBase כתוב מַנגָנוֹן

תמונה זו למטה מסבירה את מנגנון הכתיבה ב- HBase.

מנגנון הכתיבה עובר את התהליך הבא ברצף (עיין בתמונה לעיל):

שלב 1: בכל פעם שללקוח יש בקשת כתיבה, הלקוח כותב את הנתונים ל- WAL (יומן כתיבה קדימה).

  • העריכות מתווספות בסוף קובץ ה- WAL.
  • קובץ WAL זה מתוחזק בכל שרת אזור ושרת אזור משתמש בו לשחזור נתונים שאינם מחויבים לדיסק.

שלב 2: לאחר שנכתבים נתונים ל- WAL, הם מועתקים ל- MemStore.

שלב 3: לאחר שהנתונים ממוקמים ב- MemStore, הלקוח מקבל את האישור.

שלב 4: כאשר MemStore מגיע לסף, הוא משליך או מעביר את הנתונים לתוך קובץ HF.

עכשיו בואו נצלול עמוק ונבין כיצד MemStore תורם בתהליך הכתיבה ומה תפקידיה?

HBase כתוב מַנגָנוֹן- MemStore

  • ה- MemStore תמיד מעדכן את הנתונים המאוחסנים בו, בסדר לקסיקוגרפי (ברצף באופן מילוני) כ- KeyValues ​​ממוינים. יש MemStore אחד לכל משפחת עמודות, ולכן העדכונים נשמרים בצורה ממוינת לכל משפחת עמודות.
  • כאשר MemStore מגיע לסף, הוא משליך את כל הנתונים לקובץ HF חדש בצורה ממוינת. קובץ HF זה מאוחסן ב- HDFS. HBase מכיל מספר קבצי HF עבור כל משפחת עמודות.
  • עם הזמן, מספר HFile גדל כאשר MemStore זורק את הנתונים.
  • MemStore שומר גם את מספר הרצף הכתוב האחרון, כך ש- Master Server ו- MemStore יודעים שניהם, כי מה שהתחייב עד כה ומאיפה להתחיל. כאשר האזור מתחיל, מספר הרצף האחרון נקרא, ומספר זה מתחילות עריכות חדשות.

כפי שדנתי מספר פעמים, כי HFile הוא האחסון העיקרי העיקרי בארכיטקטורת HBase. לבסוף, כל הנתונים מחויבים ל- HFile שהוא האחסון הקבוע של HBase. לפיכך, בואו נסתכל על המאפיינים של HFile מה שהופך אותו לחיפוש מהיר יותר בזמן קריאה וכתיבה.

ארכיטקטורת HBase: HBase כתוב מַנגָנוֹן- HFile

  • הכותבים ממוקמים ברצף על הדיסק. לכן, התנועה של ראש הקריאה והכתיבה של הדיסק היא פחותה מאוד. זה הופך את מנגנון הכתיבה והחיפוש למהיר מאוד.
  • אינדקסי HFile נטענים בזיכרון בכל פעם שנפתח HFile. זה עוזר במציאת רשומה בחיפוש יחיד.
  • הטריילר הוא מצביע המצביע על מטא-בלוק של ה- HFile. זה כתוב בסוף התיק המחויב. הוא מכיל מידע אודות מסנני חותמת זמן ופריחה.
  • מסנן בלום מסייע בחיפוש זוגות ערכי מפתח, הוא מדלג על הקובץ שאינו מכיל את מפתח השורה הנדרש. חותמת הזמן מסייעת גם בחיפוש גרסת הקובץ, והיא מסייעת בדילוג על הנתונים.

לאחר הכרת מנגנון הכתיבה ותפקידם של רכיבים שונים להפוך את הכתיבה והחיפוש למהירה יותר. אסביר לך כיצד מנגנון הקריאה פועל בתוך ארכיטקטורת HBase? לאחר מכן נעבור למנגנונים המגדילים את ביצועי HBase כמו דחיסה, פיצול אזור והתאוששות.

ארכיטקטורת HBase: קרא מנגנון

כפי שנדון במנגנון החיפוש שלנו, תחילה הלקוח מאחזר את מיקומו של שרת האזור מ- .META Server אם הלקוח לא מחזיק אותו בזיכרון המטמון. לאחר מכן הוא עובר את השלבים הרציפים כדלקמן:

  • לקריאת הנתונים, הסורק מחפש תחילה את התא שורה במטמון חסום. כאן מאוחסנים כל זוגות ערכי המפתח שנקראו לאחרונה.
  • אם הסורק לא מצליח למצוא את התוצאה הנדרשת, הוא עובר ל- MemStore, מכיוון שאנו יודעים שזהו זיכרון מטמון הכתיבה. שם הוא מחפש את הקבצים שנכתבו לאחרונה, שטרם הושלכו ל- HFile.
  • לבסוף, הוא ישתמש במסנני פריחה ויחסום מטמון כדי לטעון את הנתונים מ- HFile.

ההבדל בין העמסת יתר לשיטה

עד כה דנתי במנגנון החיפוש, הקריאה והכתיבה של HBase. כעת נסתכל על מנגנון HBase אשר הופך חיפוש, קריאה וכתיבה מהיר ב- HBase. ראשית, נבין דחיסה , שהוא אחד מאותם מנגנונים.

ארכיטקטורת HBase: דחיסה

HBase משלב HFiles כדי להפחית את האחסון ולהפחית את מספר מחפשי הדיסק הדרושים לקריאה. תהליך זה נקרא דחיסה . דחיסה בוחרת כמה קבצי HF מאזור ומשלבת אותם. ישנם שני סוגים של דחיסה כפי שניתן לראות בתמונה לעיל.

  1. דחיסה קלה : HBase בוחר אוטומטית HFiles קטנים יותר ומתחייב אותם שוב ל- HFiles גדולים כפי שמוצג בתמונה לעיל. זה נקרא דחיסה מינורית. היא מבצעת מיון מיזוג לביצוע HFiles קטנים יותר ל- HFiles גדולים יותר. זה עוזר בייעול שטח האחסון.
  2. דחיסה עיקרית: כפי שמודגם בתמונה לעיל, בדחיסה גדולה, HBase מתמזג ומחייב מחדש את קבצי ה- HF הקטנים יותר של אזור לקובץ HF חדש. בתהליך זה, אותן משפחות טור מוצבות יחד ב- HFile החדש. בתהליך זה הוא מפיל את התא שנמחק ותוקפו. זה מגדיל את ביצועי הקריאה.

אך במהלך התהליך הזה, דיסקי פלט קלט ותעבורת רשת עשויים להיות עמוסים. זה ידוע בשם לכתוב הגברה . לכן, זה בדרך כלל מתוזמן בזמן תזמון עומס שיא נמוך.

כעת תהליך אופטימיזציה של ביצועים נוסף עליו אדון הוא אזור פיצול . זה חשוב מאוד לאיזון עומסים.

ארכיטקטורת HBase: אזור פיצול

האיור שלהלן ממחיש את מנגנון פיצול האזור.

בכל פעם שאזור הופך גדול, הוא מחולק לשני אזורים ילדים, כפי שמוצג באיור לעיל. כל אזור מייצג בדיוק חצי מאזור האם. ואז הדיווח על הפיצול הזה ל- HMaster. זה מטופל על ידי אותו שרת אזור עד שהמסטר מקצה אותם לשרת אזור חדש לצורך איזון עומסים.

בהמשך הדרך, אחרון חביב, אסביר לך כיצד HBase משחזר נתונים לאחר כשל. כידוע שחזור כשל היא תכונה חשובה מאוד של HBase, ובכך הודע לנו כיצד HBase משחזר נתונים לאחר כשל.

ארכיטקטורת HBase: HBase התרסקות ושחזור נתונים

  • בכל פעם שרת אזור נכשל, ZooKeeper מודיע ל- HMaster על הכשל.
  • לאחר מכן HMaster מפיץ ומקצה את האזורים של שרת אזורים שהתרסק לשרתי אזורים פעילים רבים. כדי לשחזר את נתוני ה- MemStore של שרת האזור הכושל, ה- HMaster מפיץ את ה- WAL לכל שרתי האזור.
  • כל שרת אזור מבצע מחדש את ה- WAL כדי לבנות את MemStore עבור משפחת העמודות של האזור שנכשל.
  • הנתונים נכתבים בסדר כרונולוגי (בסדר זמן) ב- WAL. לכן, ביצוע מחדש של WAL פירושו לבצע את כל השינויים שבוצעו ואוחסנו בקובץ MemStore.
  • לכן, אחרי שכל שרתי האזור מבצעים את ה- WAL, נתוני MemStore לכל משפחת העמודות משוחזרים.

אני מקווה שבלוג זה היה עוזר לך להמעיט בערך המודל של HBase Data & HBase Architecture. מקווה שנהנית. עכשיו אתה יכול להתייחס לתכונות של HBase (שהסברתי קודם מדריך HBase בלוג) עם HBase אדריכלות ולהבין כיצד זה עובד באופן פנימי. עכשיו שאתה יודע את החלק התיאורטי של HBase, עליך לעבור לחלק המעשי. כשאנו זוכרים זאת, הבלוג הבא שלנו של יסביר מדגם HBase POC .

כעת לאחר שהבנתם את ארכיטקטורת HBase, בדקו את מאת אדוריקה, חברת למידה מקוונת מהימנה עם רשת של יותר מ -250,000 לומדים מרוצים הפרוסים ברחבי העולם. קורס הכשרת ההסמכה של אדוריקה ביג דאטה Hadoop עוזר ללומדים להיות מומחים בתחום HDFS, Yarn, MapReduce, Pig, Hive, HBase, Oozie, Flume ו- Sqoop תוך שימוש במקרי שימוש בזמן אמת בתחום הקמעונאות, מדיה חברתית, תעופה, תיירות, פיננסים.

יש לך שאלה עבורנו? אנא הזכיר זאת בסעיף ההערות ונחזור אליך.