התקן את Hadoop: הגדרת אשכול Hadoop יחיד



מדריך זה הוא מדריך שלב אחר שלב להתקנת אשכול Hadoop ולהגדיר אותו בצומת יחיד. כל שלבי ההתקנה של Hadoop מיועדים למכונת CentOS.

התקן את Hadoop: הגדרת אשכול Hadoop יחיד

מהבלוגים הקודמים שלנו , בטח קיבלת מושג תיאורטי לגבי Hadoop, HDFS והארכיטקטורה שלה.אבל להגיע אתה צריך ידע מעשי טוב.אני מקווה שהיית רוצה את הבלוג הקודם שלנו ב- , עכשיו אני אעביר אותך דרך הידע המעשי אודות Hadoop ו- HDFS. הצעד הראשון קדימה הוא התקנת Hadoop.

ישנן שתי דרכים להתקין את Hadoop, כלומר צומת יחיד ו רב צומת .





אשכול צומת יחיד פירושו רק DataNode אחד שמריץ ומגדיר את כל ה- NameNode, DataNode, ResourceManager ו- NodeManager במחשב יחיד. זה משמש למטרות לימוד ובדיקה. לדוגמא, הבה נבחן מערך נתונים לדוגמא בתוך ענף בריאות. לכן, כדי לבדוק אם עבודות Oozie תכננו את כל התהליכים כמו איסוף, צבירה, אחסון ועיבוד הנתונים ברצף מתאים, אנו משתמשים באשכול צומת יחיד. זה יכול לבדוק בקלות וביעילות את זרימת העבודה הרציפה בסביבה קטנה יותר בהשוואה לסביבות גדולות המכילות טרה-בתים של נתונים המופצים על פני מאות מכונות.

תוך כדי א אשכול רב צומת , פועלים יותר מ- DataNode אחד וכל DataNode פועל במכונות שונות. אשכול רב הצמתים משמש למעשה בארגונים לניתוח ביג דאטה. אם ניקח בחשבון את הדוגמה לעיל, בזמן אמת כאשר אנו מתמודדים עם פטא-בתים של נתונים, יש להפיץ אותו על מאות מכונות שיעובדו. לפיכך, כאן אנו משתמשים באשכול רב צמתים.



בבלוג זה אני אראה לך כיצד להתקין את Hadoop באשכול צומת יחיד.

תנאים מוקדמים

  • תיבה וירטואלית : הוא משמש להתקנת מערכת ההפעלה עליו.
  • מערכת הפעלה : אתה יכול להתקין את Hadoop על מערכות הפעלה מבוססות לינוקס. מאוד משתמשים באובונטו וב- CentOS. במדריך זה אנו משתמשים ב- CentOS.
  • JAVA : עליך להתקין את חבילת Java 8 במערכת שלך.
  • HADOOP : אתה זקוק לחבילה של Hadoop 2.7.3.

התקן את Hadoop

שלב 1: לחץ כאן להורדת חבילת Java 8. שמור קובץ זה בספריית הבית שלך.

שלב 2: חלץ את קובץ ה- Java Tar.

פקודה : tar -xvf jdk-8u101-linux-i586.tar.gz

למרח ג



איור: התקנת Hadoop - חילוץ קבצי Java

שלב 3: הורד את חבילת Hadoop 2.7.3.

פקודה : wget https://archive.apache.org/dist/hadoop/core/hadoop-2.7.3/hadoop-2.7.3.tar.gz

איור: התקנת Hadoop - הורדת Hadoop

שלב 4: חלץ את קובץ הזפת של Hadoop.

פקודה : tar -xvf hadoop-2.7.3.tar.gz

איור: התקנת Hadoop - חילוץ קבצי Hadoop

שלב 5: הוסף את נתיבי Hadoop ו- Java בקובץ ה- bash (.bashrc).

לִפְתוֹחַ . bashrc קוֹבֶץ. כעת הוסף את Hadoop ו- Java Path כפי שמוצג להלן.

פקודה : vi .bashrc

איור: התקנת Hadoop - משתנה סביבת הגדרה

לאחר מכן, שמור את קובץ ה- bash וסגור אותו.

להחלת כל השינויים הללו על הטרמינל הנוכחי, בצע את פקודת המקור.

פקודה : מקור .bashrc

איור: התקנת Hadoop - רענון משתני סביבה

כדי לוודא שג'אווה והדופ הותקנו כהלכה במערכת שלך וניתן לגשת אליהם דרך הטרמינל, למשלבצע את פקודות הגירסה Java ו- Hadoop.

פקודה : ג'אווה-גִרְסָה

איור: התקנת Hadoop - בדיקת גרסת Java

פקודה : hadoopגִרְסָה

איור: התקנת Hadoop - בדיקת גרסת Hadoop

שלב 6 : ערוך את .

פקודה: cd hadoop-2.7.3 / etc / hadoop /

פקודה: ls

כל קבצי התצורה של Hadoop נמצאים ב hadoop-2.7.3 / וכו '/ hadoop בספרייה כפי שניתן לראות בתצלום הבא:

איור: התקנת Hadoop - קבצי תצורה של Hadoop

שלב 7 : לִפְתוֹחַ core-site.xml ולערוך את המאפיין המוזכר למטה בתוך תג התצורה:

core-site.xml מודיע לדמון Hadoop היכן רץ NameNode באשכול. הוא מכיל הגדרות תצורה של ליבת Hadoop כגון הגדרות קלט / פלט המשותפות ל- HDFS & MapReduce.

פקודה : vi core-site.xml

איור: התקנת Hadoop - קביעת תצורה של core-site.xml

fs.default.name hdfs: // localhost: 9000

שלב 8: לַעֲרוֹך hdfs-site.xml ולערוך את המאפיין המוזכר למטה בתוך תג התצורה:

hdfs-site.xml מכיל הגדרות תצורה של הדמונים של HDFS (כלומר NameNode, DataNode, SecondName Name). זה כולל גם את גורם השכפול וגודל החסימה של HDFS.

פקודה : vi hdfs-site.xml

איור: התקנת Hadoop - קביעת תצורה של hdfs-site.xml

dfs.replication 1 dfs.permission false

שלב 9 : ערוך את mapred-site.xml קבץ וערוך את המאפיין המוזכר למטה בתוך תג התצורה:

mapred-site.xml מכיל הגדרות תצורה של יישום MapReduce כמו מספר JVM שיכול לרוץ במקביל, גודל המפות ותהליך המפחית, ליבות מעבד זמינות לתהליך וכו '.

בחלק מהמקרים, קובץ mapred-site.xml אינו זמין. אז עלינו ליצור את הקובץ mapred-site.xmlבאמצעות תבנית mapred-site.xml.

פקודה : cp mapred-site.xml.template mapred-site.xml

פקודה : אָנוּ ממפות-אֲתַר.xml.

איור: התקנת Hadoop - קביעת תצורה של mapred-site.xml

חוט mapreduce.framework.name

שלב 10: לַעֲרוֹך yarn-site.xml ולערוך את המאפיין המוזכר למטה בתוך תג התצורה:

yarn-site.xml מכיל הגדרות תצורה של ResourceManager ו- NodeManager כמו גודל ניהול זיכרון היישומים, הפעולה הנדרשת בתכנית ואלגוריתם וכו '.

פקודה : vi yarn-site.xml

איור: התקנת Hadoop - קביעת תצורה של yarn-site.xml

yarn.nodemanager.aux-services mapreduce_shuffle yarn.nodemanager.auxservices.mapreduce.shuffle.class org.apache.hadoop.mapred.ShuffleHandler

שלב 11: לַעֲרוֹך hadoop- env.sh והוסף את נתיב Java כאמור להלן:

hadoop- env.sh מכיל את משתני הסביבה המשמשים בתסריט להפעלת Hadoop כמו נתיב ביתי של Java וכו '.

פקודה : אָנוּ hadoop-env.ש

איור: התקנת Hadoop - קביעת תצורה של hadoop-env.sh

php להפוך מחרוזת למערך

שלב 12: עבור לספריית הבית של Hadoop ועצב את ה- NameNode.

פקודה : CD

פקודה : cd hadoop-2.7.3

פקודה : bin / hadoop purpose -format

איור: התקנת Hadoop - עיצוב NameNode

זה פורמט HDFS באמצעות NameNode. פקודה זו מבוצעת רק בפעם הראשונה. עיצוב מערכת הקבצים פירושו לאתחל את הספרייה שצוינה על ידי המשתנה dfs.name.dir.

לעולם אל תפרמט את מערכת הקבצים של Hadoop והפעל אותה. תאבד את כל הנתונים המאוחסנים ב- HDFS.

שלב 13: לאחר עיצוב ה- NameNode, עבור לספריית hadoop-2.7.3 / sbin והתחל את כל הדמונים.

פקודה: cd hadoop-2.7.3 / sbin

או שתוכל להתחיל את כל הדמונים בפקודה אחת או לעשות זאת בנפרד.

פקודה: ./ התחל-all.sh

הפקודה הנ'ל היא שילוב של start-dfs.sh, start-yarn.sh & mr-jobhistory-daemon.sh

לחלופין, תוכל להפעיל את כל השירותים בנפרד כמפורט להלן:

התחל שם שם:

ה- NameNode הוא המרכזי במערכת קבצי HDFS. זה שומר על עץ הספריות של כל הקבצים המאוחסנים ב- HDFS ועוקב אחר כל הקבצים המאוחסנים ברחבי האשכול.

פקודה: ./מטרת ההתחלה של hadoop-daemon.sh

איור: התקנת Hadoop - התחלת NameNode

התחל את DataNode:

בעת ההפעלה, DataNode מתחבר ל- Namenode והוא נענה לבקשות ה- Namenode לפעולות שונות.

פקודה: ./hadoop-daemon.sh התחל את ה- datanode

איור: התקנת Hadoop - הפעלת DataNode

התחל את ResourceManager:

ResourceManager הוא המאסטר הבורר את כל משאבי האשכול הזמינים ובכך מסייע בניהול היישומים המבוזרים הפועלים במערכת YARN. עבודתו היא לנהל כל NodeManagers ואת ApplicationMaster של כל יישום.

פקודה: ./חוּט-daemon.sh התחל משאבי משאבים

איור: התקנת Hadoop - הפעלת ResourceManager

התחל את NodeManager:

ה- NodeManager בכל מסגרת מכונה הוא הסוכן שאחראי על ניהול מכולות, מעקב אחר השימוש במשאבים שלהם ודיווח זהה ל- ResourceManager.

פקודה: ./חוּט-daemon.sh התחל מנהל ניוד

איור: התקנת Hadoop - הפעלת NodeManager

התחל את JobHistoryServer:

JobHistoryServer אחראי על טיפול בכל הבקשות הקשורות להיסטוריה של הלקוחות.

פקודה : ./mr-jobhistory-daemon.sh התחל שרת היסטורי

שלב 14: כדי לבדוק שכל שירותי Hadoop פועלים, הפעל את הפקודה למטה.

פקודה: jps

איור: התקנת Hadoop - בדיקת שדים

שלב 15: כעת פתח את דפדפן מוזילה ועבור אל מארח מקומי : 50070 / dfshealth.html כדי לבדוק את ממשק NameNode.

איור: התקנת Hadoop - הפעלת WebUI

מזל טוב, התקנת בהצלחה אשכול Hadoop של צומת יחיד במכה אחת.בבלוג הבא שלנו של , נסקור כיצד להתקין את Hadoop גם באשכול רב-צמתים.

כעת לאחר שהבנת כיצד להתקין את Hadoop, בדוק את מאת אדוריקה, חברת למידה מקוונת מהימנה עם רשת של יותר מ -250,000 לומדים מרוצים הפזורים ברחבי העולם. קורס הכשרת ההסמכה של אדוריקה ביג דאטה Hadoop עוזר ללומדים להיות מומחים בתחום HDFS, Yarn, MapReduce, Pig, Hive, HBase, Oozie, Flume ו- Sqoop תוך שימוש במקרי שימוש בזמן אמת בתחום הקמעונאות, מדיה חברתית, תעופה, תיירות, פיננסים.

יש לך שאלה עבורנו? אנא הזכיר זאת בסעיף ההערות ונחזור אליך.