שאלות ראיון למדע הנתונים של גוגל: כל מה שאתה צריך לדעת כדי לפצח את זה



מאמר זה מספק לך חבורה של ראיון מדע הנתונים של Google Questiosn, את תהליך הראיונות ואת התנאים המוקדמים להגיש מועמדות לעבודה בגוגל.

להתקבל לעבודה בחברה בעלת שם עולמי כמו גוגל היא עבודת חלומות עבור הרבה אנשים. יש להם כמה מדענים מחקרי AI המוכשרים ביותר, ו בעולם. אין הרבה מקורות עבור גוגל שאלות על ראיונות באינטרנט ולא קל להשיג עבודה שם. לכן, אעסוק בנושאים הבאים במאמר זה:

תיאור התפקיד ודרישותיו

עם משכורת ממוצעת של 169,067 דולר , כולל בונוס. משכורת של מדען נתונים של גוגל נעה בין 120,000 $ - 280,000 $ . עם משכורת גבוהה זו, עליכם לדעת את הדרישות הנכונות לתפקיד אותו אתם מגישים. למרות שהדרישות משתנות ממיקום לתפקיד, להלן כמה מהדברים הנפוצים:

דרישה מינימלית:





google

  • תואר שני במשמעת כמותית (סטטיסטיקה, מחקר תפעולי, מדעי המחשב)
  • שנתיים של ניסיון בעבודה בתחום הקשור לניתוח נתונים
  • ניסיון בתוכנה סטטיסטית (למשל, ר , , MATLAB, Pandas) ו-
  • ניסיון בשפות בסיסי נתונים (למשל, SQL )

אחריות:



  • עבוד עם מערכי נתונים גדולים ומורכבים. לפתור בעיות ניתוח קשות ולא שגרתיות, תוך שימוש בשיטות אנליטיות מתקדמות לפי הצורך
  • ניתוח התנהלות הכולל איסוף נתונים ומפרט דרישות, עיבוד, ניתוח, אספקות שוטפות ומצגות
  • בנה צינורות ניתוח אב-טיפוס באופן איטרטיבי כדי לספק תובנות בקנה מידה גדול
  • פיתוח ידע מקיף על מבני הנתונים של Google ומדדים, ודוגל בשינויים במקומות בהם נדרש לפיתוח מוצרים
  • אינטראקציה בין-פונקציונאלית, תוך המלצות עסקיות (למשל, עלות-תועלת, חיזוי, ניתוח ניסויים)
  • חקרו ופיתחו שיטות ניתוח, חיזוי ואופטימיזציה לשיפור איכות המוצרים הפונים למשתמש של גוגל

תהליך הראיונות של מדע הנתונים של גוגל

ניקוי הרשימה הקצרה היא כשלעצמה משימה קשה, שתלויה לחלוטין בך קורות חיים, מכתב נלווה וה ניסיון . גוגל מדע נתונים שאלות ראיון הן תערובת של טיזרי מוח ושאלות טכניות. בדרך כלל, התהליך הראשון הוא ראיון טלפוני.

ראיון טלפוני:

הוא מורכב משאלות המבוססות בעיקר על (קונקרטי ותיאורטי) ומבוסס בכבדות על . השאלות משתנות גם בהתאם לפרויקטים שעבדתם עליהם.
  • תיק 1: הראיונות שאלו אודות טכניקות מיצוי תכונות, PCA (בשימוש בפרויקטים), ניתוח מתאם, כמה טכניקות סיווג שהיו בשימוש (SVM, GBM, רשת עצבית). מדוע לא רגרסיה לוגיסטית, מדוע GBM? - בעיקרון שאלות הסובבות סביב נפרדות מעמדות.
  • מקרה 2: מדוע להשתמש בבחירת תכונות? אם שני מנבאים בקורלציה גבוהה, מה ההשפעה על המקדמים ברגרסיה הלוגיסטית? מהם מרווחי הביטחון של המקדמים?
  • מקרה 3: דיסק מסתובב על ציר ואתה לא יודע לכיוון לאיזה אופן מסתובב הדיסק. מסופקים לך סט סיכות. איך תשתמש בסיכות כדי לתאר באיזה אופן הדיסק מסתובב?
אחרי הראיונות הטלפוניים, זה פנים אל פנים וסיבובי קידוד. אז בואו נדון בכמה משאלות הראיון הנפוצות ביותר בנושא מדע הנתונים של Google. למרות ששאלות אלו לא יכולות להישאל בדיוק כמפורט להלן, ניסיתי לכסות הרבה מהן.

שאלות על ראיון מדע הנתונים של גוגל

שאלות אלו אינן תמוהות, מכיוון שגוגל הפסיקה לשאול את השאלות במקום, ויש להן שאלות דומות להן הן מכנות שאלות לפתרון בעיות . נשאלות הרבה שאלות על למידת מכונה, כל הדרך מהגנריות לפרקטיות. גוגל בעצם מכסה את רוחב הנושאים ולא עומק. שאלה 1. אתה בקזינו ויש לך שתי קוביות לשחק איתן. אתה זוכה ב- $ 10 בכל פעם שאתה מגלם 5. אם אתה משחק עד שאתה מנצח ואז מפסיק, מה התשלום הצפוי? שאלה 2. אתה עומד לעלות למטוס ללונדון, אתה רוצה לדעת אם אתה צריך להביא מטריה או לא. אתה מתקשר לשלושה מחבריך האקראיים וככל אחד מהם אם יורד גשם. ההסתברות שחבר שלך אומר את האמת היא 2/3 וההסתברות שהם מטיפים עליך מתיחה בשקר היא 1/3. אם כל שלושתם מספרים כי יורד גשם, אז מה הסבירות שלמעשה יורד גשם בלונדון. שאלה 3. איך יוסיף חדש פייסבוק חברים למאגר החברים ולקודד את היחסים שלהם לאחרים במאגר? ש 4. איך תבדוק כי ישנה סבירות מוגברת של משתמש להישאר פעיל לאחר 6 חודשים בהתחשב בכך שלמשתמש יש יותר חברים עכשיו? ש 5. מקבלים 40 קלפים בארבעה צבעים שונים - 10 כרטיסים ירוקים, 10 כרטיסים אדומים, 10 כרטיסים כחולים ו -10 כרטיסים צהובים. הקלפים של כל צבע ממוספרים מאחד לעשר. שני קלפים נבחרים באופן אקראי. גלה את ההסתברות שהקלפים שנבחרו אינם מאותו מספר ואותו צבע. ש 6. צור תוכנית בשפה לפי בחירתך לקריאת קובץ טקסט עם ציוצים שונים. הפלט צריך להיות 2 קבצי טקסט - אחד המכיל את רשימת כל המילים הייחודיות בין כל הציוצים יחד עם ספירת המלים החוזרות ונשנות והקובץ השני צריך להכיל את המספר הבינוני של מילים ייחודיות לכל הציוצים. ש 7. מה תעשה אם הסרת ערכים חסרים ממערך נתונים גורמת להטיה? ש 8. דיסק מסתובב על ציר ואתה לא יודע לכיוון לאיזה אופן מסתובב הדיסק. מסופקים לך סט סיכות. איך תשתמש בסיכות כדי לתאר באיזה אופן הדיסק מסתובב? שאלה 9. איך תעצב מנוע המלצה למשרות? ש 10. איזה סוג מוצר אתה רוצה לבנות בגוגל? שאלה 11. מכוניות מושתלות במעקב מהיר, כך שחברות הביטוח יוכלו לעקוב אחר מצב הנהיגה שלנו. על סמך תוכנית חדשה זו, על איזה סוג של שאלות עסקיות ניתן לענות? שאלה 12. איך אתה יכול להחליט אם אלגוריתם אחד טוב יותר מהשני? ש 13. בתיבה יש 12 כרטיסים אדומים ו -12 כרטיסים שחורים. בתיבה אחרת יש 24 כרטיסים אדומים ו -24 כרטיסים שחורים. אתה רוצה למשוך שני קלפים באופן אקראי מאחת משתי התיבות, באיזו תיבה יש סבירות גבוהה יותר לקבל קלפים מאותו צבע ומדוע? ש 14. מה ההבדל בין דגם שקיות לדגם מוגבר? ש 15. אתה יוצר דוח להעלאת תוכן משתמשים מדי חודש ומתבונן בעלייה פתאומית במספר ההעלאות לחודש ינואר. הגידול בהעלאות הוא, במיוחד בהעלאות תמונות. מה לדעתך תהיה הסיבה לכך ואיך תבדוק את הזינוק הפתאומי הזה? ש 16. אתה הבעלים של מפעל בגדים ורוצה לשפר את מקומך בשוק. איך תעשה את זה מגובה הקרקע? ש 17. כיצד תחליט אילו גרסאות של שתי האלגוריתמים לתמחור מדד עובדות טוב יותר עבור כל חברת תעופה? ש 18. מה מידת החופש של לאסו? ש 19. מה ההבדל בין איטרטור, מחולל והבנת רשימה בפייתון? ש 20. בהינתן קבוצה של דפי אינטרנט ושינויים באתר, כיצד תבדוק את תכונת האתר החדשה כדי לקבוע אם השינוי עובד בצורה חיובית? ש 21. בהינתן מטריצת מימד MxN עם כל תא המכיל אלפבית, בדוק אם מחרוזת כלולה בו או לא. ש 22. איך תבנה מערכת מטמון באמצעות מבנה נתונים מתקדם כמו hashmap? ש 23. אם היית יכול להשיג את מערך הנתונים בכל נושא שמעניין, ללא קשר לשיטות האיסוף או למשאבים, כיצד ייראה מערך הנתונים ומה תעשה איתו? ש 24. מהן שיטות גילוי חריגות? ש 25. איך מטמון עובד וכיצד משתמשים בו במדע הנתונים? אז חבר'ה, עם זה אנחנו מגיעים לסוף המאמר הזה. שאלות ראיונות מדע הנתונים של גוגל הן בעיקר מבוסס תרחיש ולדרוש שיש לך יכולות לפתרון בעיות ויותר מכך אתה צריך לדעת כיצד ליישם את מדע הנתונים במצבים אלה. אני מקווה שזה ייתן לך נקודת מבט להיות מוכן לכל ראיון מדעי הנתונים בעתיד. יהיה זה גוגל, מיקרוסופט, אפל או אובר. כל ענקיות הטכנולוגיה שואלות סוגים דומים של שאלות בכל הנוגע למדע נתונים מכיוון שהוא תחום עצום ובו זמנית תחום חדש. גורם לך להיות בקיאים בכלים ובמערכות המשמשים את אנשי מקצוע בתחום מדעי הנתונים. הוא כולל הכשרה בנושא סטטיסטיקה, מדעי נתונים, פייתון, אפאצ'י ספארק וסקאלה, טנסורו וטאבלו. תכנית הלימודים נקבעה על ידי מחקר מקיף על יותר מ -5,000 תיאורי משרות ברחבי העולם. אם יש לך שאלות, אל תהסס להזכיר בסעיף ההערות למטה.