אנו חולקים מספר עצום של רשומות שכר פדרליות

מארק ווילסון / Getty Images

כיום, BuzzFeed News משתפת מערך נתונים עצום - כזה ששופך אור על ארבעה עשורים של שכר הפדרלי של ארצות הברית.

מערך הנתונים מכיל מאות מיליוני שורות ומתפרש כל הדרך חזרה לשנת 1973. הוא מספק משכורת, תואר ודמוגרפיה אודות מיליוני עובדי ממשל בארה'ב, כמו גם נדידותיהם לבירוקרטיה הפדרלית החוצה, ודרך. במקרים רבים, הנתונים מכילים גם שמות עובדים.

את המידע - יותר מ -30 גיגה -בייט שלו - השגנו מהמשרד האמריקאי לניהול כוח אדם, באמצעות חוק חופש המידע (FOIA). כעת, אנו משתפים אותו עם הציבור. אתה יכול להוריד אותו בחינם בארכיון האינטרנט .



זוהי הפעם הראשונה, כך נראה, שנתוני שכר פדרליים כה נרחבים זמינים באופן חופשי באינטרנט, בכמויות גדולות. (ה הוצאת אסברי פארק ו FedsDataCenter.com שניהם מפרסמים מאגרי מידע הניתנים לחיפוש. הם מעולים לגלישה, אך אל תתנו לך להוריד את הנתונים.)

אנו מקווים כי משתמשי מדיניות, סוציולוגים, סטטיסטיקאים, עיתונאים אחרים - או כל אחד אחר, לצורך העניין - ימצאו את הנתונים שימושיים. להלן רק כמה מהשאלות שאולי יעזרו לענות עליהן:

  • כיצד השינויים בתעסוקה הפדרלית בהשוואה לשינויים דמוגרפיים רחבים יותר במדינה?

  • כיצד נראים מסלולי קריירה בממשל הפדרלי?

  • האם לסוכנויות מסוימות יש דלת מסתובבת יותר מאחרות?

  • באילו הופעות פדרליות יש את הביטחון התעסוקתי הטוב ביותר?

  • איזה סוג של עובד סביר שיפרוש במהלך המעבר לנשיאות?

  • האם תוצאות הבריאות יורדות בבתי החולים VA ​​לאחר זינוק בפנסיה או בהתפטרות?

  • האם התפרצויות הסלמונלה פוחתות לאחר ש- USDA שוכר יותר פקחי מזון?

  • האם מנהלי תנועה אווירית צעירים יותר מתואמים עם שיעורי תאונות גבוהים יותר?

אם אתה מוצא משהו מעניין בנתונים, נשמח לשמוע על כך. בינתיים, הנה קצת יותר מידע על מה שפרסמנו:

השגנו את המידע באמצעות שתי בקשות לחוק חופש המידע ל- OPM. נתח הנתונים הראשון, שנמסר בתגובה לבקשה שהוגשה בספטמבר 2014, מכסה את סוף 1973 עד אמצע 2014. השני, שניתן בתגובה לבקשה שהוגשה בדצמבר 2015, מכסה את סוף 2014 עד סוף 2016. הגשנו בקשה שלישית, בהמתנה מול הסוכנות, לעדכן את הנתונים נוספים.

אנו משתפים את הנתונים בפורמט ש- OPM ומשרד הביטחון (ששלחו את הנתונים הנוגעים לעובדיו) סיפקו לנו אותם. השינויים היחידים שביצענו הם לפרוק ולארגן מחדש את הקבצים כך שיהיה קל יותר לגלוש ולהוריד אותם. הנתונים מעוצבים כקובצי טקסט ברוחב קבוע ותוחמי צינורות. אתה אמור להיות מסוגל לטעון אותם לרוב תוכניות מסדי הנתונים והגיליונות האלקטרוניים (אם כי הקבצים הגדולים יותר עשויים לדחוף את Excel לגבולותיו).

תמצא שני סוגי קבצים. אחד עוקב אחר מעמדו של כל עובד פדרלי בסוף כל רבעון פיסקאלי. שאר המסלולים עוקבים אחר כניסות ויציאות, המוכרות בלנגו הביורוקרטי כהצטרפות והפרדות. (נתונים אלה חוזרים רק לשנת 1982.) עבור כל עובד, נתוני הסטטוס כוללים את המידע הבא:

  • שם (למעט יוצאים מן הכלל; ראה להלן)

  • סוֹכְנוּת

  • תת -סוכנות

  • מיקום (רק לרמת המדינה/מדינה בנתונים האחרונים, אך תחנת תפקיד מפורטת יותר לפני כן)

  • כיבוש

  • קטגוריה תעסוקתית

  • גיל (כטווח)

  • רמת השכלה ושנים מאז התואר (כטווח)

  • שכר בסיסי מותאם

  • לשלם תוכנית ולשלם ציון

  • סוג המינוי (למשל, קריירה, לא קבוע, לוח א 'וכו')

  • לוח זמנים לעבודה (למשל, משרה מלאה, עונתית במשרה חלקית וכו ')

  • מעמד פיקוח

לצד הנתונים, פרסמנו גם את התיעוד ש- OPM ומשרד הביטחון סיפקו לנו. (לסקירה מהירה תוכל למצוא פרטים נוספים אודות השדות לעיל ב מילון הנתונים הזה .)

יש כמה סייגים מכריעים לגבי, ומגבלות לגבי הנתונים שאנו משתפים. לדוגמה: בניגוד לנתונים הניתנים לחיפוש דרך העיתונות Asbury Park או ב- FedsDataCenter, הנתונים שקיבלנו אינם כוללים מידע על בונוסים או פיצויים נוספים אחרים.

בין הבקשות הראשונות והשניות שלנו, OPM הודיעה כי היא סבלה מ- פריצת מחשב אדירה . כתוצאה מכך, אמרה לנו הסוכנות, היא לא תפרסם עוד מידע מסוים, כולל מזהה הפסבדו של העובדים שהוביל בעבר לשמות עובדים עם שמות נפוצים.

עוד לפני הפריצה, הממשלה עצרה נתונים על מאות אלפי עובדים. הנתונים אינם מכילים שמות או תחנות חובה לעובדי משרד ההגנה, ה- FBI, השירות החשאי, DEA, מס הכנסה, מנטה אמריקאית או הלשכה לאלכוהול, טבק, כלי נשק וחומרי נפץ. היא גם מונעת שמות ותחנות תפקיד של שוטרי אכיפת חוק, מהנדסי גרעין, חוקרים מסוימים ועוד כמה סוגים של כוח אדם - לא משנה באיזה סוכנות מועסקים אותם. והוא אינו מכיל כלל נתונים על עובדי הבית הלבן, הקונגרס, הרשות השיפוטית, ה- CIA, ה- NSA, שירות החוץ של משרד החוץ, משרד הדואר, משרד התקציבים של הקונגרס, ספריית הקונגרס, הגן הבוטני, ועדת תעלת פנמה, וקומץ גדול של סוכנויות אחרות.

לבסוף, ישנם סימנים לכך ש- OPM מצמצמת את הנתונים שהיא משחררת. מוקדם יותר החודש העיתונות אסברי פארק דיווחו כי הסוכנות סירבה-לראשונה מאז החל העיתון לבקש את הנתונים בשנת 2007-למסור נתונים מסוימים על עובדים העובדים מחוץ ל -50 המדינות או מחוז קולומביה, כמו גם את רוב הבונוסים המבוססים על ביצועים הניתנים לעובדים הפדרליים ב שנת הכספים 2016.

עדכון

מאי. 25, 2017, בשעה 16:09

פוסט זה עודכן כדי לציין כי נתוני ה'סטטוס 'שמסר משרד ההגנה חסרים את הרבעונים הפיסקאליים שהסתיימו בדצמבר 1992 עד ספטמבר 2013.

עדכון

12 ביוני 2017, בשעה 14:18

קיבלנו את הנתונים החסרים ממשרד ההגנה והעלנו אותם, מה שהביא את גודל הרשומות הכולל ליותר מ -33 ג'יגה -בייט. הפוסט עודכן כדי לשקף זאת.