قبل أن تتمكن من العمل مع البيانات، يجب أن تحصل على بعضها. ستتناول هذه الدورة التدريبية الطرق الأساسية التي يمكن من خلالها الحصول على البيانات. ستتناول الدورة التدريبية كيفية الحصول على بيانات من الويب ومن واجهات برمجة التطبيقات ومن قواعد البيانات ومن الزملاء بتنسيقات مختلفة. كما أنها ستتناول أساسيات تنظيف البيانات وكيفية جعل البيانات "مُرتبة". فالبيانات المرتبة تزيد من سرعة مهام تحليل البيانات النهائية. وكذلك، ستتناول الدورة مكونات مجموعة بيانات كاملة بما في ذلك البيانات الأولية وتعليمات المعالجة وكتب التعليمات البرمجية والبيانات التي تمت معالجتها. ستتناول الدورة التدريبية الأساسيات اللازمة لجمع البيانات وتنظيفها ومشاركتها.
Overview
Syllabus
- الأسبوع الأول
- في هذا الأسبوع الأول من الدورة التدريبية، نلقي نظرة على البحث عن البيانات وقراءة أنواع ملفات مختلفة.
- الأسبوع الثاني
- مرحبًا بك في الأسبوع الثاني من دورة الحصول على البيانات وتنظيفها! يتمثل الهدف الأساسي في تقديم أنظمة تخزين البيانات الأكثر شيوعًا والأدوات المناسبة لاستخراج البيانات من الويب أو من قواعد بيانات مثل MySQL.
- الأسبوع الثالث
- مرحبًا بك في الأسبوع الثالث من دورة الحصول على البيانات وتنظيفها! ستركز المحاضرات هذا الأسبوع على تنظيم البيانات التي جمعتها ودمجها وإدارتها باستخدام المحاضرات من الأسبوعين الأول والثاني.
- الأسبوع الرابع
- مرحبًا بك في الأسبوع الرابع من دورة الحصول على البيانات وتنظيفها! سننهي هذا الأسبوع بمحاضرات حول معالجة النص والتاريخ في R. وفي هذا الأسبوع الأخير، سنركز أيضًا على تقييم الزملاء لمشاريع الدورة التدريبية.
Taught by
Jeff Leek, PhD, Roger D. Peng, PhD and Brian Caffo, PhD