As data collection has increased exponentially, so has the need for people skilled at using and interacting with data; to be able to think critically, and provide insights to make better decisions and optimize their businesses. This is a data scientist, “part mathematician, part computer scientist, and part trend spotter” (SAS Institute, Inc.). According to Glassdoor, being a data scientist is the best job in America; with a median base salary of $110,000 and thousands of job openings at a time. The skills necessary to be a good data scientist include being able to retrieve and work with data, and to do that you need to be well versed in SQL, the standard language for communicating with database systems.
This course is designed to give you a primer in the fundamentals of SQL and working with data so that you can begin analyzing it for data science purposes. You will begin to ask the right questions and come up with good answers to deliver valuable insights for your organization. This course starts with the basics and assumes you do not have any knowledge or skills in SQL. It will build on that foundation and gradually have you write both simple and complex queries to help you select data from tables. You'll start to work with different types of data like strings and numbers and discuss methods to filter and pare down your results.
You will create new tables and be able to move data into them. You will learn common operators and how to combine the data. You will use case statements and concepts like data governance and profiling. You will discuss topics on data, and practice using real-world programming assignments. You will interpret the structure, meaning, and relationships in source data and use SQL as a professional to shape your data for targeted analysis purposes.
Although we do not have any specific prerequisites or software requirements to take this course, a simple text editor is recommended for the final project. So what are you waiting for? This is your first step in landing a job in the best occupation in the US and soon the world!
Overview
Syllabus
- Erste Schritte sowie Auswählen und Abrufen von Daten mit SQL
- In diesem Modul lernen Sie, SQL zu definieren und zu diskutieren, wie sich SQL von anderen Computersprachen unterscheidet. Sie werden in der Lage sein, die Rollen eines Datenbankadministrators und eines Data Scientist zu vergleichen und die Unterschiede zwischen Eins-zu-eins-, Eins-zu-viele- und Viele-zu-viele-Beziehungen mit Datenbanken zu erklären. Sie werden in der Lage sein, die SELECT-Anweisung zu verwenden und einige grundlegende Syntaxregeln zu erläutern. Sie werden in der Lage sein, Kommentare in Ihren Code einzufügen und dessen Bedeutung zu erfassen.
- Filtern, Sortieren und Berechnen von Daten mit SQL
- In diesem Modul lernen Sie, mehrere neue Klauseln und Operatoren zu verwenden, darunter WHERE, BETWEEN, IN, OR, NOT, LIKE, ORDER BY und GROUP BY. Sie werden in der Lage sein, die Platzhalterfunktion zu nutzen, um nach spezifischeren Datensätzen oder Teilen von Datensätzen zu suchen, einschließlich ihrer Vor- und Nachteile, und wie man sie am besten einsetzt. Sie werden in der Lage sein, die Verwendung grundlegender mathematischer Operatoren sowie von Aggregatfunktionen wie AVERAGE, COUNT, MAX, MIN und anderen zu diskutieren, um mit der Analyse unserer Daten zu beginnen.
- Unterabfragen und Verknüpfungen in SQL
- In diesem Modul lernen Sie, Unterabfragen zu erörtern, einschließlich ihrer Vor- und Nachteile und wann sie zu verwenden sind. Sie können sich an das Konzept eines Schlüsselfeldes erinnern und erörtern, wie diese uns helfen, Daten mit Verknüpfungen zu verknüpfen. Sie werden in der Lage sein, verschiedene Arten von Verknüpfungen zu identifizieren und zu definieren, darunter die kartesische Verknüpfung, die innere Verknüpfung, linke und rechte Verknüpfungen, vollständige äußere Verknüpfungen und die Selbstverknüpfung. Sie werden in der Lage sein, Aliase und Präqualifikatoren zu verwenden, um Ihren SQL-Code ordentlicher und effizienter zu gestalten.
- Ändern und Analysieren von Daten mit SQL
- In diesem Modul werden Sie lernen, wie Sie Zeichenketten durch Verketten, Trimmen, Ändern der Groß- und Kleinschreibung und die Verwendung der Teilzeichenfolgen-Funktion verändern können. Sie werden in der Lage sein, die Datums- und Uhrzeitzeichenfolgen genau zu besprechen. Sie werden in der Lage sein, Case-Anweisungen zu verwenden und dieses Modul mit einer Diskussion über Daten-Governance und Profiling abzuschließen. Sie werden auch in der Lage sein, grundlegende Prinzipien bei der Verwendung von SQL für Data Science anzuwenden. Sie werden in der Lage sein, Tipps und Tricks zu nutzen, um SQL in einem Data-Science-Kontext anzuwenden.
Taught by
Sadie St. Lawrence