Этот курс покажет, как можно использовать Интернет в качестве источника данных. Мы рассмотрим скрейпинг, парсинг и чтение веб-данных, а также получение доступа к данным с помощью web API. Мы будем работать с форматами данных HTML, XML и JSON на Python. Этот курс будет охватывает главы 11–13 учебника «Python для всех» (Python for Everybody). Чтобы успешно пройти этот курс, вы должны быть знакомы с материалами, изложенными в главах 1–10 учебника и первых двух курсах по данной специализации. Эти темы включают переменные и выражения, условные операторы (циклы, ветвление и исключения: try/except), функции, структуры данных Python (строки, списки, словари и кортежи), а также манипулирование файлами. В этом курсе рассматривается Python 3.
Overview
Syllabus
- Начало работы
- В этом разделе вы установите Python и текстовый редактор. В предыдущих курсах специализации это было необязательно, но в этом классе это станет первым требованием перед началом обучения. С этого момента мы прекращаем использовать среду оценки Python на основе браузера, потому что такая среда (а именно Skulpt) не способна выполнять сложные программы, которые мы будем разрабатывать в ходе этого курса.
- Регулярные выражения (глава 11)
- Регулярные выражения (RegEx) — это специализированный язык, который позволяет быстро искать строки и извлекать данные из них. RegEx — это самостоятельный язык программирования. Изучать регулярные выражения на этом курсе не обязательно, но они представляют собой мощный инструмент и могут принести большую пользу.
- Сети и сокеты (глава 12)
- Из этого раздела вы узнаете о протоколах, которые веб-браузеры используют для получения документов, а также о веб-приложениях, которые используются для взаимодействия с интерфейсами прикладных программ (API).
- Программы для просмотра Интернета (глава 12)
- Из этого раздела вы узнаете, как использовать Python для извлечения данных с веб-сайтов и из API через Интернет.
- Веб-службы и XML (глава 13)
- Из этого раздела вы узнаете, как получать и парсить данные XML (eXtensible Markup Language — расширяемого языка разметки).
- JSON и архитектура REST (глава 13)
- В этом модуле мы работаем с интерфейсами прикладного программирования (API) и веб-службами, используя формат обмена данными JavaScript Object Notation (JSON).
Taught by
Charles Russell Severance