What you'll learn:
- seleniumを用いてテキスト情報を抽出することができるようになります。
- seleniumを用いて自動でログインすることができるようになります。
- Webページからテキスト情報を取得することができるようになります。
- Pillowを用いてPythonで画像を扱うことができるようになります。
- ランキング形式のサイトからまとめて情報を収集することができるようになります。
- Pandasを用いてデータを整理し、CSVへの掃き出しをできるようになります。
受講生8,000人を超えるキカガク講師によるPythonによるWebスクレイピング入門が登場。
PythonによるWebスクレイピングの実装方法を学び、定期的なデータの収集を効率化しましょう。
Webスクレイピングとは、定期的な情報収集、大量の情報収集であれば、数行のコードを書くだけで自動で行ってくれる便利テクニックです。
このWebスクレイピング技術を用いることで、業務の効率化への第一歩を踏み出していきましょう。
【コース概要】
以下、本コースで扱う大枠の内容となっております。
Webページに自動でログイン
テキストデータを取得
ランキング形式のサイトから一括で情報を取得
画像データを取得
まとめた情報をCSVファイルに出力
検索サイトのクエリを把握
本講座では、講師自作のWebページを用いてWebスクレイピングを行います。
画像処理ライブラリであるPillowやスクレイピング・クローリングライブラリであるSeleniumの導入についても解説します。
【注意】
本講座はWebスクレイピング初学者向けであり、Webスクレイピングの基礎をしっかりと身につけていただきたいので高度な内容は抑えております。
しっかりとカリキュラムをご覧になった上でご受講ください。
HTML, CSSの基礎的な知識がある前提で講座を進めております。
理解できていない方はprogateで勉強してから受講してください。
Pythonの基本的な文法、Jupyter Notebookの使い方がわかる前提で講座を進めております。
理解できていない方は以下2つの動画(Udemy)で勉強してから受講してください。
【キカガク流】人工知能・機械学習 脱ブラックボックス講座 - 初級編 -
【キカガク流】プログラミング力向上のためのPythonで学ぶアルゴリズム論(前編)