Python[最速]データ収集術


このページは、拙著「Python[最速]データ収集術」の練習用サイトです。本書の内容にそって、是非データ収集を試してみてください。


第3章 データ自動収集のしくみを押さえる

HTMLをダウンロードする

  • 技術評論社のホームページから
    HTMLデータをダウンロードします
>> 技術評論社のホームページへのリンク

データを保存する

  • 画像、PDF、EXCELデータを
    取得・保存します
はじめる

実際にデータを取得する

  • スクレイピング練習用サイトを元に
    一連のデータ取得のプロセスを
    おこないます
>> Books To Scrapeへのリンク
第4章 Pythonでデータを自動で集める

ランキング

  • ノートパソコンの売れ筋ランキングのページから
    ランキングに関するテキストデータを取得します
はじめる

画像

  • メンズファッションのページから
    画像データを取得します
はじめる

メディア

  • メディアサイトの各ページから
    記事データを取得します
>> 技術評論社のホームページへのリンク

Twitter API

  • Twitter APIの利用申請に参考となる
    回答例を掲載しております。
    申請の際にご参考ください。
>> 回答例のページへのリンク