日々の事柄に関する雑記帳。


ブルーバックス『入門者のPython』 サポートページ


  • 作例
画像ファイルの自動整理Pythonを記述する場所と実行方法
命令文の書き方の基本
ライブラリの使い方
データの扱い方
処理の流れを制御する仕組み
スクレイピングインターネットで通信する方法
Webページからデータを取得する方法
CSVファイル操作の基礎
データ分析データ分析の基礎
グラフの描画方法
  • モジュール
bs4HTMLパーサー
Beautiful Soup 4
csvCSVファイルの読み書き
datetime日付や時刻を操作する。
matplotlibグラフ描画
osOS依存の機能を提供する。
pandasデータ解析支援
requestsHTTPライブラリ
shutil高水準のファイル操作。
  • モジュール読込の書式
書式
import モジュール名
モジュール名.関数名(引数)
  • 内包表記
5.1.3. リストの内包表記
書式
[変数を使った処理 for 変数 in リスト]
  • エラー処理
8. エラーと例外
書式
try:
    通常時の処理
except エラーの種類 as エラー変数:
    エラー時の処理
    print("ERROR", '\n', エラー変数.args)
  • with文
8.5. with 文

  • 記法
定数大文字と_

スクレイピング

Beautiful Soup
select_one指定したCSS id名の要素を返す。単一のHTML中、単一のCSS idは1か所しか存在しない。
select指定したCSS class名の要素を返す。
指定したタグの要素を返す。
単一のHTML中、単一のCSS classは複数個所に存在する。
単一のHTML中、単一のタグは複数個所に存在する。

import bs4
import requests

target_url = 'https://www.wikipedia.org/'
target_id = '#js-link-box-ja'
target_class = '.bookshelf'
target_tag = 'p'

req = requests.get(target_url)
bso = bs4.BeautifulSoup(req.text.encode(req.encoding), 'html.parser')

bso.select_one(target_id)
bso.select(target_class)
bso.select(target_tag)

CSVファイル

import csv

my_data = [
    ['1308', '上場TPX'],
    ['1309', 'NF上証50'],
    ['1320', 'ETF225']]

my_file = open('test.csv', 'a')
my_writer = csv.writer(my_file, delimiter='\t')
my_writer.writerows(my_data)
my_file.close()
タグ

管理人/副管理人のみ編集できます