Automation Lab 2024-02-15

Webスクレイピング入門:BeautifulSoupでデータを抽出する

所要時間
10 MIN
必要環境
Python 3.x, BeautifulSoup
準備

必要なツール

スクレイピングを始めるには、requestsbeautifulsoup4 ライブラリが必要です。

pip install requests beautifulsoup4
01

ステップ 1 基本的なコード

import requests
from bs4 import BeautifulSoup

url = 'https://news.ycombinator.com/'
res = requests.get(url)
soup = BeautifulSoup(res.text, 'html.parser')

# 記事のタイトルを取得して表示
for link in soup.find_all('span', class_='titleline'):
    print(link.text)