Bright Data で楽天・Amazon.co.jp・Yahoo! を安全にスクレイピングする実践ガイド 2026
Bright Data で国内 EC (楽天・Amazon.co.jp・Yahoo! ショッピング) を安定してスクレイピングする設計指針を、製品選定・モール別 Tips・Dify/n8n 連携・法的注意までまとめて解説。

楽天・Amazon.co.jp・Yahoo! ショッピングを横断して商品データを集めたいが、Datacenter Proxy では数日でブロックされる。Bright Data の Residential / Web Unlocker / Scraping Browser を適材適所で組み合わせれば、月額数万円規模で安定運用は可能です。本記事ではモール別の難易度、製品の使い分け、Dify / n8n との連携、コスト最適化、法的注意点を、弊社の Tra-bell 運用経験をもとに整理します。
なぜ国内 EC のスクレイピングは難しいのか
楽天市場・Amazon.co.jp・Yahoo! ショッピングの 3 モールは、いずれも検索結果ページと商品詳細ページの双方で高度な bot 検知を実装しています。Datacenter IP からのアクセスは数日以内に検知され、CAPTCHA・403・ソフトブロック (常に空の HTML が返る) などで結果的にデータが取れない状況に陥ります。同じ IP から同一商品 URL を毎日同じ時間に叩く、典型的なボットパターンほど詰まりやすいのが実態です。
モール別の難易度感
- Amazon.co.jp: ★★★★★。検索結果と商品詳細の両方で厳格。Cloudflare 系の挙動も混ざるため、Web Unlocker または Scraping Browser がほぼ必須
- 楽天市場: ★★★☆☆。商品詳細単発は Residential 単体で動くことが多いが、検索結果やランキング、レビュー系は Web Unlocker 推奨
- Yahoo! ショッピング: ★★★☆☆。楽天と同程度。IP 回転とリクエスト間隔の制御が鍵
弊社で Tra-bell の関連プロジェクトとして国内 EC のサンプリングを行った経験では、Datacenter Proxy 単体で 1,000 SKU を 1 週間回した場合、有効データの欠損率は 30〜50% に達しました。Residential + Web Unlocker の組み合わせに変えた段階で欠損率は 1〜3% まで下がっています。
公式 API との関係
楽天には Rakuten Web Service、Amazon には Product Advertising API があり、合法的に商品情報を取得する第一選択は API です。一方で、レート制限・取得項目の制約・遅延の問題からビジネス用途では API + スクレイピングのハイブリッド設計を採るケースが多いのが現状です。本記事の手法は API で取れない項目を補う、または社内ベンチマーク用のサンプリング を念頭にしています。商用利用の前に必ず各サイトの利用規約と robots.txt を確認し、Crawl-Delay とレート制限を尊重してください1。
価格モニタリングに特化したアーキテクチャは Bright Data Residential Proxy で価格モニタリング基盤を構築する方法 で詳しく扱っているので、スコープを絞る場合はそちらも参考になります。
Bright Data の製品ラインナップと国内 EC への適合性
Bright Data の主要製品は 8 種類ありますが、国内 EC スクレイピングで実用上使うのは Residential Proxy / Web Unlocker / Scraping Browser の 3 つです。それぞれの位置付けを整理します。
国内 EC でよく使う 3 製品
| 製品 | 主用途 | 国内 EC での適性 | 単価目安 |
|---|---|---|---|
| Residential Proxy | 一般の HTML 取得、検知耐性重視 | 楽天・Yahoo! 商品詳細などの単発取得 | $8.4/GB 前後 |
| Web Unlocker | CAPTCHA・bot 防御を自動突破する API | Amazon.co.jp / 楽天検索結果 | $3/1k req 〜 |
| Scraping Browser | Puppeteer/Playwright 互換のヘッドレスブラウザ | JavaScript 描画が必要なページ | $9/GB 〜 |
使い分けの考え方
- 静的 HTML で完結する商品詳細: Residential Proxy 単体で十分。コスト最安
- 検索結果・ランキング・レビュー一覧: Web Unlocker に切り替えると安定。1k リクエスト単位で課金されるため、対象を絞り込む
- 動的に JavaScript で描画される領域 / カート遷移が必要なケース: Scraping Browser。Puppeteer / Playwright の既存コードをほぼそのまま流用可能2
Bright Data 公式は世界 1.5 億規模の住宅 IP プールを保有しており、195 か国・市区町村単位のターゲティングが可能です。国内 EC スクレイピングでは country=jp を Zone 設定に入れて日本国内 IP に限定するのが基本です。住宅 IP の出所は KYC で担保されており、コンプライアンス観点でも整理しやすい点が利点です。

Residential と ISP プロキシの細かな違いは Bright Data Residential と ISP プロキシの使い分け実践ガイド 2026 でも整理しています。
楽天 / Amazon.co.jp / Yahoo! 各モール別の実装ポイント
3 モール共通の Python サンプル (Web Unlocker 経由) を起点に、各モール固有の注意点を整理します。
共通の Python サンプル (Web Unlocker)
import os
import httpx
PROXY = f"http://{os.environ['BD_USER']}:{os.environ['BD_PASS']}@brd.superproxy.io:33335"
def fetch(url: str) -> str:
with httpx.Client(
proxies={"http://": PROXY, "https://": PROXY},
timeout=30.0,
headers={"User-Agent": "Mozilla/5.0"},
) as client:
r = client.get(url)
r.raise_for_status()
return r.text
このスケルトンを土台にして、モール別の挙動に合わせて User-Agent やヘッダ、待機時間、Web Unlocker の有無を切り替えます。
モール別の Tips
楽天市場 (Rakuten)
- 商品詳細ページ (
item.rakuten.co.jp/<shop>/<itemId>/) は Residential 単体 で 90% 以上の成功率を得やすい - 検索結果と RMS 連動部分は Web Unlocker を併用。検索パラメータは
keywordtags(並び順) に注意 - 公式 API である Rakuten Web Service が使える項目はそちらを優先
Amazon.co.jp
- 検索結果・商品詳細の双方で Web Unlocker または Scraping Browser を推奨
- ASIN は商品詳細 URL から抽出可能 (
/dp/<ASIN>/)。在庫・出品者情報は HTML 構造が頻繁に変わるため、CSS セレクタは定期メンテが必要 - Sponsored 商品とオーガニックは並びが混在するので、
data-component-type属性で識別する
Yahoo! ショッピング
- 商品詳細ページは比較的安定。Residential 単体でも回る
- 検索結果ページの並び順 (オススメ / 価格 / 新着) はクエリパラメータ
sで制御。順序を固定したいなら明示指定 - LOHACO / PayPay モールの商品が混在する点は事前に切り分け
Dify / n8n を使ったオーケストレーション
Bright Data の Web Scraper API は Dify や n8n のような LLM オーケストレーション / ワークフロー基盤と相性が良く、X 上でも実装例が複数共有されています。
DifyJapan の事例では、Dify の知識ベースに Bright Data Web Scraper の出力を流し込み、Amazon の商品情報を LLM で要約する一連のフローが紹介されています。スクレイピング → LLM 整形 → 通知までを 1 つの Dify アプリでまとめられるため、技術担当者でなくても運用画面でフロー編集が可能です。
「n8n と Bright Data を使えば、ローコードで Amazon の商品データを継続的に集められる」(原文: Built an Amazon product scraper with n8n and Bright Data — surprisingly low maintenance)
n8n を使った例では、cron トリガーで日次に Bright Data Web Scraper を呼び、結果を Google Sheets や Notion に流し込む構成が広く採用されています。
社内に Python / インフラの専任が居ない場合でも、Dify / n8n とのハイブリッド設計を採れば PoC を 1 週間程度で立ち上げられます。
コスト最適化と運用ルール
国内 EC スクレイピングは「全モール × 全 SKU × 高頻度」で組むと請求が一気に膨らみます。Bright Data の料金は積み上げ式なので、ターゲットを絞ることが最大の節約になります。
コストを 30〜50% 抑える 5 つの実践
- 段階的フォールバック: 通常は Residential 単体で取得し、403 や CAPTCHA が返ったときだけ Web Unlocker / Scraping Browser に切り替える
- 差分監視への切替: 価格・在庫・ランキングが変化した SKU のみ翌日深掘り取得
- 静的アセットのブロック: 画像・CSS・分析タグはフェッチしない。帯域 50〜70% カット
- 長寿命セッション: 同一 IP を 30 分〜数時間使い回し、ハンドシェイク帯域を削減
- 時間帯の分散: 深夜帯はサイト負荷が低く、成功率が上がる傾向
料金体系全体の整理は Bright Data 料金プラン早見表 2026 でも詳しく扱っています。
弊社が Tra-bell 関連の検証で観測した範囲では、Residential 単体 → Web Unlocker → Scraping Browser の 3 段階フォールバックを組み込んだ設計が、コストと成功率のバランスで最も優れていました。Web Unlocker を全件に使うと費用が想定の 2〜3 倍に膨らみやすい点には注意が必要です。
法的・倫理的注意と弊社の伴走支援
国内 EC のスクレイピングは技術的には可能でも、法的・倫理的に丁寧な設計が必要です。最低限以下を社内で明文化することを推奨します。
最低限のチェックリスト
- 利用規約: 楽天・Amazon・Yahoo! の各モールの利用規約とスクレイピングに関する記述を確認、社内で記録
- robots.txt: 各モールの robots.txt と Crawl-Delay を遵守
- 個人情報の除外: レビュー本文やユーザー名など個人情報を含む項目は取得対象から除外
- 取得目的の明文化: 「公開されている商品情報の業務利用」に限定することを社内ルールに明記
- アクセス頻度の管理: 同一 SKU への日次アクセスは 1〜2 回まで、ピーク時間帯を避ける
GDPR / 個人情報保護法 (改正 APPI) の観点での詳細な整理は Bright Data と GDPR / 個人情報保護法 2026 を参照してください。
弊社では Bright Data の Residential / Web Unlocker を使ったホテル価格追跡サービス Tra-bell を自社運用しており、国内 EC のスクレイピング要件定義 → PoC → 本番運用までを実プロダクトでの運用経験から提供できます。
まとめ
Bright Data を使えば、楽天・Amazon.co.jp・Yahoo! ショッピングの 3 モールを横断したスクレイピングは月額数万円規模で安定稼働が可能です。Amazon は Web Unlocker または Scraping Browser を前提に、楽天と Yahoo! は Residential 単体 + 必要に応じて Web Unlocker、Dify / n8n でオーケストレーションすると PoC は 1 週間で組めます。コスト最適化は段階的フォールバックと差分監視が肝、法的整理は API 一次選択 + 利用規約遵守を前提に進めるのが現実解です。
※情報は 2026-05-21 時点の内容です。最新情報は公式サイトをご確認ください。
※本記事には PR を含みます。
Footnotes
-
経済産業省「電子商取引及び情報財取引等に関する準則」 https://www.meti.go.jp/policy/it_policy/ec/index.html ↩
-
Bright Data 公式 Proxy Networks / Scraping Browser https://brightdata.com/proxy-types ↩
-
Bright Data 公式 Pricing https://brightdata.com/pricing ↩
よくある質問
関連記事


Bright Data Web Unlocker 実践活用ガイド 2026 - CAPTCHA突破とコスト設計

