公式 API があるのに、なぜスクレイピングする選択肢が必要なのですか？

楽天 Web Service や PA-API (Amazon) はレート制限や取得項目の制約が厳しく、ランキングや一部の属性、レビュー、出品者情報など API では取れない情報が業務に必要なケースが多いためです。商用かつ可能な範囲では API を一次選択にしつつ、補完的にスクレイピングを使う設計が現実解です。利用規約と robots.txt の確認、Crawl-Delay の遵守は前提です。

Dify や n8n と組み合わせるとどのようなメリットがありますか？

ノーコード/ローコードでスクレイピング → 整形 → 保存 → 通知までを 1 つのワークフローに収められるため、PoC や運用試験の立ち上げが大きく短縮されます。Bright Data の Web Scraper API や Web Unlocker をワーカー側で叩き、Dify / n8n がオーケストレーションする構成にすると、技術担当者でなくても運用ダッシュボードでスケジュール調整やリトライ設定を変更できます。

コストはどのくらいに収まりますか？

1,000 SKU × 1 日 1 回 × 主要 3 モールの取得規模で、Residential + Web Unlocker を組み合わせた場合、月額 $80〜250 (約 12,000〜40,000 円) が目安です。Scraping Browser を多用する設計だと $300〜500 規模になることもあります。Datacenter で済む対象を切り分けつつ Web Unlocker は重要 SKU 限定に絞ると、品質を保ちながら 30〜50% のコスト削減が見込めます。

弊社にスクレイピング設計を相談できますか？

はい。スマイルコンフォートは Bright Data 上で自社サービス Tra-bell (ホテル価格追跡) を運用しており、楽天・Amazon・Yahoo! を含む国内 EC のスクレイピング要件定義 → PoC → 本番運用を伴走できます。お問い合わせフォームから「国内 EC スクレイピング基盤の相談」とご記載ください。

記事一覧へ

Bright Data

国内 EC スクレイピング

Amazon.co.jp

楽天市場

Bright Data で楽天・Amazon.co.jp・Yahoo! を安全にスクレイピングする実践ガイド 2026

Bright Data で国内 EC (楽天・Amazon.co.jp・Yahoo! ショッピング) を安定してスクレイピングする設計指針を、製品選定・モール別 Tips・Dify/n8n 連携・法的注意までまとめて解説。

2026年5月21日

約 11 分

本記事にはプロモーション（アフィリエイトリンク）が含まれます。

楽天・Amazon.co.jp・Yahoo! ショッピングを横断して商品データを集めたいが、Datacenter Proxy では数日でブロックされる。Bright Data の Residential / Web Unlocker / Scraping Browser を適材適所で組み合わせれば、月額数万円規模で安定運用は可能です。本記事ではモール別の難易度、製品の使い分け、Dify / n8n との連携、コスト最適化、法的注意点を、弊社の Tra-bell 運用経験をもとに整理します。

なぜ国内 EC のスクレイピングは難しいのか

楽天市場・Amazon.co.jp・Yahoo! ショッピングの 3 モールは、いずれも検索結果ページと商品詳細ページの双方で高度な bot 検知を実装しています。Datacenter IP からのアクセスは数日以内に検知され、CAPTCHA・403・ソフトブロック (常に空の HTML が返る) などで結果的にデータが取れない状況に陥ります。同じ IP から同一商品 URL を毎日同じ時間に叩く、典型的なボットパターンほど詰まりやすいのが実態です。

モール別の難易度感

Amazon.co.jp: ★★★★★。検索結果と商品詳細の両方で厳格。Cloudflare 系の挙動も混ざるため、Web Unlocker または Scraping Browser がほぼ必須
楽天市場: ★★★☆☆。商品詳細単発は Residential 単体で動くことが多いが、検索結果やランキング、レビュー系は Web Unlocker 推奨
Yahoo! ショッピング: ★★★☆☆。楽天と同程度。IP 回転とリクエスト間隔の制御が鍵

弊社で Tra-bell の関連プロジェクトとして国内 EC のサンプリングを行った経験では、Datacenter Proxy 単体で 1,000 SKU を 1 週間回した場合、有効データの欠損率は 30〜50% に達しました。Residential + Web Unlocker の組み合わせに変えた段階で欠損率は 1〜3% まで下がっています。

公式 API との関係

楽天には Rakuten Web Service、Amazon には Product Advertising API があり、合法的に商品情報を取得する第一選択は API です。一方で、レート制限・取得項目の制約・遅延の問題からビジネス用途では API + スクレイピングのハイブリッド設計を採るケースが多いのが現状です。本記事の手法は API で取れない項目を補う、または社内ベンチマーク用のサンプリング を念頭にしています。商用利用の前に必ず各サイトの利用規約と robots.txt を確認し、Crawl-Delay とレート制限を尊重してください¹。

価格モニタリングに特化したアーキテクチャは Bright Data Residential Proxy で価格モニタリング基盤を構築する方法で詳しく扱っているので、スコープを絞る場合はそちらも参考になります。

Bright Data の製品ラインナップと国内 EC への適合性

Bright Data の主要製品は 8 種類ありますが、国内 EC スクレイピングで実用上使うのは Residential Proxy / Web Unlocker / Scraping Browser の 3 つです。それぞれの位置付けを整理します。

国内 EC でよく使う 3 製品

製品	主用途	国内 EC での適性	単価目安
Residential Proxy	一般の HTML 取得、検知耐性重視	楽天・Yahoo! 商品詳細などの単発取得	$8.4/GB 前後
Web Unlocker	CAPTCHA・bot 防御を自動突破する API	Amazon.co.jp / 楽天検索結果	$3/1k req 〜
Scraping Browser	Puppeteer/Playwright 互換のヘッドレスブラウザ	JavaScript 描画が必要なページ	$9/GB 〜

使い分けの考え方

静的 HTML で完結する商品詳細: Residential Proxy 単体で十分。コスト最安
検索結果・ランキング・レビュー一覧: Web Unlocker に切り替えると安定。1k リクエスト単位で課金されるため、対象を絞り込む
動的に JavaScript で描画される領域 / カート遷移が必要なケース: Scraping Browser。Puppeteer / Playwright の既存コードをほぼそのまま流用可能²

Bright Data 公式は世界 1.5 億規模の住宅 IP プールを保有しており、195 か国・市区町村単位のターゲティングが可能です。国内 EC スクレイピングでは country=jp を Zone 設定に入れて日本国内 IP に限定するのが基本です。住宅 IP の出所は KYC で担保されており、コンプライアンス観点でも整理しやすい点が利点です。

Residential / Web Unlocker / Scraping Browser の使い分けマトリクス — 国内 EC モールにおける Bright Data 3 製品の使い分け早見表

Residential と ISP プロキシの細かな違いは Bright Data Residential と ISP プロキシの使い分け実践ガイド 2026 でも整理しています。

楽天 / Amazon.co.jp / Yahoo! 各モール別の実装ポイント

3 モール共通の Python サンプル (Web Unlocker 経由) を起点に、各モール固有の注意点を整理します。

共通の Python サンプル (Web Unlocker)

import os
import httpx

PROXY = f"http://{os.environ['BD_USER']}:{os.environ['BD_PASS']}@brd.superproxy.io:33335"

def fetch(url: str) -> str:
    with httpx.Client(
        proxies={"http://": PROXY, "https://": PROXY},
        timeout=30.0,
        headers={"User-Agent": "Mozilla/5.0"},
    ) as client:
        r = client.get(url)
        r.raise_for_status()
        return r.text

このスケルトンを土台にして、モール別の挙動に合わせて User-Agent やヘッダ、待機時間、Web Unlocker の有無を切り替えます。

モール別の Tips

楽天市場 (Rakuten)

商品詳細ページ (item.rakuten.co.jp/<shop>/<itemId>/) は Residential 単体 で 90% 以上の成功率を得やすい
検索結果と RMS 連動部分は Web Unlocker を併用。検索パラメータは keyword tag s (並び順) に注意
公式 API である Rakuten Web Service が使える項目はそちらを優先

Amazon.co.jp

検索結果・商品詳細の双方で Web Unlocker または Scraping Browser を推奨
ASIN は商品詳細 URL から抽出可能 (/dp/<ASIN>/)。在庫・出品者情報は HTML 構造が頻繁に変わるため、CSS セレクタは定期メンテが必要
Sponsored 商品とオーガニックは並びが混在するので、data-component-type 属性で識別する

Yahoo! ショッピング

商品詳細ページは比較的安定。Residential 単体でも回る
検索結果ページの並び順 (オススメ / 価格 / 新着) はクエリパラメータ s で制御。順序を固定したいなら明示指定
LOHACO / PayPay モールの商品が混在する点は事前に切り分け

Dify / n8n を使ったオーケストレーション

Bright Data の Web Scraper API は Dify や n8n のような LLM オーケストレーション / ワークフロー基盤と相性が良く、X 上でも実装例が複数共有されています。

Dify Japan@DifyJapan

AI_Beginner_Note さんより、「DifyからWebデータを安定して取得するためにBright Data Web Scraperを使ってみた」。 Difyの設定ポイントから、Amazonデータ取得を例にした具体的なスクレイピング手法まで整理された実践的な記事です。 #Qiitaアドカレ #Dify qiita.com/AI_Beginner_No…

DifyJapan の事例では、Dify の知識ベースに Bright Data Web Scraper の出力を流し込み、Amazon の商品情報を LLM で要約する一連のフローが紹介されています。スクレイピング → LLM 整形 → 通知までを 1 つの Dify アプリでまとめられるため、技術担当者でなくても運用画面でフロー編集が可能です。

「n8n と Bright Data を使えば、ローコードで Amazon の商品データを継続的に集められる」(原文: Built an Amazon product scraper with n8n and Bright Data — surprisingly low maintenance)

Failed to render tweet: View on X

n8n を使った例では、cron トリガーで日次に Bright Data Web Scraper を呼び、結果を Google Sheets や Notion に流し込む構成が広く採用されています。

社内に Python / インフラの専任が居ない場合でも、Dify / n8n とのハイブリッド設計を採れば PoC を 1 週間程度で立ち上げられます。

コスト最適化と運用ルール

国内 EC スクレイピングは「全モール × 全 SKU × 高頻度」で組むと請求が一気に膨らみます。Bright Data の料金は積み上げ式なので、ターゲットを絞ることが最大の節約になります。

コストを 30〜50% 抑える 5 つの実践

段階的フォールバック: 通常は Residential 単体で取得し、403 や CAPTCHA が返ったときだけ Web Unlocker / Scraping Browser に切り替える
差分監視への切替: 価格・在庫・ランキングが変化した SKU のみ翌日深掘り取得
静的アセットのブロック: 画像・CSS・分析タグはフェッチしない。帯域 50〜70% カット
長寿命セッション: 同一 IP を 30 分〜数時間使い回し、ハンドシェイク帯域を削減
時間帯の分散: 深夜帯はサイト負荷が低く、成功率が上がる傾向

料金体系全体の整理は Bright Data 料金プラン早見表 2026 でも詳しく扱っています。

弊社が Tra-bell 関連の検証で観測した範囲では、Residential 単体 → Web Unlocker → Scraping Browser の 3 段階フォールバックを組み込んだ設計が、コストと成功率のバランスで最も優れていました。Web Unlocker を全件に使うと費用が想定の 2〜3 倍に膨らみやすい点には注意が必要です。

法的・倫理的注意と弊社の伴走支援

国内 EC のスクレイピングは技術的には可能でも、法的・倫理的に丁寧な設計が必要です。最低限以下を社内で明文化することを推奨します。

最低限のチェックリスト

利用規約: 楽天・Amazon・Yahoo! の各モールの利用規約とスクレイピングに関する記述を確認、社内で記録
robots.txt: 各モールの robots.txt と Crawl-Delay を遵守
個人情報の除外: レビュー本文やユーザー名など個人情報を含む項目は取得対象から除外
取得目的の明文化: 「公開されている商品情報の業務利用」に限定することを社内ルールに明記
アクセス頻度の管理: 同一 SKU への日次アクセスは 1〜2 回まで、ピーク時間帯を避ける

GDPR / 個人情報保護法 (改正 APPI) の観点での詳細な整理は Bright Data と GDPR / 個人情報保護法 2026 を参照してください。

弊社では Bright Data の Residential / Web Unlocker を使ったホテル価格追跡サービス Tra-bell を自社運用しており、国内 EC のスクレイピング要件定義 → PoC → 本番運用までを実プロダクトでの運用経験から提供できます。

まとめ

Bright Data を使えば、楽天・Amazon.co.jp・Yahoo! ショッピングの 3 モールを横断したスクレイピングは月額数万円規模で安定稼働が可能です。Amazon は Web Unlocker または Scraping Browser を前提に、楽天と Yahoo! は Residential 単体 + 必要に応じて Web Unlocker、Dify / n8n でオーケストレーションすると PoC は 1 週間で組めます。コスト最適化は段階的フォールバックと差分監視が肝、法的整理は API 一次選択 + 利用規約遵守を前提に進めるのが現実解です。

※情報は 2026-05-21 時点の内容です。最新情報は公式サイトをご確認ください。

※本記事には PR を含みます。

経済産業省「電子商取引及び情報財取引等に関する準則」 https://www.meti.go.jp/policy/it_policy/ec/index.html ↩
Bright Data 公式 Proxy Networks / Scraping Browser https://brightdata.com/proxy-types ↩
Bright Data 公式 Pricing https://brightdata.com/pricing ↩

よくある質問

Amazon.co.jp の方が明確に難易度が高く、商品検索結果ページや詳細ページの双方で高度な bot 検知が動いています。Bright Data の Web Unlocker や Scraping Browser を前提に組むのが現実的です。楽天市場は商品詳細単発であれば Residential Proxy 単体でも回せるケースがありますが、検索結果や RMS 連動部分は Web Unlocker を併用する方が安定します。Yahoo! ショッピングは楽天と同程度の難易度感です。

Bright DataResidential Proxy

Bright Data で楽天・Amazon.co.jp・Yahoo! を安全にスクレイピングする実践ガイド 2026