业务场景:作为全球最大的 B2C 电子商务平台之一,淘宝天猫平台提供了丰富的商品资源,吸引了大量的全球买家和卖家。为了方便开发者接入淘宝平台,淘宝平台提供了丰富的 API 接口,其中商品详情接口是非常重要的一部分。大家有探讨稳定采集淘宝整站实时商品详情数据接口,通过该接口开发者可以更好地了解商品的情况,商品详情详细信息查询,数据参数包括:获取商品列表主图、价格、优惠价、促销价、库存、标题,sku,商品属性,详情描述等页面上有的数据完整解决方案帮助买家更准确地进行商品选购。这个引起了我技术挑战的兴趣。目前,自己做了压测,QPS 高、出滑块概率极低,API 整体稳定,可满足业务场景的性能需求。

一、如何通过手动方式查看淘宝天猫商品评论数据

1.例如我们打开手机淘宝天猫 APP 或者 PC 端,搜索关键词 " 连衣裙 ",随便点击一个宝贝,进入这个商品详情,我们就以推荐的这个商品为例,点击进入商品详情页面的商品数据。

淘宝商品链接采集商品详情页面数据(淘宝商品详情数据接口)_数据采集

  1. 点击鼠标右键可以查看源代码或者按键盘上 F12 拿到的详情页面的评论数据参数,包括商品列表主图、价格、标题,sku,价格、优惠价、促销价、库存、标题,sku,商品属性,详情描述数据等参数。

淘宝商品链接采集商品详情页面数据(淘宝商品详情数据接口)_json_02

二、通过封装接口实现采集数据

taobao.item_review - 获得商品评论数据接口代码演示

1. 请求方式:HTTP POST GET

2.公共参数:

名称

类型

必须

描述

key

String

调用key(必须以GET方式拼接在URL中)

secret

String

调用密钥

api_name

String

API接口名称(包括在请求地址中)[item_search,item_get,item_search_shop等]

cache

String

[yes,no]默认yes,将调用缓存的数据,速度比较快

result_type

String

[json,jsonu,xml,serialize,var_export]返回数据格式,默认为json,jsonu输出的内容中文可以直接阅读

lang

String

[cn,en,ru]翻译语言,默认cn简体中文

version

String

API版本

3.请求参数:

请求参数:num_iid=652874751412&is_promotion=1 
参数说明:num_iid:淘宝商品ID
is_promotion:是否获取取促销价

4.请求示例,支持高并发(CURL、PHP 、PHPsdk 、Java 、C# 、Python...)

# coding:utf-8
"""
Compatible for python2.x and python3.x
requirement: pip install requests
"""
from __future__ import print_function
import requests
# 请求示例 url 默认请求参数已经做URL编码
url== "https://api-vx.Taob/?key=<您自己的apiKey>&secret=<您自己的apiSecret>&num_iid=652874751412&is_promotion=1"
headers = {
    "Accept-Encoding": "gzip",
    "Connection": "close"
}
if __name__ == "__main__":
    r = requests.get(url, headers=headers)
    json_obj = r.json()
    print(json_obj)

5.响应示例(展示部分)

淘宝商品链接采集商品详情页面数据(淘宝商品详情数据接口)_数据采集_03