赞
踩
采集商品列表和商品详情遇到滑块验证码的解决方法(带SKU和商品描述,可高并发)
大家都知道,电商平台反爬虫机制十分严,而很多时候,没办法高效的拿到数据内容响应终端需求,而依赖爬虫就会造成动不动就出现滑块验证,让人很无解,正好,公司有这样的需求,让我负责解决这个问题,我已经把该方法封装成接口,只需要把要得到的商品ID,传给我就可以,然后及时的响应你的数据内容 需求,可满足多种常见场景操作,可获取淘宝详情、商品原价、促销价、实时销量、库存、视频主图等,具体方式如下:
1.请求方式:POST GET HTTP 请求URL地址 获取API测试账号
2.通用参数说明
version:API版本
key:调用key,测试key:test_api_key (复制v:Taobaoapi2014 )
secret:调用secret,测试secret:(不用填写)
cache:[yes,no]默认yes,将调用缓存的数据,速度比较快
result_type:[json,xml,serialize,var_export]返回数据格式,默认为json
lang:[cn,en,ru] 翻译语言,默认cn简体中文
secret:密钥
通过该接口操作可以拿到商品详情页面上所有有的数据参数:商品标题,价格,优惠价,图片,视频,sku属性,sku库存,促销消息,商品销量,优惠券,详情描述等。
3.请求代码示例,支持高并发请求(CURL、PHP 、PHPsdk 、Java 、C# 、Python...)
- import java.io.BufferedReader;
- import java.io.IOException;
- import java.io.InputStream;
- import java.io.InputStreamReader;
- import java.io.Reader;
- import java.net.URL;
- import java.nio.charset.Charset;
- import org.json.JSONException;
- import org.json.JSONObject;
- import java.io.PrintWriter;
- import java.net.URLConnection;
-
- public class Example {
- private static String readAll(Reader rd) throws IOException {
- StringBuilder sb = new StringBuilder();
- int cp;
- while ((cp = rd.read()) != -1) {
- sb.append((char) cp);
- }
- return sb.toString();
- }
- public static JSONObject postRequestFromUrl(String url, String body) throws IOException, JSONException {
- URL realUrl = new URL(url);
- URLConnection conn = realUrl.openConnection();
- conn.setDoOutput(true);
- conn.setDoInput(true);
- PrintWriter out = new PrintWriter(conn.getOutputStream());
- out.print(body);
- out.flush();
- InputStream instream = conn.getInputStream();
- try {
- BufferedReader rd = new BufferedReader(new InputStreamReader(instream, Charset.forName("UTF-8")));
- String jsonText = readAll(rd);
- JSONObject json = new JSONObject(jsonText);
- return json;
- } finally {
- instream.close();
- }
- }
- public static JSONObject getRequestFromUrl(String url) throws IOException, JSONException {
- URL realUrl = new URL(url);
- URLConnection conn = realUrl.openConnection();
- InputStream instream = conn.getInputStream();
- try {
- BufferedReader rd = new BufferedReader(new InputStreamReader(instream, Charset.forName("UTF-8")));
- String jsonText = readAll(rd);
- JSONObject json = new JSONObject(jsonText);
- return json;
- } finally {
- instream.close();
- }
- }
- public static void main(String[] args) throws IOException, JSONException {
- // 请求示例 url 默认请求参数已经URL编码处理
- String url = "https://api-vixi.Taobaoapi2014.cn/taobao/item_get/?key=<您自己的apiKey>&secret=<您自己的apiSecret>&imgid=http://g-search3.alicdn.com/img/bao/uploaded/i4/O1CN01IDpcD81zHbpHs1YgT_!!2200811456689.jpg&cat=";
- JSONObject json = getRequestFromUrl(url);
- System.out.println(json.toString());
- }
-
- }
4.响应参数 (查看调用接口sdk )
名称 | 类型 | 必须 | 示例值 | 描述 |
---|---|---|---|---|
item | item[] | 1 | 宝贝详情数据 | |
num_iid | Bigint | 1 | 19970108018 | 宝贝ID |
title | String | 1 | 三刃木折叠刀过安检创意迷你钥匙扣钥匙刀军刀随身多功能小刀包邮 | 宝贝标题 |
desc_short | String | 0 | 商品简介 | |
promotion_price | Int | 0 | 优惠价 | |
price | Float | 1 | 25.8 | 价格 |
total_price | Float | 0 | 0 | |
suggestive_price | Float | 0 | 0 | |
orginal_price | String | 0 | 25.80 | 原价 |
nick | String | 0 | 欢乐购客栈 | 掌柜昵称 |
num | Int | 0 | 3836 | 库存 |
min_num | Int | 0 | 0 | 最小购买数 |
detail_url | String | 0 | http://item.taobao.com/item.htm?id=520813250866 | 宝贝链接 |
pic_url | String | 1 | //gd2.alicdn.com/imgextra/i4/2596264565/TB2p30elFXXXXXQXpXXXXXXXXXX_!!2596264565.jpg | 宝贝图片 |
brand | String | 0 | 三刃木 | 品牌名称 |
brandId | Int | 0 | 8879363 | 品牌ID |
rootCatId | Int | 0 | 50013886 | 顶级分类ID |
cid | Int | 1 | 50014822 | |
crumbs | Mix | 0 | [] | 导航菜单 |
created_time | String | 0 | ||
modified_time | String | 0 | ||
delist_time | String | 0 | ||
desc | String | 0 | 商品详情 | |
desc_img | Mix | 0 | [] | 商品详情图片 |
item_imgs | Mix | 0 | item_imgs[] | 商品图片 |
item_weight | String | 0 | ||
item_size | String | 0 | ||
location | String | 0 | 发货地 | |
express_fee | Float | 0 | 0.00 | 快递费用 |
ems_fee | Float | 0 | EMS费用 | |
post_fee | Float | 0 | 物流费用 | |
shipping_to | String | 0 | 发货至 | |
has_discount | Boolean | 0 | false | 是否有优惠 |
video | video[] | 0 | 商品视频 | |
is_virtual | String | 0 | ||
sample_id | String | 0 | 商品风格标识ID | |
is_promotion | Boolean | 0 | false | 是否促销 |
props_name | String | 0 | 1627207:1347647754:颜色分类:长方形带开瓶器+送工具刀卡+链子;1627207:1347647753:颜色分类:椭圆形带开瓶器+送工具刀卡+链子; | 商品属性名。格式为pid1:vid1:name1:value1;pid1:vid2:name2:value2。 |
prop_imgs | prop_imgs[] | 0 | 商品属性图片列表 | |
property_alias | String | 0 | 20509:9974422:36;1627207:28326:红色;20509:9975710:38;1627207:28326:红色;20509:9981357:40;1627207:28326:红色 | 销售属性值别名。格式为pid1:vid1:alias1;pid1:vid2:alia2。 |
props | Mix | 0 | [{ "name": "产地","value": "中国" }] | 商品属性 |
total_sold | Int | 0 | ||
skus | skus[] | 0 | 商品规格信息列表 | |
seller_id | Int | 0 | 2844096782 | 卖家ID |
sales | Int | 0 | 138 | 销量 |
shop_id | Int | 0 | 151372205 | 店铺ID |
props_list | Mix | 0 | {20509:9974422: 尺码:36} | 商品属性 |
seller_info | seller_info[] | 1 | 卖家信息 | |
tmall | Boolean | 0 | false | 是否天猫 |
error | String | 0 | 错误信息 | |
warning | String | 0 | 警告信息 | |
url_log | Mix | 0 | [] | |
favcount | Int | 0 | 0 | |
fanscount | Int | 0 | 0 | |
method | String | 0 | item_tmall:pget_item | |
promo_type | String | 0 | ||
props_img | Mix | 0 | 1627207:28326": "//img.alicdn.com/imgextra/i2/2844096782/O1CN01VrjpXt1zyCc9DvERE_!!2844096782.jpg | 属性图片 |
shop_item | Mix | 0 | [] | |
relate_items | Mix | 0 | [] |
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。