Skip to content

JayveeHe/TaobaoCrawler

Repository files navigation

TaobaoCrawler

淘宝商品评价的爬虫


淘宝后台更改了一些验证措施,目前本代码已失效

使用方式

依赖该工程或者依赖TaobaoCrawler.jar后,调用RateSpider的静态方法即可。

     /**
     * 根据指定商品页面地址爬取商品评价,在工程目录输出数据文件
     *
     * @param URL
     * @param maxPage 爬取的最大页数,如果为0则无上限
     * @throws IOException
     */
    public static JSONObject getRateByURL(String URL, int maxPage)

####注意事项

  1. 返回的JSON格式
  2. 关于健壮性 还未考虑验证码、封IP、多线程等问题

###最后,有任何问题欢迎讨论

About

淘宝商品评价的爬虫

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages