Skip to content
This repository has been archived by the owner on Jun 5, 2023. It is now read-only.
hygkui edited this page Jan 19, 2015 · 1 revision

Welcome to the n-jd wiki!


#1 项目描述

通过指定一个列表的关键字可以搜索该专题列表下指定数量的图书信息。
例如:

关键字为儿童绘本,指定数量为1000本.

返回儿童绘本分类下的1000本图书的json信息,并将其写入DB中。
并将该过程动态显示在页面上(图书的名称,图片信息等),一并显示提取信息不完整的条目。

#2 主要过程

首先从JD.COM的高级搜索页面,分析其路由地址接口参数等,构造指定关键字的get地址的网页信息,对网页的数据进行解析,通过正则表达式对网页的数据进行提纯,获取列表中的每一本书的地址,再对该地址的页面进行解析,获取该书的数据,并将数据写入DB。

在解析的过程中,输出的成功与否以及提示警告信息同步输出在网页中。

#3 其他

暂不表。

Clone this wiki locally