Skip to content

Latest commit

 

History

History
29 lines (27 loc) · 3.5 KB

README_Crawler.md

File metadata and controls

29 lines (27 loc) · 3.5 KB

Crawler

Reference - https://blog.csdn.net/hp910315/article/details/83926891

crawler function demo
skcom 群益證券聽牌套件 --
WechatSogou 基于搜狗微信搜索的微信公众号爬虫接口 demo-wechat
DouBanSpider 豆瓣读书的爬虫 http://sobook.lanbing510.info demo-douban
zhihu_spider 知乎爬虫 ----
bilibili-user 🍥 Bilibili 用户爬虫 http://ursb.me/bilibili-report ----
SinaSpider 新浪微博爬虫(Scrapy、Redis) ----
distribute_crawler 使用scrapy,redis, mongodb,graphite实现的一个分布式网络爬虫,底层存储mongodb集群,分布式使用redis实现,爬虫状态显示使用graphite实现 ----
CnkiSpider 中国知网爬虫 ----
LianJiaSpider 链家爬虫 http://lanbing510.info/2016/03/15/Lianjia-Spider.html demo-lianJia
scrapy_jingdong 用scrapy写的京东爬虫 demo-jingdong
QQ-Groups-Spider QQ Groups Spider(QQ 群爬虫) http://kagent.applinzi.com/qqun demo-qqgroup
wooyun_public 乌云公开漏洞、知识库爬虫和搜索 crawl and search for wooyun.org public bug(vulnerability) and drops http://www.wooyun.org demo-wooyun
spider python爬虫 全球网址URL滚动提取 http://www.simapple.com ----
findtrip 机票爬虫(去哪儿和携程网)。flight tickets multiple webspider.(scrapy + selenium + phantomjs + mongodb) ----
163spider 爬取网易客户端内容的小爬虫 ----
QQSpider QQ空间爬虫(日志、说说、个人信息) ----
baidu-music-spider 百度mp3全站爬虫 ----
tbcrawler 淘宝天猫 商品 爬虫 http://heregoo.com/top/1/ ----
stockholm 一个股票数据(沪深)爬虫和选股策略测试框架 ----
BaiduyunSpider 百度云网盘搜索引擎,包含爬虫 & 网站 http://www.githubs.cn ----
Spider 社交数据爬虫 ----
proxy_pool Python爬虫代理IP池(proxy pool) ----
music-163 爬取网易云音乐所有歌曲的评论数 ----