Crabgrassbk

Crabgrass page backup crawler

Description

This a crawler to save all created pages within a crabgrass group, intially on riseup.net. It uses selenium webdriver (python dependency) and phantomJS (included).

Features

Can download page images
Can download page attachments
Can generate Zip file package with the backup directory
File extensions for downloadable attachments is configurable

Requirements

Python 3.5
Pip
Check requirements.txt for complete list of requirements

Setup

Get a release package or clone the repository.
Using a virtualenv is strongly recommended.
pip install -r requirements.txt

Execution

Just configure properly the conf/config.yml file and run python crabgrassbk.py

Credits

Written by tupolev for Oficina Precaria Berlín organization.

RiseUpLabs Crabgrass repository: https://0xacab.org/riseuplabs/crabgrass

Rise Up Crabgrass: https://we.riseup.net

License

Crabgrasbk is licensed under the GNU General Public License v3.0

Name		Name	Last commit message	Last commit date
Latest commit History 31 Commits
bin		bin
conf		conf
lib		lib
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
crabgrassbk.py		crabgrassbk.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Crabgrassbk

Crabgrass page backup crawler

Description

Features

Requirements

Setup

Execution

Credits

License

About

Releases 2

Packages

Languages

License

tupolev/crabgrassbk

Folders and files

Latest commit

History

Repository files navigation

Crabgrassbk

Crabgrass page backup crawler

Description

Features

Requirements

Setup

Execution

Credits

License

About

Topics

Resources

License

Stars

Watchers

Forks

Releases 2

Packages 0

Languages

Packages