图律脉动项目旨在为下一代图像理解和生成模型提供数据集支撑,将模型的能力原子化,并构建原子能力数据集。
- 数据集:https://www.modelscope.cn/datasets/DiffSynth-Studio/ImagePulse-ChangeAddRemove
- 数据集构建脚本:./scripts/change_add_remove.py
- 数据集:https://www.modelscope.cn/datasets/DiffSynth-Studio/ImagePulse-ZoominZoomout
- 数据集构建脚本:./scripts/zoomin_zoomout.py
- 数据集:https://www.modelscope.cn/datasets/DiffSynth-Studio/ImagePulse-StyleTransfer
- 数据集构建脚本:./scripts/style_transfer.py
- 数据集:https://www.modelscope.cn/datasets/DiffSynth-Studio/ImagePulse-FaceID
- 数据集构建脚本:./scripts/faceid.py
python change_add_remove.py \
--target_dir "data/dataset" \
--cache_dir "data/cache" \
--dashscope_api_key "sk-xxxxxxxxxxxxxxxx" \
--qwenvl_model_id "qwen-vl-max" \
--modelscope_access_token "xxxxxxxxxxxxxxx" \
--modelscope_dataset_id "DiffSynth-Studio/ImagePulse-ChangeAddRemove" \
--num_data 1000000 \
--max_num_files_per_folder 1000
target_dir
: 数据集存储路径cache_dir
: 缓存路径dashscope_api_key
: 百炼 API Key,调用百炼 API 时需填入qwenvl_model_id
: 百炼 上 Qwen-VL 模型的 ID,调用百炼 API 时需填入modelscope_access_token
: 魔搭社区 访问令牌,上传数据集到魔搭社区时需填入modelscope_dataset_id
: 魔搭社区 数据集 ID,上传数据集到魔搭社区时需填入num_data
: 数据样本总量max_num_files_per_folder
: 每个打包文件中的文件数量
- DiffSynth-Studio:为本项目提供 Diffusion 模型推理支持
- 魔搭社区:为本项目提供模型和数据集的存储与下载支持
- 百炼:为本项目提供大型语言模型的推理 API 支持