本项目利用百度翻译 API 和 Python 实现 HTML 网页的翻译,能够保留原始样式。通过对 HTML 文件内容的预处理,去除多余的空白字符和换行,以确保翻译的准确性和完整性。
- 读取和处理 HTML 文件,删除标签内的多余空白和换行。
- 调用百度翻译 API 进行文本翻译。
- 保存翻译后的 HTML 文件,保留原始样式。
- Python 3.x
requests
库beautifulsoup4
库re
库(Python 内置)
在项目目录下运行以下命令安装所需的库:
pip install requests beautifulsoup4
- 将需要翻译的 HTML 文件重命名为
help.html
,并放置在项目根目录下。 - 在代码中配置你的百度翻译 API 的
APP_ID
和SECRET_KEY
。 - 运行
翻译脚本.py
文件,执行翻译操作。
python htmlts.py
- 翻译完成后,结果将保存在
translated_help_preview.html
文件中。
- 处理 HTML 文件:通过正则表达式去除 HTML 标签内部的多余空白和换行。
- 调用翻译 API:使用百度翻译 API 进行文本翻译,并将翻译结果替换原有文本。
- 保存翻译结果:将翻译后的内容保存为新的 HTML 文件,确保格式一致。
- 请确保在调用百度翻译 API 时遵循其使用条款和限制。
- 该项目中未包含对 API 限制的处理,可能会导致请求失败。
欢迎对本项目提出建议或进行贡献,请创建 Issue 或者提交 Pull Request。
本项目采用 MIT 许可证,具体内容请参见 LICENSE 文件。