Skip to content

Commit 306f93e

Browse files
committed
update 20231025
1 parent a2849c8 commit 306f93e

File tree

2 files changed

+41
-80
lines changed

2 files changed

+41
-80
lines changed

README.md

+40-79
Original file line numberDiff line numberDiff line change
@@ -47,8 +47,7 @@
4747
- **全新升级**:V2版本重构了绝大部分代码,提供焕然一新的界面和更强大的功能。
4848
- **免费**:本项目所有代码开源,完全免费。
4949
- **方便**:解压即用,离线运行,无需网络。
50-
- **批量**:支持批量导入处理图片。也可以即时截屏识别。
51-
- **高效**:自带高效的离线OCR引擎。只要电脑性能足够,可以比在线OCR服务更快。
50+
- **高效**:自带高效率离线OCR引擎。只要电脑性能足够,可以比在线OCR服务更快。
5251
- **灵活**:支持定制界面,支持命令行、HTTP接口等多种调用方式。
5352

5453

@@ -94,6 +93,24 @@ Umi-OCR v2 由一系列灵活好用的标签页组成。您可按照自己的喜
9493
- 没有数量上限,可一次性导入几百张图片进行任务。
9594
- 支持任务完成后自动关机/待机。
9695

96+
![Umi-OCR-批量页-忽略区域.png](https://tupian.li/images/2023/10/25/653913ec41fe2.png)
97+
**忽略区域**:一种特殊功能,适用于排除图片中的不想要的文字。
98+
- 在批量识别页的右栏设置中可进入忽略区域编辑器。
99+
- 如上方样例,图片顶部和右下角存在多个水印 / LOGO。如果批量识别这类图片,水印会对识别结果造成干扰。
100+
- 按住右键,绘制多个矩形框。这些区域内的文字将在任务中被忽略。
101+
- 请尽量将矩形框画得大一些,完全包裹住水印所有可能出现的位置。
102+
103+
---
104+
105+
### 二维码
106+
107+
![Umi-OCR-二维码页1.png](https://tupian.li/images/2023/10/25/653906ae27da1.png)
108+
109+
**二维码**:这里可以扫码。
110+
- 支持多种格式的二维码、条形码。
111+
- 支持一图多码。
112+
- 可截图/粘贴/拖入本地图片。
113+
97114
---
98115

99116
### 全局设置
@@ -122,81 +139,9 @@ Umi-OCR v2 由一系列灵活好用的标签页组成。您可按照自己的喜
122139

123140
## 调用接口:
124141

125-
Umi-OCR v2 具有一套强大的命令行控制模式,及开发中的HTTP接口 / Web服务器模式。
126-
127-
#### 命令行指令
128-
129-
命令行调用入口就是主程序 `Umi-OCR.exe`
130-
131-
获取说明:`Umi-OCR.exe --help`
132-
133-
输入任意指令时,若系统中没有Umi-OCR服务进程在运行,则会自动启动Umi-OCR主进程。
134-
135-
#### 快捷指令
136-
137-
弹出主窗口:`Umi-OCR.exe --show`
138-
139-
隐藏主窗口:`Umi-OCR.exe --hide`
140-
141-
关闭软件:`Umi-OCR.exe --quit`
142-
143-
截屏并获取OCR结果:`Umi-OCR.exe --screenshot`
144-
145-
粘贴图片,并获取OCR结果:`Umi-OCR.exe --clipboard`
146-
147-
#### 高级指令
148-
149-
Umi-OCR 允许通过命令行调用每一个标签页(模块)上的任意函数,但是使用门槛较高。
150-
151-
如果有需要使用高级指令,请阅读下列说明,仔细编写指令。
152-
153-
<details>
154-
<summary>展开</summary>
155-
156-
查询当前已打开的页面,及可以创建的页面模板:`Umi-OCR.exe --all_pages`
157-
158-
根据页面模板序号,创建新标签页:`Umi-OCR.exe --add_page [index]`
159-
160-
根据标签页序号,删除已有标签页:`Umi-OCR.exe --del_page [index]`
161-
162-
> 每个标签页,通常会具有两个模块,一个是py,一个是qml。每个模块上有不同的函数。
163-
164-
查询当前已打开的模块:`Umi-OCR.exe --all_modules`
165-
166-
查询某个py模块上有什么可调用的函数:`Umi-OCR.exe --call_py [name]`
167-
168-
查询某个qml模块上有什么可调用的函数:`Umi-OCR.exe --call_qml [name]`
169-
170-
> --call指令允许只写模块名的首字母。假设一个qml模块叫 `ScreenshotOCR_1` ,那么 `--call_qml Scre` 也可以正确调用。
171-
172-
调用py模块上的函数:`Umi-OCR.exe --call_py [name] --func [function] [..paras]`
173-
174-
调用qml模块上的函数:`Umi-OCR.exe --call_qml [name] --func [function] [..paras]`
175-
176-
> 允许在指令最后传入任意个参数,但目前只支持识别为字符串类型。
142+
- 命令行手册: [README_CLI.md](docs/README_CLI.md)
143+
- HTTP接口手册: [README_HTTP.md](docs/README_HTTP.md)
177144

178-
通过上述的指令调用函数,不会得到函数返回值。因为上述会自动跳转到UI线程运行,避免跨线程调用导致程序崩溃的风险。
179-
180-
如果要取得函数返回值,可以加上 `--thread` 。如:
181-
182-
`Umi-OCR.exe --call_qml [name] --func [function] --thread [..paras]`
183-
184-
这样会在子线程同步执行函数,并将返回值输出给命令行。但是子线程执行部分函数可能报错或崩溃。
185-
186-
> 建议阅读本项目源代码(或发行包中的代码文件)来辅助编写指令。
187-
188-
</details>
189-
190-
#### HTTP接口
191-
192-
端口号可以在`全局设置`中查看及修改。请开启`全局设置`顶部的`高级`开关。
193-
194-
目前仅开放一个接口,用于传输命令行指令。
195-
196-
- `POST /argv`
197-
- 参数:一个列表,元素均为字符串,格式与命令行指令一致。
198-
- 如:命令行 `Umi-OCR.exe --call_qml ScreenshotOCR`
199-
- 等价于: `POST /argv ["--call_qml", "ScreenshotOCR"]`
200145

201146
## 开发计划
202147

@@ -221,6 +166,8 @@ Umi-OCR 允许通过命令行调用每一个标签页(模块)上的任意函
221166
- 外置主题文件
222167
- 字体切换
223168
- 加载动画
169+
- 忽略区域。
170+
- 二维码识别。
224171

225172
</details>
226173

@@ -233,11 +180,9 @@ Umi-OCR 允许通过命令行调用每一个标签页(模块)上的任意函
233180
- [ ] 快捷键权限优化。
234181
- [ ] 允许隐藏托盘图标。
235182
- [ ] 截图联动/截图翻译。
236-
- [ ] 忽略区域。
237183
- [ ] PDF识别。
238184
- [ ] 批量识别页面的图片预览窗口。
239185
- [ ] 高级截图(仿Snipaste,支持贴图)。
240-
- [ ] 完善Web服务器功能。
241186

242187
##### 远期计划
243188

@@ -309,7 +254,7 @@ Umi-OCR
309254
强烈建议只 clone 主分支,因为某些分支含有体积很大的二进制库,会让你花费很长时间下载。
310255

311256
```
312-
git clone --branch main --single-branch git@github.com:hiroi-sora/Umi-OCR_v2.git
257+
git clone --branch main --single-branch https://github.com/hiroi-sora/Umi-OCR_v2.git
313258
```
314259

315260
### 第二步:运行环境
@@ -321,6 +266,22 @@ Umi-OCR
321266

322267
## 更新日志
323268

269+
##### v2.0.0 dev `2023.10.25`
270+
- 新增:命令行支持传入图片路径。 (#28)
271+
- 新增:HTTP接口支持Base64传输图片。 (#28)
272+
- 新增:忽略区域功能。
273+
- 新增:二维码识别页。支持识别多种格式的二维码、条形码。 ([Umi-OCR #95](https://github.com/hiroi-sora/Umi-OCR/issues/95))
274+
- 新增:提供备选启动器`UmiOCR-data/RUN_GUI.bat`,供`Umi-OCR.exe`不兼容时使用。 (#21)
275+
- 优化:图片预览窗口,支持用`Tab`切换显示/隐藏文本。
276+
- 优化:记录面板,每条记录顶部添加复制按钮。 (#32)
277+
- 优化:记录面板,拖拽过程中允许指针移出文本框区域。 (#32)
278+
- 优化:重新设计截图缓存机制,避免Image组件销毁时的内存泄露。
279+
- 优化:标签页应用动态解析机制,小幅提高加载速度。
280+
- 优化:运行环境转为64位包。(计划不再提供对32位的兼容)
281+
- 修正:配置项中布尔值解析不正确的问题。 (#30)
282+
- 修正:拖入非图片文件可能导致卡顿几秒的问题。
283+
- 修正:PaddleOCR插件的兼容性问题。 ([Umi-OCR #209](https://github.com/hiroi-sora/Umi-OCR/issues/209))
284+
324285
##### v2.0.0 dev `2023.10.18`
325286
- 新增:截图前自动隐藏窗口。 (#26)
326287
- 新增:更改字体功能。 (#25)

UmiOCR-data/version.py

+1-1
Original file line numberDiff line numberDiff line change
@@ -9,6 +9,6 @@
99
# 预发布阶段
1010
PRE_RELEASE = "dev"
1111
# 预发布版本号
12-
PRE_RELEASE_VERSION = 20231018
12+
PRE_RELEASE_VERSION = 20231025
1313

1414
# TODO: 补充更多信息

0 commit comments

Comments
 (0)