47
47
- ** 全新升级** :V2版本重构了绝大部分代码,提供焕然一新的界面和更强大的功能。
48
48
- ** 免费** :本项目所有代码开源,完全免费。
49
49
- ** 方便** :解压即用,离线运行,无需网络。
50
- - ** 批量** :支持批量导入处理图片。也可以即时截屏识别。
51
- - ** 高效** :自带高效的离线OCR引擎。只要电脑性能足够,可以比在线OCR服务更快。
50
+ - ** 高效** :自带高效率离线OCR引擎。只要电脑性能足够,可以比在线OCR服务更快。
52
51
- ** 灵活** :支持定制界面,支持命令行、HTTP接口等多种调用方式。
53
52
54
53
@@ -94,6 +93,24 @@ Umi-OCR v2 由一系列灵活好用的标签页组成。您可按照自己的喜
94
93
- 没有数量上限,可一次性导入几百张图片进行任务。
95
94
- 支持任务完成后自动关机/待机。
96
95
96
+ ![ Umi-OCR-批量页-忽略区域.png] ( https://tupian.li/images/2023/10/25/653913ec41fe2.png )
97
+ ** 忽略区域** :一种特殊功能,适用于排除图片中的不想要的文字。
98
+ - 在批量识别页的右栏设置中可进入忽略区域编辑器。
99
+ - 如上方样例,图片顶部和右下角存在多个水印 / LOGO。如果批量识别这类图片,水印会对识别结果造成干扰。
100
+ - 按住右键,绘制多个矩形框。这些区域内的文字将在任务中被忽略。
101
+ - 请尽量将矩形框画得大一些,完全包裹住水印所有可能出现的位置。
102
+
103
+ ---
104
+
105
+ ### 二维码
106
+
107
+ ![ Umi-OCR-二维码页1.png] ( https://tupian.li/images/2023/10/25/653906ae27da1.png )
108
+
109
+ ** 二维码** :这里可以扫码。
110
+ - 支持多种格式的二维码、条形码。
111
+ - 支持一图多码。
112
+ - 可截图/粘贴/拖入本地图片。
113
+
97
114
---
98
115
99
116
### 全局设置
@@ -122,81 +139,9 @@ Umi-OCR v2 由一系列灵活好用的标签页组成。您可按照自己的喜
122
139
123
140
## 调用接口:
124
141
125
- Umi-OCR v2 具有一套强大的命令行控制模式,及开发中的HTTP接口 / Web服务器模式。
126
-
127
- #### 命令行指令
128
-
129
- 命令行调用入口就是主程序 ` Umi-OCR.exe ` 。
130
-
131
- 获取说明:` Umi-OCR.exe --help `
132
-
133
- 输入任意指令时,若系统中没有Umi-OCR服务进程在运行,则会自动启动Umi-OCR主进程。
134
-
135
- #### 快捷指令
136
-
137
- 弹出主窗口:` Umi-OCR.exe --show `
138
-
139
- 隐藏主窗口:` Umi-OCR.exe --hide `
140
-
141
- 关闭软件:` Umi-OCR.exe --quit `
142
-
143
- 截屏并获取OCR结果:` Umi-OCR.exe --screenshot `
144
-
145
- 粘贴图片,并获取OCR结果:` Umi-OCR.exe --clipboard `
146
-
147
- #### 高级指令
148
-
149
- Umi-OCR 允许通过命令行调用每一个标签页(模块)上的任意函数,但是使用门槛较高。
150
-
151
- 如果有需要使用高级指令,请阅读下列说明,仔细编写指令。
152
-
153
- <details >
154
- <summary >展开</summary >
155
-
156
- 查询当前已打开的页面,及可以创建的页面模板:` Umi-OCR.exe --all_pages `
157
-
158
- 根据页面模板序号,创建新标签页:` Umi-OCR.exe --add_page [index] `
159
-
160
- 根据标签页序号,删除已有标签页:` Umi-OCR.exe --del_page [index] `
161
-
162
- > 每个标签页,通常会具有两个模块,一个是py,一个是qml。每个模块上有不同的函数。
163
-
164
- 查询当前已打开的模块:` Umi-OCR.exe --all_modules `
165
-
166
- 查询某个py模块上有什么可调用的函数:` Umi-OCR.exe --call_py [name] `
167
-
168
- 查询某个qml模块上有什么可调用的函数:` Umi-OCR.exe --call_qml [name] `
169
-
170
- > --call指令允许只写模块名的首字母。假设一个qml模块叫 ` ScreenshotOCR_1 ` ,那么 ` --call_qml Scre ` 也可以正确调用。
171
-
172
- 调用py模块上的函数:` Umi-OCR.exe --call_py [name] --func [function] [..paras] `
173
-
174
- 调用qml模块上的函数:` Umi-OCR.exe --call_qml [name] --func [function] [..paras] `
175
-
176
- > 允许在指令最后传入任意个参数,但目前只支持识别为字符串类型。
142
+ - 命令行手册: [ README_CLI.md] ( docs/README_CLI.md )
143
+ - HTTP接口手册: [ README_HTTP.md] ( docs/README_HTTP.md )
177
144
178
- 通过上述的指令调用函数,不会得到函数返回值。因为上述会自动跳转到UI线程运行,避免跨线程调用导致程序崩溃的风险。
179
-
180
- 如果要取得函数返回值,可以加上 ` --thread ` 。如:
181
-
182
- ` Umi-OCR.exe --call_qml [name] --func [function] --thread [..paras] `
183
-
184
- 这样会在子线程同步执行函数,并将返回值输出给命令行。但是子线程执行部分函数可能报错或崩溃。
185
-
186
- > 建议阅读本项目源代码(或发行包中的代码文件)来辅助编写指令。
187
-
188
- </details >
189
-
190
- #### HTTP接口
191
-
192
- 端口号可以在` 全局设置 ` 中查看及修改。请开启` 全局设置 ` 顶部的` 高级 ` 开关。
193
-
194
- 目前仅开放一个接口,用于传输命令行指令。
195
-
196
- - ` POST /argv `
197
- - 参数:一个列表,元素均为字符串,格式与命令行指令一致。
198
- - 如:命令行 ` Umi-OCR.exe --call_qml ScreenshotOCR `
199
- - 等价于: ` POST /argv ["--call_qml", "ScreenshotOCR"] `
200
145
201
146
## 开发计划
202
147
@@ -221,6 +166,8 @@ Umi-OCR 允许通过命令行调用每一个标签页(模块)上的任意函
221
166
- 外置主题文件
222
167
- 字体切换
223
168
- 加载动画
169
+ - 忽略区域。
170
+ - 二维码识别。
224
171
225
172
</details >
226
173
@@ -233,11 +180,9 @@ Umi-OCR 允许通过命令行调用每一个标签页(模块)上的任意函
233
180
- [ ] 快捷键权限优化。
234
181
- [ ] 允许隐藏托盘图标。
235
182
- [ ] 截图联动/截图翻译。
236
- - [ ] 忽略区域。
237
183
- [ ] PDF识别。
238
184
- [ ] 批量识别页面的图片预览窗口。
239
185
- [ ] 高级截图(仿Snipaste,支持贴图)。
240
- - [ ] 完善Web服务器功能。
241
186
242
187
##### 远期计划
243
188
@@ -309,7 +254,7 @@ Umi-OCR
309
254
强烈建议只 clone 主分支,因为某些分支含有体积很大的二进制库,会让你花费很长时间下载。
310
255
311
256
```
312
- git clone --branch main --single-branch git@ github.com: hiroi-sora/Umi-OCR_v2.git
257
+ git clone --branch main --single-branch https:// github.com/ hiroi-sora/Umi-OCR_v2.git
313
258
```
314
259
315
260
### 第二步:运行环境
@@ -321,6 +266,22 @@ Umi-OCR
321
266
322
267
## 更新日志
323
268
269
+ ##### v2.0.0 dev ` 2023.10.25 `
270
+ - 新增:命令行支持传入图片路径。 (#28 )
271
+ - 新增:HTTP接口支持Base64传输图片。 (#28 )
272
+ - 新增:忽略区域功能。
273
+ - 新增:二维码识别页。支持识别多种格式的二维码、条形码。 ([ Umi-OCR #95 ] ( https://github.com/hiroi-sora/Umi-OCR/issues/95 ) )
274
+ - 新增:提供备选启动器` UmiOCR-data/RUN_GUI.bat ` ,供` Umi-OCR.exe ` 不兼容时使用。 (#21 )
275
+ - 优化:图片预览窗口,支持用` Tab ` 切换显示/隐藏文本。
276
+ - 优化:记录面板,每条记录顶部添加复制按钮。 (#32 )
277
+ - 优化:记录面板,拖拽过程中允许指针移出文本框区域。 (#32 )
278
+ - 优化:重新设计截图缓存机制,避免Image组件销毁时的内存泄露。
279
+ - 优化:标签页应用动态解析机制,小幅提高加载速度。
280
+ - 优化:运行环境转为64位包。(计划不再提供对32位的兼容)
281
+ - 修正:配置项中布尔值解析不正确的问题。 (#30 )
282
+ - 修正:拖入非图片文件可能导致卡顿几秒的问题。
283
+ - 修正:PaddleOCR插件的兼容性问题。 ([ Umi-OCR #209 ] ( https://github.com/hiroi-sora/Umi-OCR/issues/209 ) )
284
+
324
285
##### v2.0.0 dev ` 2023.10.18 `
325
286
- 新增:截图前自动隐藏窗口。 (#26 )
326
287
- 新增:更改字体功能。 (#25 )
0 commit comments