Skip to content
New issue

Have a question about this project? # for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “#”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? # to your account

【工具自荐】Whisper Notes - 离线音频文本转录(iOS) #3037

Open
mazzzystar opened this issue Apr 5, 2023 · 7 comments
Open

【工具自荐】Whisper Notes - 离线音频文本转录(iOS) #3037

mazzzystar opened this issue Apr 5, 2023 · 7 comments

Comments

@mazzzystar
Copy link

mazzzystar commented Apr 5, 2023

简介

Whisper Notes 是一个离线OpenAI Whisper模型,可以将语音输入以极高的准确率转成文字、支持多语言夹杂。

它是免费的:无内购、无广告、不联网。

补充信息

市场上已经有一些Whisper工具了,为什么我还要做一个呢?需求主要是:

  • 记录梦境:有时我做了个奇特的梦,醒来想记录,但睡眼朦胧很难打字,希望有个工具能快速录入语音并文本化。
  • 回复长消息:有时我需要回复很长的微信,但此时我在街上或在吃饭,在不回复语音消息的情况下,快速回信息。
  • 捕捉灵感:和2类似,有时不方便打字的场合突然有了新念头,想记录下来。

因此,Whisper Notes在准确率和速度之间做了折衷:尽可能使用最大的模型,但速度不至于慢到等几分钟才完成转录。正常情况下,你录入一段语音,等待几秒钟就可以完成。市场上的工具,要么太大(速度慢)、要么太小(准确率低)、要么会上传你的音频。

因为目的是「速记」,所以Whisper Notes的"日记"属性很弱。转录完,文字就会自动复制到剪贴板,你可以粘贴到微信、或真正的日记/Memo软件来整理。

截图

image

@freepoint-jsj
Copy link

没有安卓的吗

@dengshenkk
Copy link

用到了啥16.1+的特性吗? 考虑支持一下15吗?

@mazzzystar
Copy link
Author

没有安卓的吗

应该有人也实现了安卓版离线Whisper,我之前是做算法,很抱歉我只会写一点SwiftUI🤥

@mazzzystar
Copy link
Author

mazzzystar commented Apr 6, 2023

用到了啥16.1+的特性吗? 考虑支持一下15吗?

image

一些实现是不支持15的,不过也许可以换另一种实现来绕过,但最核心的问题是16的Core ML框架相比15.0性能提升很多,支持15.0可能会导致很多人的使用体验不佳。

@dengshenkk
Copy link

了解了~ 暂时不会升级ios版本

@fastfading
Copy link

fastfading commented May 7, 2024

@mazzzystar
你能不能做成输入法, 这样用还是不方便。
Whisper.CPP 是开源的 , 我在想为什么大公司不引入。

@mikedillion
Copy link

我在想为什么大公司不引入

Not all OpenSource licensing is the same.

# for free to join this conversation on GitHub. Already have an account? # to comment
Projects
None yet
Development

No branches or pull requests

6 participants