Skip to content
New issue

Have a question about this project? # for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “#”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? # to your account

lrc歌词相关编码没有适配 #4

Open
dylanZk1 opened this issue Aug 13, 2023 · 9 comments
Open

lrc歌词相关编码没有适配 #4

dylanZk1 opened this issue Aug 13, 2023 · 9 comments

Comments

@dylanZk1
Copy link

dylanZk1 commented Aug 13, 2023

lrc编码集需新增:EUC-JP(最急),IBM852,Big5,ISO-8859-9,ISO-8859-3,Windows-1252(主要是名称上的变化,内置的好像是WINDOWS-1252),MAC-CENTRALEUROPE,Windows-1250

另外,还有一个文件 ,没有被识别为文本文件,可是它的确是文本文件,你看一下是哪里有问题。
澤野弘之 (さわの ひろゆき) - THE ANSWER.zip

@tomwillow
Copy link
Owner

  1. EUC-JP, BIG5已支持。
  2. Windows-1252的问题已解决。
  3. 其他编码后续再增加。
  4. 附件的文件我已测试,确实没有识别出编码,我人肉看了,原因是里面的编码是用本地字符集(GB)存储的外文字符(日文),导致uchardet引擎没有识别出来。这个问题我只能留待后续开发了,需要增加其他识别引擎、或者增加手动trick代码。
  5. 如果有不能支持的文件或者识别出错的文件,欢迎你把附件发到这里或是我的邮箱:tomwillow@qq.com

@dylanZk1
Copy link
Author

@gzsklsskszngc
Copy link

请增加越南TCVN编码,谢谢!
Uploading 示例文件.txt…

@tomwillow
Copy link
Owner

请增加越南TCVN编码,谢谢! Uploading 示例文件.txt…

你好,你的附件好像没有上传成功,我这边没法正常下载。
这个程序是靠icu库来实现编码集转换的,我还不清楚是否支持TCVN编码,如果支持的话我会尝试加上。

希望你能提供给我尽可能多的测试文本。
也可以发到我邮箱:tomwillow@qq.com

@tomwillow
Copy link
Owner

@gzsklsskszngc :

SmartCharsetConverter(测试分支,非正式分支)现在内置了3个字符集探测引擎,我尝试了,首先它们都没有越南tcv3的字符集支持,其次,它们有时会把越南语文本识别为iso-8859-10,这个字符集是用来显示带重音符号的欧洲字符的,看起来和越南文还有点像。

我把你提供的示例按照iso-8859-10进行识别,再转换utf-8。好在有你提供的工具,否则我无法判断转换结果是否正确。我交叉比对了,这样做不行。转到utf-8的字符和JxLuaEditor1.0处理的结果不一致。

@tomwillow
Copy link
Owner

@gzsklsskszngc

请增加越南TCVN编码,谢谢! Uploading 示例文件.txt…

tcvn3编码已支持。不确定是否有其他的问题,所以希望你能试用一下然后给我反馈。

SmartCharsetConverter v0.83beta.zip

@i-iooi-i
Copy link

image
image

貌似无法添加 ANSI 这类编码的文本文件,只能手动一个个的改了。 /(ㄒoㄒ)/~~

@tomwillow
Copy link
Owner

tomwillow commented Jun 18, 2024 via email

@tomwillow
Copy link
Owner

tomwillow commented Jun 18, 2024 via email

# for free to join this conversation on GitHub. Already have an account? # to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

4 participants