Skip to content
New issue

Have a question about this project? # for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “#”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? # to your account

关于名称识别 #405

Closed
moshangshaoguang opened this issue Feb 28, 2017 · 4 comments
Closed

关于名称识别 #405

moshangshaoguang opened this issue Feb 28, 2017 · 4 comments
Labels

Comments

@moshangshaoguang
Copy link

@现在根据分词使用的方式,根据组词的方式组词后进行对名称的判别,这样就存在一个局限性。就拿我现在在一个文本中是识别未在词库中添加那组‘企业名称‘的词对企业名称识别时,很容出现识别出一半甚至不能识别,如果是一直通过添加词来解决这也会导致文件越来越大。想请问一下这个有什么好的建议或者解决方法,来补足这个缺陷。

@TylunasLi
Copy link
Contributor

请您重新组织一下语言并附上一些例子,没看懂。

@moshangshaoguang
Copy link
Author

例如:“北京溢彩堂有限公司”,在词库中是没有“溢彩堂”这个词,最后这个企业名称没有被识别出来或者识别出来是不完整的名称,我想问的是除了在词库中直接添加这个“溢彩堂”词之外的方式还有其他的方法来识别这个“溢彩堂“的词;

@hankcs
Copy link
Owner

hankcs commented Mar 2, 2017

#407

@hankcs
Copy link
Owner

hankcs commented Jan 1, 2020

感谢您对HanLP1.x的支持,我一直为没有时间回复所有issue感到抱歉,希望您提的问题已经解决。或者,您可以从《自然语言处理入门》中找到答案。

时光飞逝,HanLP1.x感谢您的一路相伴。我于东部标准时间2019年12月31日发布了HanLP1.x在上一个十年最后一个版本,代号为最后的武士。此后1.x分支将提供稳定性维护,但不是未来开发的焦点。

值此2020新年之际,我很高兴地宣布,HanLP2.0发布了。HanLP2.0的愿景是下一个十年的前沿NLP技术。为此,HanLP2.0采用TensorFlow2.0实现了最前沿的深度学习模型,通过精心设计的框架支撑下游NLP任务,在海量语料库上取得了最前沿的准确率。作为第一个alpha版本,HanLP 2.0.0a0支持分词、词性标注、命名实体识别、依存句法分析、语义依存分析以及文本分类。而且,这些功能并不仅限中文,而是面向全人类语种设计。HanLP2.0提供许多预训练模型,而终端用户仅需两行代码即可部署,深度学习落地不再困难。更多详情,欢迎观看HanLP2.0的介绍视频,或参与论坛讨论

展望未来,HanLP2.0将集成1.x时代继承下来的高效率务实风范,同时冲刺前沿研究,做工业界和学术界的两栖战舰,请诸君继续多多指教,谢谢。

@hankcs hankcs closed this as completed Jan 1, 2020
@hankcs hankcs added ignored and removed duplicated labels Jan 1, 2020
# for free to join this conversation on GitHub. Already have an account? # to comment
Labels
Projects
None yet
Development

No branches or pull requests

3 participants