关于名称识别 #405

moshangshaoguang · 2017-02-28T01:46:12Z

@现在根据分词使用的方式，根据组词的方式组词后进行对名称的判别，这样就存在一个局限性。就拿我现在在一个文本中是识别未在词库中添加那组‘企业名称‘的词对企业名称识别时，很容出现识别出一半甚至不能识别，如果是一直通过添加词来解决这也会导致文件越来越大。想请问一下这个有什么好的建议或者解决方法，来补足这个缺陷。

TylunasLi · 2017-02-28T15:56:53Z

请您重新组织一下语言并附上一些例子，没看懂。

moshangshaoguang · 2017-03-01T01:20:33Z

例如：“北京溢彩堂有限公司”，在词库中是没有“溢彩堂”这个词，最后这个企业名称没有被识别出来或者识别出来是不完整的名称，我想问的是除了在词库中直接添加这个“溢彩堂”词之外的方式还有其他的方法来识别这个“溢彩堂“的词；

hankcs · 2017-03-02T18:34:15Z

#407

hankcs · 2020-01-01T10:52:34Z

感谢您对HanLP1.x的支持，我一直为没有时间回复所有issue感到抱歉，希望您提的问题已经解决。或者，您可以从《自然语言处理入门》中找到答案。

时光飞逝，HanLP1.x感谢您的一路相伴。我于东部标准时间2019年12月31日发布了HanLP1.x在上一个十年最后一个版本，代号为最后的武士。此后1.x分支将提供稳定性维护，但不是未来开发的焦点。

值此2020新年之际，我很高兴地宣布，HanLP2.0发布了。HanLP2.0的愿景是下一个十年的前沿NLP技术。为此，HanLP2.0采用TensorFlow2.0实现了最前沿的深度学习模型，通过精心设计的框架支撑下游NLP任务，在海量语料库上取得了最前沿的准确率。作为第一个alpha版本，HanLP 2.0.0a0支持分词、词性标注、命名实体识别、依存句法分析、语义依存分析以及文本分类。而且，这些功能并不仅限中文，而是面向全人类语种设计。HanLP2.0提供许多预训练模型，而终端用户仅需两行代码即可部署，深度学习落地不再困难。更多详情，欢迎观看HanLP2.0的介绍视频，或参与论坛讨论。

展望未来，HanLP2.0将集成1.x时代继承下来的高效率务实风范，同时冲刺前沿研究，做工业界和学术界的两栖战舰，请诸君继续多多指教，谢谢。

hankcs added the duplicated label Mar 2, 2017

hankcs closed this as completed Jan 1, 2020

hankcs added ignored and removed duplicated labels Jan 1, 2020

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

关于名称识别 #405

关于名称识别 #405

moshangshaoguang commented Feb 28, 2017

TylunasLi commented Feb 28, 2017

moshangshaoguang commented Mar 1, 2017

hankcs commented Mar 2, 2017

hankcs commented Jan 1, 2020

关于名称识别 #405

关于名称识别 #405

Comments

moshangshaoguang commented Feb 28, 2017

TylunasLi commented Feb 28, 2017

moshangshaoguang commented Mar 1, 2017

hankcs commented Mar 2, 2017

hankcs commented Jan 1, 2020