Skip to content

Latest commit

 

History

History
13 lines (8 loc) · 774 Bytes

README.md

File metadata and controls

13 lines (8 loc) · 774 Bytes

EmotionAnalysis

工程不包含jar包,需要的jar包在lib文件夹下的jarFile中有说明。 testFile中test.sample是测试文件,testResult.txt是预测结果文件。

1.输入文本内容,判断从文本中读入的每行内容,若句子为空或者句子格式错误,则抛出异常。格式为:句子ID\t句子内容。

2.对句子内容做分词处理。使用jieba(开源)分词工具,jieba分词时可以依赖用户词典,这样分词时会根据用户自定义的词语组合来分词,用户词典为.dict文件。

3.对分好的词做词性标注和依存句法分析。使用Stanford-parser开源工具包。

4.抽取符合条件的特征词。

5.特征词极性标注。输出结果,格式为:句子ID\t特征词\t极性。