Skip to content

Antonym relations for 'Word List by Semantic Principles (WLSP)'

Notifications You must be signed in to change notification settings

masayu-a/WLSP-antonym

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

11 Commits
 
 
 
 
 
 

Repository files navigation

WLSP-antonym

Description

『分類語彙表』増補改訂版データベースから、反対語対を収集し、 クラウドソーシングによる評定値を与えたもの。

Features

1行目がヘッダです。

各列は以下の通りです。

  • 反対語チェック
  • 比較対象A_ID
  • 比較対象B_ID
  • 分類項目
  • 分類番号
  • 比較対象A:反対語候補の単語です
  • 比較対象B:反対語候補の単語です
  • 空列:正順【(A→B)順に提示】
  • 【(A→B)順に提示】反対語でない: クラウドソーシングにより「反対語でない」と判断した人数
  • 【(A→B)順に提示】置き換え不可: クラウドソーシングにより「反対語であるが文脈によっては置き換え不可」と判断した人数
  • 【(A→B)順に提示】置き換え可: クラウドソーシングにより「反対語であり、置き換え可」と判断した人数
  • 【(A→B)順に提示】調査人数: クラウドソーシングにより調査した人数
  • 空列:逆順【(B→A)順に提示】
  • 【(B→A)順に提示】反対語でない: クラウドソーシングにより「反対語でない」と判断した人数
  • 【(B→A)順に提示】置き換え不可: クラウドソーシングにより「反対語であるが文脈によっては置き換え不可」と判断した人数
  • 【(B→A)順に提示】置き換え可: クラウドソーシングにより「反対語であり、置き換え可」と判断した人数
  • 【(B→A)順に提示】調査人数: クラウドソーシングにより調査した人数
  • 空列:差分【(A→B)順に提示 - (B→A)順に提示】
  • 【(A→B)順に提示 - (B→A)順に提示】反対語でない: クラウドソーシングにより「反対語でない」と判断した人数
  • 【(A→B)順に提示 - (B→A)順に提示】置き換え不可: クラウドソーシングにより「反対語であるが文脈によっては置き換え不可」と判断した人数
  • 【(A→B)順に提示 - (B→A)順に提示】置き換え可: クラウドソーシングにより「反対語であり、置き換え可」と判断した人数
  • 【(A→B)順に提示 - (B→A)順に提示】調査人数: クラウドソーシングにより調査した人数
  • 空列:合計【(A→B)順に提示 + (B→A)順に提示】
  • 【(A→B)順に提示 + (B→A)順に提示】反対語でない: クラウドソーシングにより「反対語でない」と判断した人数
  • 【(A→B)順に提示 + (B→A)順に提示】置き換え不可: クラウドソーシングにより「反対語であるが文脈によっては置き換え不可」と判断した人数
  • 【(A→B)順に提示 + (B→A)順に提示】置き換え可: クラウドソーシングにより「反対語であり、置き換え可」と判断した人数
  • 【(A→B)順に提示 + (B→A)順に提示】調査人数: クラウドソーシングにより調査した人数
  • タイプ(反対語の分類)
  • 比較対象A_ID
  • 比較対象A_表層形
  • 比較対象A_SUW_頻度(BCCWJ)
  • 比較対象A_LUW_頻度(BCCWJ)
  • 比較対象B_ID
  • 比較対象B_表層形
  • 比較対象B_SUW_頻度(BCCWJ)
  • 比較対象B_LUW_頻度(BCCWJ)
  • SUW比(比較対象A_SUW_頻度(BCCWJ)/比較対象B_SUW_頻度(BCCWJ))
  • LUW比(比較対象A_LUW_頻度(BCCWJ)/比較対象B_LUW_頻度(BCCWJ))
  • 対数SUW比(log(比較対象A_SUW_頻度(BCCWJ)/比較対象B_SUW_頻度(BCCWJ)))
  • 対数LUW比(log(比較対象A_LUW_頻度(BCCWJ)/比較対象B_LUW_頻度(BCCWJ)))
  • word2vec 距離 (NWJC2vec)
  • 比較対象A_UniDic語彙素番号
  • 比較対象B_UniDic語彙素番号
  • 比較対象A_語彙素番号当たりの分類語彙表番号数
  • 比較対象B_語彙素番号当たりの分類語彙表番号数
  • 比較対象Aからみた反対語数
  • 比較対象Bからみた反対語数

nwjc.txt

  • NWJC 中で「比較対象A_表層形」+「比較対象B_表層形」の順で1文中に出現した頻度と「比較対象B_表層形」+「比較対象A_表層形」の順で1文中に出現した頻度の情報(反対語対の間の単語が入っていることを許す)

Author

  • 浅原正幸 (国立国語研究所)
  • 加藤祥 (国立国語研究所)
  • 森山奈々美 (国立国語研究所)
  • 荻原亜彩美 (国立国語研究所)
  • 山崎誠 (国立国語研究所)

Reference

荻原亜彩美・森山奈々美・浅原正幸・加藤祥・山崎誠 (2019) 『分類語彙表』に対する反対語情報付与, 『言語処理学会第25回年次大会発表論文集』, 1061-1064. https://www.anlp.jp/proceedings/annual_meeting/2019/pdf_dir/P5-7.pdf

加藤祥・浅原正幸・森山奈々美・荻原亜彩美・山崎誠 (2021)『分類語彙表』に対する反対語情報付与, 『自然言語処理』, vol. 28, no. 1, pp.60-81. https://doi.org/10.5715/jnlp.28.60

License

CC BY-NC-SA 3.0 https://creativecommons.org/licenses/by-nc-sa/3.0/deed.ja

Credit

National Institute for Japanese Language and Linguistics (2019) WLSP-antonym (ver. 1.0)

Contact

kotonoha@ninjal.ac.jp

About

Antonym relations for 'Word List by Semantic Principles (WLSP)'

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published