Skip to content

Refined metadata of the 'Balanced Corpus of Contemporary Written Japanese'

Notifications You must be signed in to change notification settings

masayu-a/BCCWJ-NDC

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 

Repository files navigation

BCCWJ-NDC

Description

Refined metadata of the 'Balanced Corpus of Contemporary Written Japanese'

Features

The 1st line is header.

  1. NDC
  2. サンプルID
  3. 書誌ID
  4. タイトル
  5. 副題
  6. 巻号
  7. 責任表示
  8. 出版者
  9. 出版年
  10. ISBN
  11. サンプル抽出基準点ページ
  12. ジャンル1
  13. ジャンル2
  14. ジャンル3
  15. ジャンル4
  16. 責任表示ID
  17. 人名ID
  18. 人名
  19. 生年代
  20. 性別
  21. corpusName

Author

  • Sachi Kato (National Institute for Japanese Language and Linguistics, Japan)
  • Nanami Moriyama (National Institute for Japanese Language and Linguistics, Japan)
  • Masayuki Asahara (National Institute for Japanese Language and Linguistics, Japan)

References

  • 加藤 祥・森山 奈々美・浅原 正幸 (2019) 「『現代日本語書き言葉均衡コーパス』書籍サンプルのNDC情報増補」『言語資源活用ワークショップ2019 発表論文集』, pp.155-160

License

CC BY 4.0

Credit

National Institute for Japanese Language and Linguistics (2019) BCCWJ-NDC (ver. 1.2b)

出典:国立国会図書館書誌データ(https://iss.ndl.go.jp/information/api/ 2019年4月に取得)に基づき、『現代日本語書き言葉均衡コーパス』書籍サンプルの NDC を人手で再確認した。

また、本データは科研費基盤(C) 「文体分析を目的としたコーパスの文書情報拡張及びその利用」(研究代表者:加藤祥)およびコーパス開発センター共同研究プロジェクトの支援を受けました。

Contact

kotonoha@ninjal.ac.jp

About

Refined metadata of the 'Balanced Corpus of Contemporary Written Japanese'

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published