Skip to content

Latest commit

 

History

History
130 lines (87 loc) · 6.38 KB

README.md

File metadata and controls

130 lines (87 loc) · 6.38 KB

✊ ✋ ⚖️ gu-pa-jus

CI Docker Build Docker Autobuild Docker Pulls

✊ (0点) か ✋ (5点・満点) かをジャッジ ⚖️ するオフラインジャッジシステム。

課題に対してユーザーが作成したソースコードが正しいかどうかを、ソースコードの簡単な静的チェック、コンパイル、テストケースでの動作確認を通して判定(採点)する。

動作確認済み環境

  • Docker Desktop 4.33.0
  • Python 3.11.4

Docker Hub

https://hub.docker.com/r/kotarot/gu-pa-jus

現在の対応済み言語

  • C (gcc (Ubuntu 11.3.0-5ubuntu1) 11.3.0)

実行方法

採点実行環境: 環境セットアップ Docker コマンド

See: README-Docker.md

コンテナを起動しておく。

ローカル環境: Snakemake セットアップ

pyenv, virtualenv をセットアップし、Python をインストールしておく。

仮想環境と Snakemake のセットアップ:

$ pyenv virtualenv 3.11.4 gu-pa-jus
$ pyenv local 3.11.4/envs/gu-pa-jus

$ pip install --upgrade pip
$ pip install -r requirements.txt

確認:

$ snakemake --version
7.32.4

ソースコードのセットアップ

data/<課題ID> のディレクトリに、学籍番号ごとにディレクトリを切ってソースコードを配置する。

サンプルとして data/sample/<学籍番号> にサンプルデータを用意している。

プログラムのテーマ:

  • area.c: 三角形の面積を計算するプログラム
  • circle.c: 円の面積を計算するプログラム (math.h を使用)
  • calc_sum.c: 外部ファイル numbers.txt の各行に書かれている数字の和を計算するプログラム
  • condition.c: 数値の正負を条件判定するプログラム

架空の受講者ごとのディレクトリ:

学籍番号 area.c circle.c calc_sum.c condition.c
1Z000001 正解のソースコード。 正解のソースコード。 正解のソースコード。 正解のソースコード。
1Z000002 コンパイルできるが、答えが一部のテストケースで違う。 答えが違う。 答えが違う。 答えが一部のテストケースで違う。
1Z000003 コンパイルできるが、答えがすべて違う。 答えがわずかに違うけど許容範囲。 ファイル名が1文字違い (calc_sun.c)。 答えが一部のテストケースで違う。
1Z000004 シンタックスエラーでコンパイルできない。 答えを直接書いているのでだめ。
※意図しない検出(誤検出)の可能性もあるので後で手動で確認する。
コンパイルは通るけど実行でセグフォる。 N/A
1Z000005_1 ファイル名を1文字間違えている (areb.c)。
※単なる提出者のミスの可能性があるので後で手動で確認する。
N/A N/A N/A
1Z000005_2 N/A 正しい。 N/A N/A
1Z000006 使用禁止語句 (課題ごとにカスタマイズ定義できるがここでは system という語句を指定しているとする) を使用している。
※意図しない検出(誤検出)の可能性もあるので後で手動で確認する。
N/A 存在しない外部ファイルを開こうとしている。 N/A
1Z000007 実行時間が長い (課題ごとにタイムアウト値をカスタマイズ定義できるが、ここでは10秒をタイムアウト値として設定しているとして15秒間実行する)。 N/A N/A N/A
1Z000008 出力文字列が長すぎる。 N/A N/A N/A
1Z000009 出力文字列に許容しない文字列が使われている。 N/A N/A N/A

採点基準のセットアップ

data/<課題ID>/grade.yaml にyamlファイル (設定ファイル) を定義する。

基本採点基準:

  • 提出してあれば 1点
  • コンパイル通らなくても 1点
  • テストケース全部通っていれば 5点
  • テストケースの失敗に応じて減点 (ただし最低1点は保証する)

採点実行

課題を追加したときは Snakefile を編集して課題のジョブを追加する。 タスクランナーとして Snakemake を利用している。

dry-run:

snakemake kadai --config kadainame="sample" -n

サンプルをシングルコアで実行 (-F をつけることで出力ファイルが存在しても強制的に実行する):

snakemake kadai --config kadainame="sample" --cores 1 -F

結果のCSVファイルが results ディレクトリ内に生成される。

課題 (例: kadai-2022h1-03-class1) の採点をシングルコアで実行 (-F をつけることで出力ファイルが存在しても強制的に実行する):

snakemake kadai --config kadainame="kadai-2022h1-03-class1" --cores 1 -F

(今はあまり意味ない) HTMLレポート出力:

snakemake kadai --config kadainame="sample" --report results/report.html

Future work

セキュア化 (サンドボックス化)

今はどちらかというと実行環境を整備するためにDockerを使用している。Dockerはホストとカーネルを共有するのでゲスト環境でアプリケーションを完全には安全に実行できない問題がある。 Googleが開発したコンテナをサンドボックス化するランタイム gVisor を使用すればこのセキュリティの問題が解決しそうだが、今のところLinuxのみサポートしている(Macで使えない)。 回避方法としては、VM (例えば VirtualBox + Vagrant) を利用する方法が考えられる。

多言語対応

C++ や Java 等の他の言語にも対応する。