train.py

# -*- coding: utf-8 -*-
#/usr/bin/python3
'''
date: 2019/5/21
mail: cally.maxiong@gmail.com
page: http://www.cnblogs.com/callyblog/
'''


# python train.py --logdir log/conala --evaldir eval/conala --train dataset/conala/train.csv --eval dataset/conala/eval.csv --vocab dataset/conala/vocab --vocab_size 4137 --maxlen1 200 --maxlen2 50 --gpu_nums=1 --batch_size 32


# python pred.py --ckpt log/conala/trans_pointerE3468L0.37-3468 --test dataset/conala/test.csv --vocab dataset/conala/vocab --vocab_size 4137 --maxlen1 200 --maxlen2 50


import logging
import os

from sumeval.metrics.rouge import RougeCalculator
from tqdm import tqdm

from beam_search import BeamSearch
from data_load import get_batch, _load_vocab
from hparams import Hparams
from model import Transformer
from utils import save_hparams, save_variable_specs, get_hypotheses, calc_rouge, import_tf

logging.basicConfig(level=logging.INFO)


# 改成英文的!!!
rouge = RougeCalculator(stopwords=True, lang="en")


logging.info("# hparams")
hparams = Hparams()
parser = hparams.parser
hp = parser.parse_args()

# import tensorflow
gpu_list = [str(i) for i in list(range(hp.gpu_nums))]
tf = import_tf(gpu_list)

save_hparams(hp, hp.logdir)

logging.info("# Prepare train/eval batches")
train_batches, num_train_batches, num_train_samples = get_batch(hp.train,
                                                                hp.maxlen1,
                                                                hp.maxlen2,
                                                                hp.vocab,
                                                                hp.batch_size,
                                                                hp.gpu_nums,
                                                                shuffle=True)

eval_batches, num_eval_batches, num_eval_samples = get_batch(hp.eval,
                                                             hp.maxlen1,
                                                             hp.maxlen2,
                                                             hp.vocab,
                                                             hp.eval_batch_size,
                                                             hp.gpu_nums,
                                                             shuffle=False)


handle = tf.placeholder(tf.string, shape=[])
iter = tf.data.Iterator.from_string_handle(
    handle, train_batches.output_types, train_batches.output_shapes)

# create a iter of the correct shape and type
xs, ys = iter.get_next()

logging.info('# init data')
training_iter = train_batches.make_one_shot_iterator()
val_iter = eval_batches.make_initializable_iterator()

logging.info("# Load model")
m = Transformer(hp)


# get op
loss, train_op, global_step, train_summaries = m.train(xs, ys)
y_hat, eval_summaries = m.eval(xs, ys)

token2idx, idx2token = _load_vocab(hp.vocab)


bs = BeamSearch(m, hp.beam_size, list(idx2token.keys())[2], list(idx2token.keys())[3], idx2token, hp.maxlen2, m.x,
                m.decoder_inputs, m.logits)

logging.info("# Session")
saver = tf.train.Saver(max_to_keep=hp.num_epochs)


sess_config = tf.ConfigProto(allow_soft_placement=True)
sess_config.gpu_options.allow_growth = True
with tf.Session(config=sess_config) as sess:
    ckpt = tf.train.latest_checkpoint(hp.logdir)
    if ckpt is None:
        logging.info("Initializing from scratch")
        sess.run(tf.global_variables_initializer())
        save_variable_specs(os.path.join(hp.logdir, "specs"))
    else:
        saver.restore(sess, ckpt)

    summary_writer = tf.summary.FileWriter(hp.logdir, sess.graph)

    # Iterator.string_handle() get a tensor that can be got value to feed handle placeholder
    training_handle = sess.run(training_iter.string_handle())
    val_handle = sess.run(val_iter.string_handle())


    total_steps = hp.num_epochs * num_train_batches
    _gs = sess.run(global_step)
    for i in tqdm(range(_gs, total_steps+1)):
        _, _gs, _summary = sess.run([train_op, global_step, train_summaries], feed_dict={handle: training_handle})
        summary_writer.add_summary(_summary, _gs)

        if _gs % num_train_batches == 0 and _gs != 0:
            # logging.info("epoch{} is done".format(int(_gs / total_steps) + 1))
            logging.info("steps {} is done".format(_gs))
            _loss = sess.run(loss, feed_dict={handle: training_handle})  # train loss


            # logging.info("# test evaluation")
            # sess.run(val_iter.initializer) # initial val dataset
            # _eval_summaries = sess.run(eval_summaries, feed_dict={handle: val_handle})
            # summary_writer.add_summary(_eval_summaries, _gs)
            #
            # logging.info("# beam search")
            # hypotheses, all_targets = get_hypotheses(num_eval_batches, num_eval_samples, sess, m, bs, [xs[0], ys[2]],
            #                                          handle, val_handle)
            #
            # logging.info("# calc rouge score ")
            # if not os.path.exists(hp.evaldir): os.makedirs(hp.evaldir)
            # rouge_l = calc_rouge(rouge, all_targets, hypotheses, _gs, hp.evaldir)
            #
            # model_output = "trans_pointerE%02dR%.2f" % (_gs, rouge_l)
            #
            # logging.info('# write hypotheses')
            # with open(os.path.join(hp.evaldir, model_output), 'w', encoding='utf-8') as f:
            #     for target, hypothes in zip(all_targets, hypotheses):
            #         f.write('{}-{} \n'.format(target, ' '.join(hypothes)))


            logging.info("# save models")
            train_model_output = "trans_pointerE%02dL%.2f" % (_gs, _loss)
            ckpt_name = os.path.join(hp.logdir, train_model_output)
            saver.save(sess, ckpt_name, global_step=_gs)
            logging.info("after training of {} steps, {} has been saved.".format(_gs, ckpt_name))


            logging.info("# fall back to train mode")
    summary_writer.close()

logging.info("Done")