Carview!

ToDDAPT

Codes for paper: "When does Further Pre-training MLM Help? An Empirical Study on Task-Oriented Dialog Pre-training".

This project is developed based on ConvLab-2 (commit 786d08).

Run pip install -e . and pip install -r dialogbert_requirements.txt.

Note that you should replace pre-trained models' paths and output paths in the codes.

Dataset preprocess

In data_ptm, run preprocess.py for each dataset.

In convlab2/ptm/pretraining/prepare_data, run preprocess_data.py.

DAPT

In convlab2/ptm/pretraining/run_dapt.sh, set hyperparameters and run.

Best checkpoint for each DAPT data ratio:

dialogbert/dapt/1.0data_0506_lr1e-4_steps40000_bz32ac8_block256_warmup0/checkpoint-39000/
dialogbert/dapt/0.25data_0517_lr5e-5_steps10000_bz32ac8_block256_warmup0/
dialogbert/dapt/0.05data_0518_lr2e-5_steps5000_bz32ac8_block256_warmup0/checkpoint-4000/
dialogbert/dapt/0.01data_0518_lr2e-5_steps1000_bz32ac8_block256_warmup0/

TAPT

In convlab2/ptm/pretraining/run_tapt.sh, set hyperparameters and run.

Best checkpoint for each TAPT data ratio:

dialogbert/tapt/multiwoz_0519_lr5e-5_steps10000_bz32ac8_block256_warmup0/
dialogbert/tapt/hwu_0520_lr5e-5_steps1000_bz32ac8_block256_warmup0/checkpoint-700
dialogbert/tapt/banking_0520_lr5e-5_steps1000_bz32ac8_block256_warmup0
dialogbert/tapt/oos_0520_lr1e-4_steps1000_bz32ac8_block256_warmup0
dialogbert/tapt/restaurant8k_0520_lr2e-5_steps1000_bz32ac8_block256_warmup0/checkpoint-900
dialogbert/tapt/top_0520_lr5e-5_steps2000_bz32ac8_block256_warmup0/checkpoint-1800
dialogbert/tapt/m2m_0520_lr5e-5_steps500_bz32ac8_block256_warmup0/checkpoint-400

DAPT+TAPT

In convlab2/ptm/pretraining/run_dapt_tapt.sh, set hyperparameters and run.

Best checkpoint for each DAPT+TAPT data ratio:

dialogbert/tapt/dapt_hwu_0524_lr5e-5_steps1000_bz32ac8_block256_warmup0/checkpoint-300/
dialogbert/tapt/dapt_banking_0524_lr5e-5_steps1000_bz32ac8_block256_warmup0/checkpoint-600/
dialogbert/tapt/dapt_restaurant8k_0524_lr2e-5_steps1000_bz32ac8_block256_warmup0/checkpoint-300
dialogbert/tapt/dapt_top_0524_lr5e-5_steps2000_bz32ac8_block256_warmup0/checkpoint-1900/
dialogbert/tapt/dapt_multiwoz_0524_lr5e-5_steps10000_bz32ac8_block256_warmup0/checkpoint-4100
dialogbert/tapt/dapt_oos_0524_lr1e-4_steps1000_bz32ac8_block256_warmup0/checkpoint-1000/
dialogbert/tapt/dapt_m2m_0524_lr5e-5_steps500_bz32ac8_block256_warmup0/checkpoint-200/

MLM test

In convlab2/ptm/pretraining/eval_mlm.sh, set hyperparameters and run.

Fine-tune

BERTNLU

In convlab2/ptm/eval_tasks/nlu/run.sh, set pre-trained model path and run.

HWU, BANKING, RESTAURANT8K, TOP

In convlab2/ptm/eval_tasks/dialoglue/run_[hwu|banking|rest8k|top].sh, set pre-trained model path and run.

Bert: convlab2/ptm/eval_tasks/dialoglue/run_all_[fewshot|fulldata]_bert.sh

Trippy

In convlab2/ptm/eval_tasks/dialoglue/trippy/run_[baseline|trippy].sh, set pre-trained model path and run.

TOD-DST

In convlab2/ptm/eval_tasks/dst/scripts/, set pre-trained model path and run.

OOS, DAP

https://github.com/jasonwu0731/ToD-BERT, replace the pre-trained model path

RSA

In convlab2/ptm/eval_tasks/RSA/rsa_analysis.py, select model path and run.

In convlab2/ptm/eval_tasks/RSA/RSA.ipynb, compute rsa similarity.

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
convlab2		convlab2
data_ptm		data_ptm
deploy		deploy
tests		tests
tutorials		tutorials
.gitignore		.gitignore
LICENSE		LICENSE
MANIFEST.in		MANIFEST.in
NOTICE		NOTICE
PULL_REQUEST_TEMPLATE.md		PULL_REQUEST_TEMPLATE.md
README.md		README.md
dialogbert_requirements.txt		dialogbert_requirements.txt
setup.cfg		setup.cfg
setup.py		setup.py
upload.sh		upload.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

ToDDAPT

Dataset preprocess

DAPT

TAPT

DAPT+TAPT

MLM test

Fine-tune

BERTNLU

HWU, BANKING, RESTAURANT8K, TOP

Trippy

TOD-DST

OOS, DAP

RSA

About

Uh oh!

Releases

Packages

Languages

License

zqwerty/ToDDAPT

Folders and files

Latest commit

History

Repository files navigation

ToDDAPT

Dataset preprocess

DAPT

TAPT

DAPT+TAPT

MLM test

Fine-tune

BERTNLU

HWU, BANKING, RESTAURANT8K, TOP

Trippy

TOD-DST

OOS, DAP

RSA

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages