我在构建数据集的过程中,发现composition_train和composition_test加起来只有五十多个G,而readme里面说要准备一个T,而且没有check.log,有没有朋友遇到类似的问题?