对所使用数据690-ChIP进行预处理,利用one-hot编码方式对字母格式的DNA序列进行编码。通过Self-Attention机制重新生成DNA序列特征编码,使其具有长序特征。结合ResNet对数据进行训练,生成预训练模型。进行迁移训练,生成690种人类细胞的转录因子结合位点识别模型。
评论