Python是一种广泛使用的解释型、高级和通用的编程语言,[1]由荷兰数学和计算机科学研究学会的Guido van Rossum创造,第一版发布于1991年,它是ABC语言的后继者,也可以视之为一种使用传统中缀表达式的LISP方言。[2]Python提供了高效的高级数据结构,还能简单有效地面向对象编程。Python语法和动态类型,以及解释型语言的本质,使它成为多数平台上写脚本和快速开发应用的编程语言,随着版本的不断更新和语言新功能的添加,逐渐被用于独立的、大型项目的开发。Python支持多种编程范型,包括函数式、指令式、结构化、面向对象和反射式编程。Python解释器易于扩展,可以使用C或C++(或者其他可以通过C调用的语言)扩展新的功能和数据类型。Python也可用于可定制化软件中的扩展程序语言。Python
• 对说话人识别系统进行后门攻击
o 设计了一个白盒后门攻击系统,使用 VoxCeleb1 数据集和数据污染,攻击基于 ResNet-34 的说话人识别 系统和开源说话人识别平台 Kaldi。这是首个全面攻击说话人识别系统的工作。
o 设计了两个常见说话人识别任务的数字和物理后门攻击:说话人验证任务和闭集说话人识别任务。 o 在这两个任务上实现了 89%以上的数字攻击成功率和 70%以上的物理攻击成功率(ISPEC 2022, Long
paper)。
• 通过文本数据增强以提升 NLP 模型的性能
o 通过创建同义词和反义词样本以及特征空间优化来微调RoBERTa。在文本分类任务中比基准RoBERTa 模型准确率提高了约 5.4%,在文本相似性任务中达到了约 0.907 的皮尔逊积矩相关系数。
o 使用数据增强方法将SQuAD问答数据集转换为掩码语言模型数据集,以丰富域外数据的代表性, 并微调了 Hugging Face DistilBERT 模型,将其问答性能提高了约 3.3% (基于 F1 分数)。
o 对Covid19推文文本进行数据增强以预测转推次数,在LSTM-GRU上实现了约149的平均绝对误 差(Kaggle Best Performance 127),在情感分析任务上的分类准确率达到约 93.7%。