当前毕业生、研究生等在毕业论文攥写方面对于现有论文的检索来说十分不方便,需要多个平台检索关键词搜索到符合自身专业的专业性论文,这导致在攥写毕业论文的过程中效率极具下降,所以编写了这套多平台论文检索系统
点击空白处退出提示
当前毕业生、研究生等在毕业论文攥写方面对于现有论文的检索来说十分不方便,需要多个平台检索关键词搜索到符合自身专业的专业性论文,这导致在攥写毕业论文的过程中效率极具下降,所以编写了这套多平台论文检索系统
1.具体有论文关键词检索模块、预览模块、条件筛选模块等
2.主要功能为用户输入相关关键词后,设定筛选条件,搜索出多平台的论文后,可支持用户预览部分原文、跳转到论文原网址等功能
1.我负责整个系统的开发
2.技术栈 :采用 Python + PyQt5 构建桌面GUI应用,网络层使用 aiohttp 实现异步并发请求,数据解析涉及 BeautifulSoup、lxml、xml.etree 等多类库,中文分词使用 jieba ,数据存储依托 SQLite 本地数据库,翻译功能集成 deep-translator ,文献导出支持 bibtexparser ,最终通过 PyInstaller 打包为可执行文件。
架构 :采用模块化分层设计, modules/ 目录包含搜索引擎(SearchEngine)、数据库管理(DBManager)、导出管理(ExportManager)、术语扩展(TermExpander)四大核心模块, ui/ 目录按功能划分为主窗口、收藏夹、稍后读、设置、关于等子窗口,采用 QThread + asyncio 混合模式处理耗时的异步搜索任务。
亮点与难点 :
1. 多源聚合搜索 :整合 arXiv、PubMed、Semantic Scholar、Crossref、百度学术、ACM、IEEE 七个学术平台,并发请求后统一去重排序
2. 中英文翻译桥接 :自动识别中文关键词并调用 Google 翻译转为英文搜索,内置专业术语映射表(如"深度学习"→"deep learning")解决翻译歧义
3. 智能相关性评分 :基于标题/摘要匹配度、关键词出现频率、精确短语匹配等多维度计算 0-100 分相关性,确保高相关论文优先展示
4. 术语自动扩展 :内置专业术语表(如 CNN、RNN、LSTM、Transformer 等)自动补充相关变体,提升检索召回率
5. 异步非阻塞搜索 :使用 asyncio 协程并发执行多平台搜索,配合超时控制和任务取消机制,避免 UI 冻结
6. 多格式导出 :支持 BibTeX、EndNote、CSV

评论