项目介绍:我设计并开发了一个搜索引擎。该软件可以爬取网络上的网页,并提供网页排序, 和检索功能。技术栈:Python项目成果:1. 使用广度优先算法,对特定 IP 的网站,实现了网络爬虫的功能。 2. 使用 PageRank 算法给网页计算权重。3. 实现倒排索引,加速信息检索的速度。4. 根据 TF-IDF 给网页对关键字提供相关度指数。
评论