平台主要为外贸人员提供贸易情报,对海关数据、航运数据、物流数据、过境数据的聚合等。
1. 海关数据搜索与分析
技术栈:Node.js、Express.js、Lua、Redis、Solr、Elastic Search、Angular.js、D3.js、Docker等
● 利用 node.js、express、redis、lua 等技术进行后端接口开发;
● 利用 solr和 elasticsearch 技术来实现数据的检索和分析服务;
● 基于 angular.js 框架进行前端开发;
● 基于 d3.js 等技术进行数据可视化开发;
● 使用 docker 进行服务部署;
2. 金蜘蛛邮箱抓取服务
技术栈:Python、PyQt等
● 利用 Python 开发爬虫程序,能够按需从搜索引擎中抓取供应商和采购商的相关企业信息,并进行预处理;
● 采用拟人操作、IP rotation 、打码服务等策略来降低被搜索引擎屏蔽的风险,从而提高爬虫程序的可用性;
● 负责维护该项目的 PyQt 爬虫客户端以及后端 Java 服务;
点击空白处退出提示
评论