1.项目分为异常点检测、周期性及波动性检测、数据拟合三个模块的功能;其中,异常点检测通过iForest检测异常点并删除异常数据,利用自相关性和偏自相关性再根据检测出的异常点的分布特征得出异常周期的检测结果;选取一些指标进行数据拟合,将数据分为线性部分及非线性部分,对两部分分别使用SARIMA和RNN进行拟合,对数据进行预测。
2.我负责全部内容。
3.难点在于异常值的预测中,我们要考虑到数据的波动性,突发性和自相关性等,还有一个就是要综合考量计算成本,鲁棒性,输出结果的时效性等。并且,由于所需指标的数据与其他数据都有一定的相关性,综合考虑其他数据对结果的影响,借用其他指标作为辅助输入特征建模。而拟合部分用于预测,由于数据之间的周期性并不明显,所以需要挖掘数据的周期性,并且数据变化包括线性部分和非线性部分,所以对数据采用分割式建模,以期获得更好的结果。
点击空白处退出提示












评论