MMLSpark,即 MicrosoftMachieLearigforApacheSpark,是微软开源的一个针对ApacheSpark的深度学习和数据可学工具,为大型映像和文本数据库快速创建强大、可缩放性能优越的预测和分析模型。
MMLSpark可与 MicrosoftCogitiveToolkit(CNTK,微软认知工具包) 和 OpeCV (计算机视觉库)无缝集成,允许:
流入和预处理图像数据
使用预先定型的深度学习模型特征化图像和文本
使用隐式特征化对分类和回归模型进行定型和评分
示例:
...import mmlspark# Iitialize CNTKModel ad defie iput ad output columsctkModel = mmlspark.CNTKModel() \ .setIputCol("images").setOutputCol("output") \ .setModelLocatio(modelFile)# Trai o dataset with iteral spark pipeliescoredImages = ctkModel.trasform(imagesWithLabels)...
评论