Dagli Java 机器学习函数库开源项目

我要开发同款
匿名用户2020年11月16日
65阅读

技术信息

开源地址
https://github.com/linkedin/dagli
授权协议
BSD-2

作品详情

Dagli是LikedI开源的用于Java(和其他JVM语言)的机器学习函数库,其开发团队表示通过它可轻松编写不易出错、可读、可修改、可维护且易于部署的模型管道,而不会引起技术债。Dagli充分利用了现代多核的CPU和功能日益强大的GPU,可以对真实世界模型进行有效的单机训练。

下面是一个文本分类器的介绍性示例,此文本分类器以管道的形式实现,使用梯度增强决策树模型(XGBoost)的主动学习以及高维gram集作为逻辑回归分类器中的特征:

Placeholder<Strig>text=ewPlaceholder<>();Placeholder<LabelType>label=ewPlaceholder<>();Tokestokes=ewTokes().withIput(text);NgramVectoruigramFeatures=ewNgramVector().withMaxSize(1).withIput(tokes);Producer<Vector>leafFeatures=ewXGBoostClassificatio<>().withFeaturesIput(uigramFeatures).withLabelIput(label).asLeafFeatures();NgramVectorgramFeatures=ewNgramVector().withMaxSize(3).withIput(tokes);LibliearClassificatio<LabelType>predictio=ewLibliearClassificatio<LabelType>().withFeaturesIput().fromVectors(gramFeatures,leafFeatures).withLabelIput(label);DAG2x1.Prepared<Strig,LabelType,DiscreteDistributio<LabelType>>traiedModel=DAG.withPlaceholders(text,label).withOutput(predictio).prepare(textList,labelList);LabelTypepredictedLabel=traiedModel.apply("Sometextforwhichtopredictalabel",ull);//traiedModelowcabeserializedadlaterloadedoaserver,iaCLIapp,iaHiveUDF...

功能介绍

Dagli 是 LinkedIn 开源的用于 Java(和其他 JVM 语言)的机器学习函数库,其开发团队表示通过它可轻松编写不易出错、可读、可修改、可维护且易于部署的模型管道,而不会引起技术债...

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论