



个人介绍
工作经历
2013-09-01 -至今美的集团股份有限公司事业部副总
从事数字制造、企业数字化转型、工业机器人等项目管理工作,为美的旗下多家事业部上线灯塔工程;为长安汽车、比亚迪等客户开发企业级数字化转型平台;目前发布美的“小惟”人形机器人备受关注。
2002-07-01 -2013-08-01用友软件股份有限公司高级开发顾问
历任:助理程序员、初级程序员、中级程序员、高级程序员、高级技术顾问;负责ERP实施与开发工作,主攻:参数化BOM、物料齐套检验等,先后验收了近三十个项目。
教育经历
1998-09-01 - 2002-07-01中国农业大学计算机科学与技术本科
学习了C语言,数据结构、编译原理、计算机网络等课程,数据库学的是Oracle
语言

词袋模型只考虑是否出现,而不考虑词与词之间的顺序,导致文本中很多语义关联的丢失。 本项目用Dirichlet分布α中取样生成文档di的主题分布θi(主题分布θi由超参数为α的Dirichlet分布生成),从主题的多项式分布θi中取样生成文档di的第j个词的主题z(i,j),并将其对应的词语分布∳(z,j)由参数为β的Dirichlet分布生成,依次作为一个词是否出现在前一个词的概率。 该项目简化了语料库或数据框与大语言模型(LLMs)的对接过程,通过确定最佳主题数,支持文本分类、摘要生成、评分以及分析等多种任务。


想比较传统的消歧方法(如:基于词典的消歧),本文通过上下文的频繁项挖掘进行判别。将环境信息作为可信证据,包括特征选择、参数优化和集成学习等相关技术。 项目思路:手动标记部分训练示例或一小部分确定的规则,用于训练监督方法的初始分类器。然后让分类器用于未标记的语料库,以获取一个更大的训练集。这个过程重复进行,每个新分类器都在一个逐渐变大的训练语料库上进行训练,直到整个语料库被标记,或者达到给定的最大迭代次数。 效果如作品图片所示:
