自媒体具有媒体属性,旨在提供资讯和见解,目前市面上的自媒体主要分为几类:
• 垂域专业领域的分享、科普,比如历史博主、数学博主、医学博主
• 前线真实调研、报道、总结,比如澎湃新闻等以记者为媒体的
• 预测发展的,比如投资机构、财经博主
现有媒体介质存在不可能三角,即实时、真实、前因后果叙事连贯不可能同时满足
从用户视角去观察:
• 用户甄别真假的能力弱,存在羊群效应,人云亦云,很容易被带节奏
• 用户想关注前沿动态的候选集较小,且基本上只是单点报道,不成体系
• 用户分布广泛,容易形成同好社群,想看他们想看的内容,以讹传讹概率变大
• 用户更倾向于去理解白话文章,能快速上手,也能博得更多认同
• 用户对文章中出现的广告不敏感,对文章中出现的转链很敏感,对诱导消费最敏感
• 用户在读文章的时候,文章按照时间线的演变会更加有粘性,这样的文章一般都是爆品
• 总会有好评和差评的用户,核心在于文章观点的主观性
• 某些用户一般更喜欢关注在"政治正确"之外的"不能说",但一直灰色总有湿鞋的时候,这样的
用户不太多
• 部分用户只喜欢阅读快讯而非长篇累文,部分有经验的读者更希望叙事严谨,连贯
深度文章市面上偏少(有实际价值的大v偏少),导致蓝海
• 很多文章内容同质性太强,且只是单点叙述,有经验的大v写不出,写的出的又不是有经验的
• 预测型文章几乎都是一家之言,很难证实和证伪,阴谋论大棋论者太多,人们往往相信那些
愿意相信的
• 能始终坚持一种观点的作者或者社区太少,或多或少都足够主观
• 第一时间的时效性,远胜任何矫揉造作
• 复制成本极低,优质内容一次产生,后续会被多个号加白和抄袭
• 打造个人或者团队ip的快速方式,可以拓展为资讯团队工作室
• 平台会对发文进行稿费补贴,优质内容会加影响力
• 过于灰色的文章即使流量极大仍然容易被铁拳,不如客观总结并堆量
• 更好迎合探索趋势的最重要方法是贴近实际信息源而非不断T+1或者T+N口径并夹带私活加
工下的自媒体总结
• flink-fluss实时和多个信息源进行订阅、加工,在阿里云申请实时云服务,实现难度20%
• 大模型总结,一期优选kimi,只总结,不推理避免幻觉,结果按照时间线输出,需要付费,
实现难度10%
• 推送微信公众号、知乎、头条接口,需调研,实现难度10%
• nlp技术,抽象文章标题的时间、主语、谓语、宾语,识别实体、动作、场景,作为检索指纹
id,实现难度60%
• 时序数据库,按照时间片保存主语、谓语、宾语的检索指纹id,实现难度10%
• 文档kv存储数据库(hbase),用于高效根据指纹id检索文档原始内容
-- 可能的话,需要图数据库,作为人物主题的图谱,关联频繁发生报道关系的其他人物
• 防止重复相似内容推送而使用的缓存,如果按照时间线,即使重复,重复部分的输出权重变
低,每篇文章行文着重讲变化的重点
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!

下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态
评论