freefreesea

freefreesea

V2EX 第 402347 号会员,加入于 2019-04-16 20:01:08 +08:00
今日活跃度排名 9339
科技不该冰冷,人性不该傲慢
刚做了个全网突发热点功能
分享创造  •  freefreesea  •  8 天前  •  最后回复来自 freefreesea
41
热榜站热点追踪功能调研
问与答  •  freefreesea  •  18 天前  •  最后回复来自 usn
1
字节社区里的这个文章的 url 他是怎么得出来的
问与答  •  freefreesea  •  23 天前  •  最后回复来自 94
2
问下佬们在 LinuxDo 这个网站体验怎么样
互联网  •  freefreesea  •  20 天前  •  最后回复来自 freefreesea
33
freefreesea 最近回复了
@Amyang 历史版本里确实出现过更新时间显示不正常的问题,不过应该改过了吧,哈哈
@livib 可能在你的眼里,我做的很多东西没有意义或者意义不大。但是我自己也是和好多个新闻行业从事者聊过,最终确定了热点的分钟级,并且他目前也产生了一些价值。那么我觉得我的目的也达到了。

其次是这样。ai 这块消耗确实大,如果后续 ai 这块因为各种原因没法继续做。那无非就是暂时去除 ai 相关,站里有个突发模块,他是通过本机的算法来总结归并热点的,没有通过 ai ,存在一定误判性。这个功能就是给未来某天 ai 不可用的时候来兜底的。

ai 不可用的情况下,站里依旧还有全网实时热点、热点搜索、热点历史追踪等等价值比较高的功能。

我也没有必要立贴说保证什么东西,没有绝对的保证,我只能说不论环境、资源、额度等等所有东西如何变,我尽可能的让热榜站的功能都做到比较有用的程度。
@livib 其实就是要做最新最热。不然的话,那我每 5 分钟每 10 分钟做一次也不是不可以对不对。
因为用我们站的也有很多从事新闻行业的朋友,聊过之后发现,他们对热点的捕捉实时性要求还是比较高。并且他们其中某些人,也通过自己落实了一些政策的落地,所以我就把实时性提到了分钟级,也希望能帮到他们。
@livib 哪一块的实现方式
@artshooter 没有小红书,小红书的热榜是需要自己把小红书的数据存下来,然后自行排序去弄的,官方好像是没出这块
@livib 每个热点平均按照 15 个字算,每分钟就是 15 万个汉字,
糖果指数里面一共 8 个维度:就是 15 万*8*60 分钟*24 小时
ai 模式下,是对各个单独分类下的独立总结分析预测。算了下每分钟消耗是 10 亿左右。
真实算下来,一天应该是到 25-40 亿左右的 token 消耗
@livib 用户数量倒不大,每天 uv 不到 1000 这么个样子。主要想的是把质量做好,能帮助到真正需要的人。
@livib 站内的 token 消耗主要在两块。
一是首页的 [糖果指数] 、二是 [AI 模式] 下的热点总结、分析、预测。
目前热榜站每分钟产生的热点数据大概在 1 万条左右。
- 糖果指数就是每分钟对这 1 万条热点信息进行分类、总结热点、排序等。
- AI 分析就是对原平台各个分类下的原始热点进行总结分析预测、排序等。
@usn 我们每个人都有情感、缺点和局限,不能因为自己会点技术、懂点知识,就看不起别人。比如有些程序员或科技爱好者,碰到小白用户问很基础的问题,就不耐烦地说“你连这个都不会?”这就是人性的傲慢。
真正好的人,会耐心地教、温和地解释,把知识分享出去,给他人带来便利,而不是用它来显摆或贬低别人。
好的人要保持谦卑,用自己的能力去温暖别人,而不是冷漠地炫耀、嘲讽、鄙夷。
@Co1e 这是啥
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   5117 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 22ms · UTC 09:31 · PVG 17:31 · LAX 01:31 · JFK 04:31
♥ Do have faith in what you're doing.