V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  nyfok  ›  全部回复第 6 页 / 共 7 页
回复总数  128
1  2  3  4  5  6  7  
2019-06-18 20:10:41 +08:00
回复了 nyfok 创建的主题 程序员 某同学说我做的搜索太业余,邀请大伙来投票
为什么只做技术搜索?我从来没觉得 baidu 差,如果你真正做公司要养活团队,要回报股东,想着盈利的时候,未必会比 baidu 好到哪儿去。说技术超越 baidu 我也不太信,国内干过搜索的公司多的去了,腾讯也干过吧,现在也还有别的大公司在干搜索吧,但为什么用户搜索主要还用 baidu,那还是有原因的,几个人的小团队能干成的机会较小,能干成的一定是天才,我很崇拜。鉴于此,单纯的技术领域搜索还好,现在的硬件资源和技术资源我还勉强花的起,而且也可以有一些小创新可以试试看,所以纯粹是玩玩看。
搜索结果是二道贩子吗?对用人家的搜索结果,外穿一身皮的事情,我个人不太有兴趣,也违背了我玩的初衷。要做,就得做一个能够区别于 baidu,google 而又有独立存在价值的产品。所以,我摈弃了常规网页搜索正文提取的方法,而是老老实实一个个网站写模板,为的就是内容中不夹杂别的内容,保证搜索结果准确性。另外,我做结构化搜索,还能够提供论坛的回帖数显示,github 的 star 数显示,为的都是增强用户体验。楼上的有位朋友说得对,得垂直的够深,有特色,这和我想到一块了。目前是因为但关键字的 rank 我做的不好,还有当我的库里没有你的搜索结果时,前面偶尔几条结果我会参考 google,过一阵子我弄完后就回去掉。
当然搜索我觉得只是一步,未来我还期望提供更多的在线小工具,譬如 ip 查询,进制转换,js 加密解码,编程语言转化,webide 等等。尤其是知识共享平台。我觉得现在不比以前信息匮乏,现在信息足够多了,就要侧重在筛选,评级和共享,重用上,未来我可能会推出类似产品。在微软呆过的人可能知道 kb 和 so,我觉得这套知识积累成电沉淀体系就很好。
最后,再次真心感谢大家,祝大家好!
2019-06-18 20:10:23 +08:00
回复了 nyfok 创建的主题 程序员 某同学说我做的搜索太业余,邀请大伙来投票
刚才连续回复过猛,被 ban 了,这会刚恢复,我先拣要紧的说,回头再一一回复。
首先感谢大家的留言意见,不管是说好的还是批评的,我都非常感谢,因为发帖问大家的目的,也是因为我担心自己太自我、太膨胀,所以多听听朋友的意见总能让我更清醒的认识自己几斤几两,帮助自己提高。
尤其感谢提心我注意安全的朋友们,谢谢你们!我昨晚已经求助万能的 v 圈了,今天有几位很好的热心人给我违禁词清单了,我今晚就加上。我一定不给国家添乱。
再解释一下做 goobe 的原因。我是做产品的,或者说产品 80%,技术 20%。搞开发更像是我的兴趣爱好,一直坚持。和很多 it 男一样,烧数码,烧显示器,烧台灯,烧 wifi 我也是一个个玩过来(感谢另一个好社区 chiphell ),唯独编程始终不离不弃,应该算是强烈兴趣吧。
最近我在研究国内技术社区,窃以为程序员最刚需的就是搜索,不管是搜教程,搜 api,还是 debug 信息还是出错信息。如果一个技术社区连个搜索都做不好,怎么服务好他的用户?搜索最核心的就是 ranking 排序,现在很多引擎普遍是基于搜索关键词词频排序,而不太在意关键词之间的距离,这就会导致搜索的准确性。譬如“ import system.wen.httpcontext ”我们搜索时肯定期望文档中这几个词都要出现,而且越靠近约好。所以,考虑到技术搜索的特殊性,我觉得和通用新闻、资讯搜索不一样,所以我试水做了一个。另外,考虑到国内不能访问 google,我觉得这个搜索能够多索引一些国外网站,对大家也会更有帮助,所以另一部分重心放在了国外技术网站抓取上。
2019-06-18 19:25:10 +08:00
回复了 nyfok 创建的主题 程序员 某同学说我做的搜索太业余,邀请大伙来投票
@encro 多谢,能说一下哪个关键词吗
2019-06-18 18:02:11 +08:00
回复了 nyfok 创建的主题 程序员 某同学说我做的搜索太业余,邀请大伙来投票
@shoumu 多谢
2019-06-18 18:01:20 +08:00
回复了 nyfok 创建的主题 程序员 某同学说我做的搜索太业余,邀请大伙来投票
@dooonabe 是触发 bug 了,我今晚修复
2019-06-18 18:00:38 +08:00
回复了 nyfok 创建的主题 程序员 某同学说我做的搜索太业余,邀请大伙来投票
@AngryPanda 前期都抓的 csdn,后来才抓别的站
2019-06-18 18:00:08 +08:00
回复了 nyfok 创建的主题 程序员 某同学说我做的搜索太业余,邀请大伙来投票
@stiekel 视频搜索
2019-06-18 17:59:49 +08:00
回复了 nyfok 创建的主题 程序员 某同学说我做的搜索太业余,邀请大伙来投票
@superalsrk 自己做的,目前总索引到 900 万了
2019-06-18 17:58:50 +08:00
回复了 nyfok 创建的主题 程序员 某同学说我做的搜索太业余,邀请大伙来投票
基于开源 lucene 做的,只是修改了文档评分的算法,你要可以给你
2019-06-18 17:56:54 +08:00
回复了 nyfok 创建的主题 程序员 某同学说我做的搜索太业余,邀请大伙来投票
@brust 我最早先抓的 csdn,现在搜索默认取十万条,如果常规词很容易是 csdn。之前我优化了 page rank,等我再做完 site rank 就能把结果打散了。
2019-06-18 17:54:14 +08:00
回复了 nyfok 创建的主题 程序员 某同学说我做的搜索太业余,邀请大伙来投票
@ofooo 自己抓取的,但关键字的 ranking 做的不好,所以有几条结果参照 google
2019-06-18 15:02:41 +08:00
回复了 nyfok 创建的主题 问与答 各位朋友,求完整的禁查词/违禁词清单
[email protected] 多谢多谢
2019-06-18 14:53:15 +08:00
回复了 nyfok 创建的主题 问与答 各位朋友,求完整的禁查词/违禁词清单
@TimePPT 多谢你,请问怎么才能搞到相对完整的违禁词库?调用第三方 api 过滤,会让搜索变慢,最好是自己手里有库才快。
2019-06-18 09:15:38 +08:00
回复了 nyfok 创建的主题 问与答 各位朋友,求完整的禁查词/违禁词清单
太感谢了,谢谢朋友!总共 3789 条
静悄悄,都潜水了。。。。
2019-06-17 23:01:49 +08:00
回复了 nyfok 创建的主题 分享创造 业余开发了一个技术搜索引擎,请小伙伴们提提意见。
@JR1024 bug 已经 fix 了,多谢!
2019-06-17 17:22:32 +08:00
回复了 nyfok 创建的主题 分享创造 业余开发了一个技术搜索引擎,请小伙伴们提提意见。
@vifird 谢谢支持
2019-06-17 17:22:15 +08:00
回复了 nyfok 创建的主题 分享创造 业余开发了一个技术搜索引擎,请小伙伴们提提意见。
@hhzc 谢谢支持
2019-06-17 09:16:09 +08:00
回复了 nyfok 创建的主题 分享创造 业余开发了一个技术搜索引擎,请小伙伴们提提意见。
@JR1024 多谢提供,我今晚修复这个问题,再次感谢!
2019-06-17 09:15:40 +08:00
回复了 nyfok 创建的主题 分享创造 业余开发了一个技术搜索引擎,请小伙伴们提提意见。
@wangshuaikeyima 多谢多谢
1  2  3  4  5  6  7  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2731 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 15ms · UTC 15:04 · PVG 23:04 · LAX 07:04 · JFK 10:04
Developed with CodeLauncher
♥ Do have faith in what you're doing.