201
nicoljiang OP |
202
ddup 2019-07-28 14:30:47 +08:00
@nicoljiang #201 多谢,商业模式我们有考虑,个人版就是先交朋友。
我是觉得 Doge 搜索可以考虑用 ES 取代 Solr,能获得更多技术红利,ES 在智能问答、机器学习方面都有成熟的方案。 想知道 Doge 搜索这么大规模的网站爬取,用的是哪个爬虫系统呢? |
203
zdb1115 2019-07-28 16:25:28 +08:00
谢谢分享。
|
204
nicoljiang OP |
205
oahebky 2019-07-30 15:42:21 +08:00
确实很强呀,代替百度用了两天了,广告等角度除外的话,个人感觉不能说就比百度好。
但是比起必应中国版好太多了。 |
206
haps42 2019-07-30 16:16:35 +08:00
用两天试试
|
207
dfly0603 2019-07-30 17:49:27 +08:00
希望搜索疾病类的关键词时候,msdmanuals 的结果上移一点,避免一些非专业网站的胡说八道,感谢!
|
208
thankfish 2019-07-31 11:30:35 +08:00
炒鸡好用啊,已经给身边各类朋友推了,浏览器也换默认了,加油!
|
209
nicoljiang OP |
210
lic2zac 2019-08-01 10:43:57 +08:00
很厉害,先使用一段时间看看
|
211
dfly0603 2019-08-02 20:38:02 +08:00 via Android
|
212
dfly0603 2019-08-02 20:43:07 +08:00 via Android
@nicoljiang 另外,搜索页面展示的时候,排版似乎有错乱问题,即文字是环绕着图片的,看起来比较凌乱。
小建议:展示结果的时候使用 卡片布局 ,这样家里视力不太好的长辈可以轻松辨认各个结果。 感谢开发者! |
213
hellobullshit 2019-08-03 10:52:08 +08:00 via iPhone
顶,用了一下,结果准确,良心搜索,已设首页,希望能坚持下去
|
214
wssy 2019-08-03 12:42:32 +08:00 via Android
设为默认搜索引擎用了几天了,内容可能还不够丰富。但还是很看好的,加油
|
215
wssy 2019-08-03 12:43:40 +08:00 via Android
据说头条也要做搜索引擎了,到时候好玩了
|
216
oahebky 2019-08-03 16:22:33 +08:00
在公司用过几天之后,现在决定将家里的电脑的“打开新标签”重定向也改到 doge 上。
今天对比了一下 “ mysql ALTER TABLE ENCODE ” 和 “ mysql mysql utf8mb4 utf8mb4_unicode_ci ” 这两个搜索结果。必须说将 StackOverflow 放得比较靠前对程序员是很友好的,同时也看到了一部分个人博客的结果,内容也挺不错的。 至于百度那边,搜索这类东西只能出“ CSDN ”,“博客园”,“简书”,“百度知道”的结果。 同时写这个评论的时候,又试了 “ zsh HOME END not work ” 这个搜索,百度还是老样子,doge 上能出现 github 的 Issue,百度不行。 要我说这才是一个搜索引擎该有的样子,搜索出来的内容必须是全世界的网站(母语和英语)才对。 我个人每次百度的结果点了三四个不对之后只能酸酸乳到 google 上再搜索一遍。 建议: 个人希望结果能够将网站内的图片(比如好的博文会有运行截图,代码截图一类)显示出来。这样对于快速定位到内容质量好的博文应该有帮助。 希望这个网站能够一直做下去。生活娱乐等等内容没怎么用(一般也是在手机上搜索和看),但是技术类的搜索结果我个人认为已经比百度好了。 |
217
oahebky 2019-08-03 16:54:39 +08:00
哦,对了,个人建议对显示二维码图片的结果把二维码图片去掉(如果图片是二维码就过滤掉)。个人觉得看着二维码很头疼( segmentfault 站点结果几乎都是二维码比较严重)。
不知道其他人是不是也不喜欢结果里面的图片是二维码,我是宁愿没有图片也不愿意看图片是二维码。 |
218
heywin 2019-08-03 18:09:26 +08:00
已设置默认搜索引擎,我们 v 站还是能人多!
|
219
DefoliationM 2019-08-18 13:23:51 +08:00
「不追踪,不误导」
「香港各界支持止暴治乱」 😂 |
220
heywin 2019-08-20 12:00:39 +08:00
建议移动端输入的时候搜索条能跑到页面最上方,给键盘留出足够位置。
|
221
nicoljiang OP @heywin 不是很明白你的意思,能否截图看看。可以发到我的邮箱 [email protected]
|
222
QMore 2019-08-20 21:35:53 +08:00
可以可以,多一种选择挺好。
|
223
wssjj 2019-08-21 11:28:29 +08:00
好用好用。多谢。
|
224
hanksun 2019-08-23 01:58:50 +08:00
感谢分享,祝福一路平安。
|
225
hanksun 2019-08-23 02:04:26 +08:00
啥时候能进驻火狐的 One-Click Search Engines ?
|
226
nicoljiang OP @hanksun 多谢多谢。要跟大浏览器合作,恐怕还得沉淀一下~
|
227
kaiyun 2019-08-23 15:33:18 +08:00
好用!!!!!!!!!!!!
|
228
beijiaoff 2019-09-02 20:11:14 +08:00
网站无法访问了吗?
|
229
nicoljiang OP @beijiaoff 没有啊。看记录似乎一切正常
|
230
MaiKuraki 2019-09-03 01:33:40 +08:00
扫文资讯网站哪儿去了?
|
231
beijiaoff 2019-09-03 14:43:48 +08:00
@nicoljiang 看来是我学校网络的问题了,能 ping 通,但是无法访问。用 4G 访问正常。
|
232
nicoljiang OP @MaiKuraki 那个属于技术测试的网站。跑到后来流量太大了,成本太高,就关掉了。
@beijiaoff 如果可以的话,麻烦把 ping 的结果发我一下,以及「无法访问」的具体情况描述一下。比如:DNS 解析不了、服务器连不上、证书问题 等。然后再把你的地域情况给我一下~ 如果觉得信息敏感,可以发到 [email protected] |
233
beijiaoff 2019-09-03 16:10:15 +08:00
ping 很稳定:来自 47.112.96.245 的回复: 字节=32 时间=53ms TTL=48
用 chrome: 该网页无法正常运作 www.dogedoge.com 未发送任何数据。 ERR_EMPTY_RESPONSE 但是我用 ip 地址访问 https://47.112.96.245/ ,可以正常使用,只是证书无效。好奇怪。 |
234
nicoljiang OP @beijiaoff 不对呀,你是不是 ping 了「 dogedoge.com 」,这个是非 CDN 的,正常访问会跳转到「 www.dogedoge.com 」这是带 CDN 的。
麻烦你 ping 一下 www.dogedoge.com 再看看结果呗。 |
235
beijiaoff 2019-09-03 16:57:46 +08:00
|
236
beijiaoff 2019-09-03 16:59:12 +08:00
奇怪,刷新几次后,又不行了。
|
237
nicoljiang OP @beijiaoff 你方便加一下我的微信么:nicol#jiang (去掉#号)。
|
238
Chenamy2017 2019-09-05 14:30:28 +08:00
膜拜大佬,设为默认浏览器体验后会反馈。
|
239
comet 2019-09-17 22:47:09 +08:00
非常感谢大佬提供一个优秀的搜索引擎,但是,请把“不追踪”去掉,因为现在每一个搜索结果点击以后都会先打开一个 dogedoge 的链接,然后才会重定向到真正的链接。
|
240
nicoljiang OP @comet 感谢你的认可,不过那个跳转链接跟追踪没什么关系的哈(不追踪不是指这个)。
|
241
comet 2019-09-18 08:29:26 +08:00
@nicoljiang 可是这个很影响使用,因为连接到 dogedoge 的速度很慢,每次都要等 1 秒才能重定向到真正的地址,网络不好的时候甚至要等 2-3 秒。希望能有个选项可以禁止跳转,直接打开真正的网站。
|
242
nicoljiang OP @comet 不会的。连搜索大部分时候都不需要 1 秒,跳转这边更不可能要好几秒。如果确实有这个问题,看能不能麻烦你帮忙截一下「开发者工具」的图。下面是我的情况:
https://nfiles.dogedoge.com/snap/2019-09-18-0LmY8s.png 记录里的第一行就是跳转的记录,大概 100 毫秒左右。 |
243
oahebky 2019-09-21 15:59:56 +08:00
我又来提建议了:
今天搜索一个“git clone depth = 1 how to checkout branch” 这个问题。 dogedoge 给出的结果是: stackoverflow.com/questions/24107485/how-to-checkout-remote-branch-with-git-clone-depth-1 放在第一条,这确实也是一个好的结果,但是里面的答案还是和我设想有点儿差距(我想要在原有的基础上 checkout branch,而答案是重新 clone 一个 depth 为 1 的指定 branch )。第一条下面的一些结果是中文的。 本来不对百度有什么期望,我同样的搜索关键第一条结果是: <a href="https://www.jianshu.com/p/1397ce990c58"><b>git clone --depth=1 之后拉取其他分支</b></a> 它是中文的(简书博客),而且内容对我来说更好。 个人认为因为这是中文地区,中文的结果(博客之类)也可以考虑适当平衡一下,未必 stackoverflow 就要作为第一个结果。 ---- 就是纯粹说一下使用过程个人感觉可以改进方向。dogedoge 确实提供了混合外文搜索结果的一个好的入口;所以仅供参考哈。 |
244
nicoljiang OP @oahebky 收到,这个问题已经比较细和复杂了,我后面会研究一下,非常谢谢你。
|
245
jimages 2019-09-24 21:06:34 +08:00
你好,比较好奇 dogedoge 的排序是怎么排序的? CS 在校学生,想学习一下
|
246
Bunnyranch 2019-09-25 21:24:46 +08:00
搜句子好像还是不太行 比如我搜了这一句“你现在很秀 但是下一秒我就会变的和你一样秀”
baidu 的结果,第一页每一个都和这句话相关。。 dogedoge 第一页有一个结果相关 其他的结果全部不相关 我观察了一下 具体哪里不同,这些句子里 很多内容在 百度贴吧 微博 爱奇艺 bilibili 等网站,确实这几个地方是目前中国网络内容(贴吧,文字内容; bilibili 视频内容)产出最多的地方,能不能考虑将搜索结果针对这几个站点进行一定程度的优化呢,这样在语句搜索可能会有更好的体验? 第一页的搜索结果几乎全都不相关,说实话有点不太成熟 |
247
Bunnyranch 2019-09-25 21:34:18 +08:00
不过我又试了试搜短词句 我之前看过 西南地区 X 行业 的股票 忘记名字了 我用 dogedoge 搜 西南 XX 股( XX 为行业名称) 第二个结果就是我忘记的股票。。 而用百度搜。。第一页全是配资平台。 这一点让我印象很不错哦
|
248
v2exe2v 2019-09-26 07:11:01 +08:00
@baicheng10 奉孝是谁
|
249
baicheng10 2019-09-26 08:10:18 +08:00 1
@v2exe2v #248 郭奉孝,郭嘉。
|
250
nicoljiang OP @Bunnyranch 或许各有所长吧。目前我个人对百度的认知,还是娱乐搜索。它搜娱乐信息确实非常棒。
|
251
v2exe2v 2019-09-26 16:25:10 +08:00
@baicheng10 #249 好的
|
252
TangMonk 2019-09-26 20:41:31 +08:00
提个建议,搜索结果中的 result snippet 在点击后会跳转,个人感觉不太好,只有 title 点击才会跳转比较合理点,类似谷歌那样
|
253
fanyz 2019-09-28 14:31:54 +08:00 via Android
404 了老哥,修复一下吧
|
254
nicoljiang OP |
255
cxbeat 2019-10-08 10:59:53 +08:00
502 了...是在维护吗
|
256
nicoljiang OP @cxbeat 一直 502 吗?你是在海外还是(或是不是全局翻墙)?
|
257
nicoljiang OP @nicoljiang 海外的 CDN 优化了一下,应该可以大幅优化 502 的情况(国内外访问很容易被中断,你们懂的。。)
|
258
thinkwei2012 2019-10-09 18:10:47 +08:00
我是过来点赞的👍
|
259
itisaun 2019-10-15 12:50:00 +08:00 via Android
大佬,我把这个当成默认搜索引擎,最近总是提示 ERR_TOO_MANY_REDIRECTS
|
260
nicoljiang OP @itisaun 你好,因为近期频繁遭遇一些刷关键词的黑产攻击,所以目前需要打开 cookies 才可以正确搜索,不然会陷入「无限跳转」。
|
262
nicoljiang OP @tt0 感谢感谢,很简洁精致的小站。
|
263
ffeefly 2019-10-28 16:58:22 +08:00
日用一段时间,和谷歌互补了
|
264
FishLi 2019-11-01 18:37:41 +08:00
你好 在输入框里输入 a 的时候 出现了错误提示
Parse error: syntax error, unexpected ''e' (T_ENCAPSED_AND_WHITESPACE), expecting ']' in /data/wwwroot/default/index.php on line 372 |
265
nicoljiang OP @FishLi 很奇怪,你现在看看好了吗?
|
266
FishLi 2019-11-02 09:37:49 +08:00
@nicoljiang 可以了 输入 a 或者 b 不会给出搜索提示 c-e 有提示 其余的没试 您也可以看看是不是 bug
|
267
cxbeat 2019-11-02 11:37:27 +08:00
@nicoljiang 有一段时间没有上 v2ex,回复晚了,抱歉。我在国外,之前有几天 502 比较严重,现在正常了
|
268
wudipilihuo 2019-11-03 10:29:50 +08:00
想问下为什么最近几天这个搜索引擎速度很慢,有时候直接输完关键字点搜索直接就提示“意外终止了链接”
|
269
nicoljiang OP @wudipilihuo 方便在「开发者工具」当中看一下请求的 IP 吗?有点怀疑是用了全局 VPN 之后造成的~具体情况期望能与 [email protected] 联系。谢谢你~
@cxbeat 收到,谢谢。 |
270
nicoljiang OP @FishLi 好的,这个是正常的哈,谢谢你反馈。
|
271
nishizhu 2019-11-05 09:33:04 +08:00
@nicoljiang 你好,请问下能不能添加搜索英语单词的时候直接显示出它对应的中文意思呢,谢谢啦~
|
272
nicoljiang OP @nishizhu 这个目前正在调研和开发哈。
|
273
nishizhu 2019-11-05 16:01:44 +08:00
@nicoljiang 谢谢咯~
|
274
mwlgcmwlgc 2019-11-05 16:27:22 +08:00
TangMonk 用户说的确实是个很影响使用的大问题啊。 现在似乎是检测了鼠标点击和释放事件,但我只是想在 result snippet 上选择文本并复制的话,还是会跳转进去 !
|
275
nicoljiang OP @mwlgcmwlgc 好的,我思考一下(这个本质上是为了方便点击)。
|
276
dianso 2019-11-06 19:49:13 +08:00
google 也好看啊,抄 google 的吧。
|
277
taobao92307 2019-11-07 11:01:27 +08:00
感谢大佬的作品,试用了一会感觉比预想好得多,值得长期关注!
另外看到 240 楼前后的讨论,我一直也有这个困惑,搜索引擎结果连接貌似都不是直链而是跳转过去的,作为强迫症以前每次看见这个都感觉有种无法言说的别扭。想了解一下搜索引擎为什么这么做,是为了对点击结果做记录吗? |
278
nicoljiang OP @taobao92307 之前有提到,为了防止攻击和高频抓取(例如 做学习的、刷关键词的黑产)。
|
279
soon 2019-11-07 14:23:14 +08:00
感谢大佬,搜索不错,收藏了
但是有个和 #252 楼一样的建议,电脑上的页面,点击搜索结果的描述部分希望不要跳转,有时候描述信息里有些名词吸引到我,我会选中然后搜索 |
280
FishLi 2019-11-07 17:23:30 +08:00
输入两个英文句点后页面会报错 貌似会刷新 某种情况下会一直向服务器请求数据 \ 这样的字符收到的也是错误提示
|
281
FishLi 2019-11-07 17:26:47 +08:00
不是刷新页面 是清空了输入框 连续请求固定次数 请求无果后停止
|
282
nicoljiang OP |
283
wudipilihuo 2019-11-07 19:46:42 +08:00
@nicoljiang 但是我并没有使用 VPN 啊,很郁闷,前段时间还好好的
|
284
wudipilihuo 2019-11-07 19:47:59 +08:00
@nicoljiang 反正最近一段时间不是提示“意外终止”就是要加载半天才能显示结果
|
285
nicoljiang OP @wudipilihuo 能否在「开发者工具中」看一下,请求到的哪个 IP 呢?
|
286
FishLi 2019-11-07 20:01:05 +08:00
在搜索框内连续输入两个英文句点 [..] ,收到 error,js 继续自行向服务器请求 128 次
|
287
nicoljiang OP @FishLi 好奇怪,你这个问题我试了一下,发现会到弹到首页的。
|
288
wudipilihuo 2019-11-08 13:27:19 +08:00
@nicoljiang 好吧,我不太会看,是 network 里的那个远程地址吗?
|
289
nicoljiang OP https://nfiles.dogedoge.com/snap/2019-11-08-Xnip2019-11-08_13-51-36.png
@wudipilihuo 这个 Remote Address,谢谢~ |
290
wudipilihuo 2019-11-08 19:40:33 +08:00
|
291
nicoljiang OP @wudipilihuo Hello,我感觉这个 IP 没问题,在你截图中好像也是 200,可以正常访问对吧。
|
292
wudipilihuo 2019-11-09 00:49:42 +08:00
@nicoljiang 是的,现在可以了,但是前一段时间是不行的,就很奇怪...
|
293
edisonyan 2019-11-11 12:40:33 +08:00
@nicoljiang
最近 edge beta 更新至 79.0.309.15 版本后 打开 doge 就会造成浏览器假死 。公司电脑和家里都一样,用百度就没问题。 大佬能麻烦查下是否是我本地原因还是 doge 的问题么 |
294
nicoljiang OP |
295
edisonyan 2019-11-11 17:07:24 +08:00
@nicoljiang
目前是稳定必现的 环境如下 公司: windows 10 1809 17763.805 (从 win7 一路自动更新上来的) 79.0.309.15 (官方内部版本) beta (64 位) 问题现象:打开 doge 后无论开启任何网页会在一段时间后假死,只能关闭浏览器解决。 家中: windows 10 1909 (新配电脑,全新安装,纯净状态) 79.0.309.15 (官方内部版本) beta (64 位) 问题现象:打开 doge 后无论开启任何网页会在一段时间后假死,可以通过关闭 doge 所在标签也解决。 |
296
nicoljiang OP @edisonyan Windows 的话,Edge 是 Chromium 内核吗?
|
297
edisonyan 2019-11-12 01:40:38 +08:00
@nicoljiang 是的呢 chromium 内核的 edge beta 通道,版本如上所示。79 以下版本都未出现过此问题
|
298
nicoljiang OP @edisonyan 好的,这个我得回头找找 Windows 来复现一下,你是否能再试试 Canary 版本(但既然提到了是新版出现的问题,我认为大概率跟浏览器本身有关,不过我也向知道发生了什么)。
|
299
edisonyan 2019-11-12 14:23:04 +08:00
|
300
cdlnls 2019-11-15 20:55:54 +08:00
最近一直把这个当作默认搜索使用,很好用!
|