V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
weiwenhao
1.3D
V2EX  ›  Google

google 搜中文太毒了吧,是不是已经放弃中文搜索了

  •  1
     
  •   weiwenhao · Oct 9, 2021 · 32895 views
    This topic created in 1672 days ago, the information mentioned may be changed or developed.

    http://asset.eienao.com/20211009101236.png

    这种垃圾搜索信息是不是能赚很多钱,我看里面都是广告,实现成本高吗。 就我搜索这个内容,google 出了 100 条,有 95 条都是小 xx 知识网,而且网址都不同,根本屏蔽不完

    Supplement 1  ·  Oct 9, 2021
    有的人有有的人没有,难道是被杀熟了
    201 replies    2021-11-03 10:30:46 +08:00
    1  2  3  
    XnEnokq9vkvVq4
        101
    XnEnokq9vkvVq4  
       Oct 9, 2021   ❤️ 1
    屏蔽也只是看不见而已,我试了一下楼主这个关键词,第一页有 7 个垃圾站,第二页 10 个全是垃圾站,第三页 9 个垃圾站,另一个是 csdn 。
    所以问题的关键并不是垃圾站多,而是 Google 搜到的正常站就那么几个。我想应该是 Google 的抓取机制和评价结果权重的机制被简体中文互联网的生态彻底玩坏了,从而被垃圾站所利用。
    XnEnokq9vkvVq4
        102
    XnEnokq9vkvVq4  
       Oct 9, 2021   ❤️ 8
    就像 Livid 的所说,大局域网给简体中文这门语言带来了不可挽回的伤害,比如 Google 已经无法正确评价、区分这门语言的高质量内容和低质量内容了
    1350943277
        103
    1350943277  
       Oct 9, 2021
    有没有大佬写个能 adguard 能用的规则呀
    rechtsstaat
        104
    rechtsstaat  
       Oct 9, 2021
    https://apps.apple.com/us/app/ublacklist-for-safari/id1547912640
    这个好像能在 ios 上用?安全吗?
    trn4
        105
    trn4  
       Oct 10, 2021 via iPhone   ❤️ 4
    #102 一点没错,简体中文的信息获取壁垒已经事实上被提高了,全体语言使用者都要为此埋单。
    Zeonjl
        106
    Zeonjl  
       Oct 10, 2021 via iPhone
    几乎全是各种小 x 知识网,一看就涨知识了多好
    gujun1225
        107
    gujun1225  
       Oct 10, 2021   ❤️ 1
    算了,我来说一句,搜索时候请使用空格“C 语言 二进制 输出”,你再看看结果如何。
    MYDB
        108
    MYDB  
       Oct 10, 2021
    nb 的 seo
    daimaosix
        109
    daimaosix  
       Oct 10, 2021 via Android
    关键词带上空格搜索,出现这种结果的就比较少
    Lemeng
        110
    Lemeng  
       Oct 10, 2021
    中文搜索一直就不是谷歌的强项
    enzyme
        111
    enzyme  
       Oct 10, 2021 via iPhone
    应该试繁体中文。
    Zien
        112
    Zien  
       Oct 10, 2021
    恶心死了, 我这边搜索 8/10 全是小 X 。 其他垃圾内容多少没那么大比例, 也没有这样连续的。
    corruptdu
        113
    corruptdu  
       Oct 10, 2021
    @kblacksheep 你确定不是英翻中而是中翻英吗?中文翻英文也太骚了了吧,再说中翻英的话机翻做不到自然语言那种效果啊。
    corruptdu
        114
    corruptdu  
       Oct 10, 2021
    太恶心了,搜了一下“Linux u 盘格式化”,首页只有三个结果是我要的,我特地翻了一下其他页全是小 x 知识网。果断换 startpage
    aliveyang
        115
    aliveyang  
       Oct 10, 2021
    真 TM 断子绝孙,直接明着搞了
    yfugibr
        116
    yfugibr  
       Oct 10, 2021 via Android   ❤️ 2
    不知道谷歌有没有放弃,反正我是放弃了
    deszon
        117
    deszon  
       Oct 10, 2021
    还真是,谷歌感觉是放弃了中文
    kblacksheep
        118
    kblacksheep  
       Oct 10, 2021
    @corruptdu

    是中翻英,因为配的图解里内容全是中文的。

    应该是谷歌机翻,英翻中的那些读起来也都很生硬
    weixiansen574
        119
    weixiansen574  
       Oct 10, 2021 via Android
    我尝试用百度搜索同样的内容,百度居然比谷歌还干净!惊了!百度基本上没有这些小 x 知识站。看来这些小 x 知识站针对的是谷歌,谷歌故意弄的不可能。谷歌被污染了,中文搜索我还是用回百度吧……
    nkcfc
        120
    nkcfc  
       Oct 10, 2021 via Android
    搜了一下“Linux u 盘格式化”,7 8 10 是小 X 百科网。
    litao3rd
        121
    litao3rd  
       Oct 10, 2021   ❤️ 2
    近期发现 google 上用中文搜索很多技术问题首页几乎都是各种 StackOverflow 的机翻页面,无力吐槽。

    现在几乎只用 google 英文搜索了
    JeffGe
        122
    JeffGe  
       Oct 10, 2021 via Android   ❤️ 1
    我很疑惑 Google 中文用户现在很多吗,多到值得他们去做内容农场盈利?阴谋论一点会不会现在这个和 08 年搜索联想投毒事件差不多,给舆论造势用的?
    SJ2050cn
        123
    SJ2050cn  
       Oct 10, 2021   ❤️ 1
    最近是真的多,使用 ublocklist 后,谷歌中文搜索一页就剩了 1 、2 项,还是用百度搜中文,谷歌搜英文吧。
    yazinnnn
        124
    yazinnnn  
       Oct 10, 2021
    但是百度被阿里云 腾讯云 华为云污染啊。。。

    不如学门外语,看外语资料过活了(我现在是在谷歌搜英文和日文资料
    litesoar
        125
    litesoar  
       Oct 10, 2021   ❤️ 1
    是不是每个人的搜索结果还不一样?
    zvl0reqglvd
        126
    zvl0reqglvd  
       Oct 10, 2021
    不用屏蔽广告的插件吗?
    goodhellonice
        127
    goodhellonice  
       Oct 10, 2021
    这个搞的人真是绝了。。。乌鱼子
    gujun1225
        128
    gujun1225  
       Oct 10, 2021
    @litesoar 我看到的结果跟你一模一样。我也很奇怪。因为我这里 Google 的中文结果质量其实也很高。不排除百度水军?
    bwangel
        129
    bwangel  
       Oct 10, 2021



    @litesoar 你开了 广告屏蔽插件吗?为什么咱俩的结果不一样
    bwangel
        130
    bwangel  
       Oct 10, 2021   ❤️ 1
    啊,我刚刚改了搜索设置,把区域改成了美国,就看到正常结果了。
    smallthing
        131
    smallthing  
       Oct 10, 2021
    1.google 的区域
    2.你是否登录了账号
    我的是没有这些的
    secondwtq
        132
    secondwtq  
       Oct 10, 2021   ❤️ 2
    我用同一个帐号,在 iPad 上需要翻两三页才看到大量这个站群的结果,在 PC 上一突开就满脸都是 ... 看起来 Google 在这种奇怪的地方下了不少功夫
    另外对于用户来讲,这个最好的手段应该是在服务器端把结果过滤掉,就不会出现“过滤之后首页根本没有结果”的现象了,不过 Google 貌似没有直接提供一个域名的全局黑名单。最骚的是这个站对“-知识网 -百科网”的关键词完全免疫,观察之后,用“-上一篇”把它干掉了(明明“百科网”在标题和正文里面都有,可能 Google 给文本分了词?虽然其实中文不需要这么干)。不过这个关键词居然貌似没有误伤 CNBlogs 。

    对于这个关键词(“c 语言二进制输出 -上一篇”)来讲,我的搜索结果中唯一值得关注的只有 CNBlogs,其实还有 CSDN 和百度知道的不少结果,但是这种结果会不会仔细去看就是个人喜好了。不过我最希望 Google 给出的其实是这个:
    https://zhihu.com/question/438434182/answer/1699713812 C 语言中为什么没有直接提供二进制数的输出? - 暮无井见铃的回答 - 知乎 看到 jajuju 的这个答案,我这个实验就算没白做。
    可惜在 Google 给出的一共不到一百个结果中,并没有这个结果(只有个知乎专栏的),好消息是如果你 site:zhihu.com 的话还是能找到的,我就是这么找到的。可见结果权重排序基本是乱的。

    从实际的角度来说,要想最大限度地“净化”搜索结果,那么应该可以搞一个白名单,Google Custom Search 貌似是可以这么做的,把 reddit.com wikipedia.org zhihu.com bilibili.com youtube.com bbs.nga.cn v2ex.com chiphell.com 等一干网站加进去就行了。这几个差不多 cover 了我需要的简体中文内容的一大半,另外还有百度贴吧,百度的结果明显比 Google 要好,这个没救。
    (我注意到 Google 还喜欢:对于同一个域名的结果,只显示他认为最 relevant 的,剩下的不给你看,或者有但是在二级页面里而不是全给你直接列出来。如果中文网络内容确实如此中心化的话,在 Google 这种策略下域名白名单反倒是更优的选择)
    这么搞有一个直接的缺点就是干掉了所有的独立博客,这个是没法穷举的。但是我发现好像就算不加任何过滤,中文独立博客的结果也很有限,所以直接大网站白名单好像也不会差太多。
    一个典型的例子是,刚才那个关键词几乎没有来自 github.io 的结果。但是单独 site:github.io 的话可以发现并不是没有有用的结果(虽然不多,大概是被“-上一篇”给干掉了)。鉴于确实有不少人往 github.io 上放博客,所以独立博客作者可以考虑往 github.io 上扔个副本然后链到主站,这样不需要审查,也算是间接 SEO 。
    idragonet
        133
    idragonet  
       Oct 10, 2021
    默认搜索也是这样的垃圾结果,改为美国正常了。
    soraginko
        134
    soraginko  
       Oct 10, 2021 via Android
    你不能还想马儿跑,还不让马儿吃草
    RangerWolf
        135
    RangerWolf  
       Oct 10, 2021
    习惯用英语搜索就好了。。。
    RangerWolf
        136
    RangerWolf  
       Oct 10, 2021
    没想到其他什么好的办法
    ipwx
        137
    ipwx  
       Oct 10, 2021
    曾经我让一个新来的实习生去装一下 proxmox 虚拟机平台,上面配置一套 ubuntu 20.04 的快速创建虚拟机的方案。然后他离职了,因为他在培训班没上过 proxmox 和 ubuntu,在中文技术圈也没多少这方面的资料。

    他走的原因:我不懂英文。
    ipwx
        138
    ipwx  
       Oct 10, 2021
    真的就很气,做 Linux 运维居然不懂英文?碰到新的软件包问题不能解决你歇菜嘛?
    ezreal
        139
    ezreal  
       Oct 10, 2021
    呼吁赶紧立法禁止垃圾站
    wsc449
        140
    wsc449  
       Oct 10, 2021
    放心,这种站早晚被 K
    omL72EEc
        141
    omL72EEc  
       Oct 10, 2021
    歪日,好鸡巴炫酷
    https://imgur.com/a/Tx0sAnJ
    omL72EEc
        142
    omL72EEc  
       Oct 10, 2021
    jihaiming
        143
    jihaiming  
       Oct 10, 2021
    我的搜索结果里没有这些。估计和区域设置有关系吧。
    Conty
        144
    Conty  
       Oct 10, 2021
    可能跟地域有关。我的搜索结果里面一个这种“小 x 知识网”都没有
    rpman
        145
    rpman  
       Oct 10, 2021   ❤️ 5
    @hanqian 孝死了,那 bing 怎么就能正确评价呢? 另外英文里的内容农场还少么?
    vvsystem
        146
    vvsystem  
       Oct 10, 2021 via Android
    @ipwx 我二本本科读心理,高中读文科,按照 google 搜出的个人博客站和 youtube,我都能配置 proxmox...
    ipwx
        147
    ipwx  
       Oct 10, 2021
    @vvsystem 对吧对吧,又不是什么为难人的要求。我说,自动化部署如果你不行,你反正在,给我手动装 Ubuntu 20.04 我也能接受。Ansible 脚本给写全了就行

    —— 然后说什么 Boss 直聘他这个要价( 15K 一个月)有意向的多了去了,和我们说拜拜。
    ipwx
        148
    ipwx  
       Oct 10, 2021
    @vvsystem 25 岁以上的低学历程序员,市面上的,总感觉就是打算一招鲜吃遍天。工资可以不涨,当时让他学新的东西,简直就是赶驴上树。。。。

    后来我全都自己配了
    Andrue
        149
    Andrue  
       Oct 10, 2021
    测试一下,搜索设置里指定区域为美国后五十个搜索结果里被过滤的数量减少到了十三个,可供参考
    jousca
        150
    jousca  
       Oct 10, 2021
    @rechtsstaat 安全。
    jousca
        151
    jousca  
       Oct 10, 2021
    ublacklist

    标题正则屏蔽。
    XnEnokq9vkvVq4
        152
    XnEnokq9vkvVq4  
       Oct 10, 2021 via iPhone
    @rpman 没错,我也等着 bing 啥时候被玩坏
    mazai
        153
    mazai  
       Oct 10, 2021
    卧槽。。。感谢楼主提醒,我之前都没有意识到这个毒瘤,我一直以为就是简单的垃圾网站,感谢帖子里的大佬,已经成功屏蔽!!!
    skiy
        154
    skiy  
       Oct 10, 2021
    中文还是得百度,就是百度这货,太懂中文了,所以~
    谷歌现在收录中文站不那么积极了,相反 BING 现在收录非常快。
    Pipecraft
        155
    Pipecraft  
       Oct 11, 2021   ❤️ 3
    @skiy #154 说反了。
    如果是一个新的网站,没有备案的,百度根本不收录,Bing 只收录部分页面,相反,谷歌收录的非常快,非常多。
    拿我的一个新网站为例,1 个多月了,百度收录 0 个,Bing 收录 10 个,谷歌 133 个。
    所以现在这种“小 x 知识网”在谷歌泛滥,百度,Bing 没有问题,因为百度,BIng 不(积极)收录这些新网站。
    Pipecraft
        156
    Pipecraft  
       Oct 11, 2021   ❤️ 3
    每个“小 x 知识网”域名的 sitemap.xml 里全是比较热门的搜索关键字的网页链接,内容页也满是关键字和看似优质内容的句式。SEO 做得这么好,谷歌又很快的收录它们,用谷歌当然搜到的全是它们了。

    即使使用屏蔽插件,这些网站还是活的好好的,大部分用户还是深受其害。
    需要别的方法毁掉这些网站。
    比如让 Google Adsense 对它惩罚。需要网友们齐心协力。
    skiy
        157
    skiy  
       Oct 11, 2021
    @Pipecraft 我有没有说反我自己还不知道?我网站是有备案的,百度收录一直只有 32 条。然后我更换程序(将数据转换到别的 CMS )后,百度数据依然没变化。必应不到一天就重新收录了新网站(看收录的描述和 URL 可以看得出来),而谷歌依然维护在几百条(且网站描述和 URL 没有变化,说明没有更新数据)。

    谷歌:About 472 results (0.20 seconds)
    必应:3,140 ResultsAny time
    百度:找到相关结果数约 32 个

    我是站在我自己亲历的来讲的,你的或者不一样吧。
    CRH
        158
    CRH  
       Oct 11, 2021 via iPhone   ❤️ 1
    已向 Google 举报,来一起搞吧!

    入口:
    https://developers.google.com/search/docs/advanced/guidelines/report-spam

    进去点” Report spammy content (Google Account required)”,然后依次填网址、搜索关键字,简要说明
    axiauk
        159
    axiauk  
       Oct 11, 2021
    比 度娘强太多了。
    pC0oc4EbCSsJUy4W
        160
    pC0oc4EbCSsJUy4W  
       Oct 11, 2021
    用了插件,搜索结果为 0
    n1dragon
        161
    n1dragon  
       Oct 11, 2021   ❤️ 1
    我感觉这是有人想搞臭 Google 的名声。没人去用当然就不用花那么多钱封锁掉了。想都不用想这个傻逼是谁。
    fru1t
        162
    fru1t  
       Oct 11, 2021
    搜索内容加个双引号,我一般这样搜神秘代码都可以在线直接看。
    ming159
        163
    ming159  
       Oct 11, 2021
    换个梯子的节点就好了,可能是某些节点的问题.
    banliyaya
        164
    banliyaya  
       Oct 11, 2021
    歪日,我这搜这个显示屏蔽了 10 个搜索结果,前 4 页都是这样,然后显示屏蔽的搜索结果全是这个。。。
    huangdanyu
        165
    huangdanyu  
       Oct 11, 2021
    梯子换成美国的 就变好了
    yujinchn
        166
    yujinchn  
       Oct 11, 2021
    我这也跟楼上一样一直很正常,从来没有什么知识网,奇怪
    yujinchn
        167
    yujinchn  
       Oct 11, 2021
    @yujinchn 美国的梯子
    soraginko
        168
    soraginko  
       Oct 11, 2021 via Android
    @soraginko 我收回前言,这个内容农场确实该骂
    zficode
        169
    zficode  
       Oct 11, 2021
    有没有黑客大佬可以攻击这个网站,
    nicebird
        170
    nicebird  
       Oct 11, 2021
    妈的全是,不知道怎么搞啊
    andyskaura
        171
    andyskaura  
       Oct 11, 2021
    ai 写文章啊 搜什么都能看到**百科网
    manzhiyong
        172
    manzhiyong  
       Oct 11, 2021
    都是原来牧羊犬吹的太厉害,什么技术牛逼,比百度还强,大潮退去才发现还是靠人工审查
    hu8245
        173
    hu8245  
       Oct 11, 2021
    技术方面的东西,我已经换成输入英文搜索了,虽然英语水平一般,但配合翻译也凑合。中文的话,一般都是英文手段不奏效或者过于有特点,才会用中文。
    不可否认,简体中文的信息密度低到不能再低了,真是没办法
    1016
        174
    1016  
       Oct 11, 2021
    设置精准匹配就好了一些。但每次都要选择精准匹配就很烦....
    libook
        175
    libook  
       Oct 11, 2021
    现在基本上是:
    政务信息上百度,
    中文信息上必应,
    英文信息上谷歌。

    有时候搜索结果比较诡异就多在几个搜索引擎试试。
    b00tyhunt3r
        176
    b00tyhunt3r  
       Oct 11, 2021 via iPhone
    @gujun1225
    百度连空格都不用加 胜负一目了然吧
    wtdd
        177
    wtdd  
       Oct 11, 2021
    好奇怪,照理说现在能用国内中文 google 的,根本不可能上他的当,这人自带干粮干这事是什么目的呢?
    AlexLokhart
        178
    AlexLokhart  
       Oct 11, 2021
    HaydenYe
        179
    HaydenYe  
       Oct 11, 2021
    好好学英语吧 hhh
    akaxiaok339
        180
    akaxiaok339  
       Oct 11, 2021
    @gujun1225 绝了
    FengMubai
        181
    FengMubai  
       Oct 11, 2021
    电脑用插件 https://github.com/cobaltdisco/Google-Chinese-Results-Blocklist/issues/56, 手机上我已经改用 duckduckgo 了
    Andreas8
        182
    Andreas8  
       Oct 11, 2021
    不知道点击谷歌搜索页面的反馈会不会有效?
    FengMubai
        183
    FengMubai  
       Oct 11, 2021   ❤️ 3
    @litao3rd #121 针对 stackoverflow 机翻站, 这里推荐一个 ublacklist 规则集 https://github.com/arosh/ublacklist-stackoverflow-translation
    zhq566
        184
    zhq566  
       Oct 11, 2021   ❤️ 1
    区域换成漂亮国,结果变好了。
    bigwang
        185
    bigwang  
       Oct 11, 2021   ❤️ 1
    搜索引擎主要依赖用户 搜索-点击 数据来做排序的,搜索质量和市场占有率正相关
    google 中文搜索 0.1%不到的占有率,能做好啥?
    cnrting
        186
    cnrting  
       Oct 11, 2021 via iPhone
    @wtdd 格局小了,中文用户不一定只在中国大陆
    ianEros
        187
    ianEros  
       Oct 11, 2021
    @bwangel 我也改成美国,但是再加上 -csdn 基本上又变回来了
    wtdd
        188
    wtdd  
       Oct 11, 2021
    好奇怪,照理说现在能用国内中文 google 的,根本不可能上他的当,这人自带干粮干这事是什么目的呢?
    @cnrting 抬这杠没劲,说了国内,你觉得国内不等于中国大陆?
    marcojbk
        189
    marcojbk  
       Oct 11, 2021 via iPhone
    @hanqian 你跟 livid 一样是肉翻的吗
    Microseft
        190
    Microseft  
       Oct 11, 2021
    firefox 隐私模式(没有登录任何账号,空白浏览器)
    https://i.loli.net/2021/10/11/UTclpO9odYqIVFk.jpg
    icelo
        191
    icelo  
       Oct 11, 2021 via iPhone
    你是不是把 csdn 屏蔽了。主要现在很多 lj 网站多,像程序员大本意、程序员宅基地、程序员宝宝等等都是些爬虫套壳
    sebastianwade
        192
    sebastianwade  
       Oct 11, 2021
    基于 uBlacklist 的快速配置:

    https://mp.weixin.qq.com/s/IZpSKjamsQL6O-yN3TqJNA
    L5tEU4WX072p5P42
        193
    L5tEU4WX072p5P42  
       Oct 12, 2021 via iPhone
    已经困扰很久了,用插件屏蔽不完
    L5tEU4WX072p5P42
        194
    L5tEU4WX072p5P42  
       Oct 12, 2021 via iPhone
    我的原则是:Google 不行就用必应或者鸭鸭 go,坚决不用百度
    joyqi
        195
    joyqi  
       Oct 12, 2021 via iPhone
    真 tm 绝了,翻了几十页全是小 x😂,比我们 seo 做得好多了
    wqgogogo
        196
    wqgogogo  
       Oct 12, 2021
    绝绝子,之前用的时候还没遇到,搜了下,还真是和楼主说的一样
    平时用 bing 比较多,Google 还要梯子
    btv2bt
        197
    btv2bt  
       Oct 13, 2021
    日,我这两天也遇到了这个问题,太恶心了。
    wsqzwa1
        198
    wsqzwa1  
       Oct 17, 2021 via Android
    @1350943277 我更想要大佬写一个 clash 的规则…
    bronco
        199
    bronco  
       Oct 18, 2021
    试着点了下,似乎域名都歇菜了?但是 google 还有索引......
    amin
        200
    amin  
       Oct 19, 2021
    今天似乎好了。
    1  2  3  
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1175 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 218ms · UTC 23:27 · PVG 07:27 · LAX 16:27 · JFK 19:27
    ♥ Do have faith in what you're doing.