V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
这是一个专门讨论 idea 的地方。

每个人的时间,资源是有限的,有的时候你或许能够想到很多 idea,但是由于现实的限制,却并不是所有的 idea 都能够成为现实。

那这个时候,不妨可以把那些 idea 分享出来,启发别人。
qiayue
V2EX  ›  奇思妙想

一个人人都可以编辑的公开的公共数据服务 PJSON.org

  •  
  •   qiayue · 2014-11-01 09:20:54 +08:00 · 8884 次点击
    这是一个创建于 3676 天前的主题,其中的信息可能已经有所发展或是发生改变。
    P = Public 公开的,公共的
    JSON = 一种数据格式
    PJSON.org = 一个公开的,人人都可以编辑的数据库,存储的是邮编、省市地址、电话区号、天气、公交、网站LOGO、快递、IP地址、域名 Whois 等等各种公共数据

    采用维基百科的形式做一个“维基数据库”,人人为人人。
    每个人都可以编辑数据以使数据更准确,更丰富。

    公开的 API 提供数据查询服务,数据格式为 JSON 。

    人人都可以镜像。

    最后,这不是一个新想法,而是 2012 年在做秋玉米的域名查询时候就想过的,虽然秋玉米只是提供 WEB 版本的未注册域名查询服务,但是我想到的是更多的这些公开的数据。

    很多数据都是公开的,而且很多人都有使用需求,但是一般都是各自整理各自存储各自使用,我就想能不能做一个公开的服务,众包的模式做数据。

    欢迎讨论。
    第 1 条附言  ·  2014-11-01 10:12:13 +08:00
    目前是提出这个想法,看看有多少人会有这个需求,还没有任何代码呢,所以域名 302 回这个帖子
    33 条回复    2014-11-02 23:58:44 +08:00
    aeshfawre
        1
    aeshfawre  
       2014-11-01 09:52:07 +08:00
    这东西靠广告或者捐助维持么?
    qiayue
        2
    qiayue  
    OP
       2014-11-01 09:54:39 +08:00
    @aeshfawre 赞助,比如说七牛、又拍云可以赞助,阿里云、UCloud 可以赞助
    需要什么服务就找什么商业公司赞助
    happywowwow
        3
    happywowwow  
       2014-11-01 09:54:55 +08:00
    这302回来也是醉了,在想怎么是递归了呢
    hcymk2
        4
    hcymk2  
       2014-11-01 10:43:00 +08:00
    还是先感谢先
    xudshen
        5
    xudshen  
       2014-11-01 11:03:11 +08:00
    最完整的社工库嘛
    qiayue
        6
    qiayue  
    OP
       2014-11-01 11:05:52 +08:00
    @xudshen 涉及到隐私的数据都不会出现,只会有公开的数据
    binux
        7
    binux  
       2014-11-01 11:13:20 +08:00
    人人编辑,和JSON这样标准数据格式怎么想都会冲突啊。
    比如 Person 这个对象,有的人编辑的是 {"name": "王二狗", "性别": "男"}, 有的写的是 {"FirstName": "Bob", "LastName": "Alan", "gender": "male"}。

    这样的数据就算是JSON有什么用,还不如让人用表单提交呢。
    qiayue
        8
    qiayue  
    OP
       2014-11-01 11:19:32 +08:00
    @binux 不会有你说的问题
    JSON 只是存储和输出时候会用到,查看和编辑数据的界面与 JSON 无关
    qiayue
        9
    qiayue  
    OP
       2014-11-01 11:21:45 +08:00
    @binux 而且维基百科里的内容并不是编辑好了提交就能显示,而是有审核过程的
    skydiver
        10
    skydiver  
       2014-11-01 11:26:22 +08:00 via iPad
    你是想做一个Wikidata么
    qiayue
        11
    qiayue  
    OP
       2014-11-01 11:31:23 +08:00
    @skydiver 可以这么说
    sanddudu
        12
    sanddudu  
       2014-11-01 12:11:17 +08:00
    @qiayue 维基百科没有在任何界面表示过有对内容进行审核或者审查,只有使用机器人进行防破坏检测,而且是提交了就会显示的

    维基百科不会审查内容
    维基百科部分内容可能被一些读者视为亵渎或具冒犯性。维基百科可以由读者自由修改,而修改都未必经过检查是否适当,因此维基百科不能保证条目或图片一定适合儿童、或者符合某些社会规范。一些明显不适当的内容(例如胡乱连到黑客网站/shock site的链接)应该很快会遭到删除,但是如果文字、图片用得其所,而又没有违反维基方针与指引(尤其是中立的观点),或维基百科服务器所在地美国佛罗里达州法律的话,内容当然不会遭到移除。

    http://zh.wikipedia.org/wiki/Wikipedia:%E7%BB%B4%E5%9F%BA%E7%99%BE%E7%A7%91%E4%B8%8D%E6%98%AF%E4%BB%80%E4%B9%88#.E7.B6.AD.E5.9F.BA.E7.99.BE.E7.A7.91.E4.B8.8D.E6.9C.83.E5.AF.A9.E6.9F.A5.E5.85.A7.E5.AE.B9
    qiayue
        13
    qiayue  
    OP
       2014-11-01 12:20:02 +08:00
    @sanddudu 明白了
    但是 PJSON 这里还是需要有一个审核(“审查”是贬义词)的过程,类似于糗事百科的审帖,以确保提供的数据的准确性
    sanddudu
        14
    sanddudu  
       2014-11-01 12:21:04 +08:00
    @qiayue 唯一和审核沾边的是巡查制度,但是也仅仅是对页面质量进行维护,而不是审核内容

    http://zh.wikipedia.org/wiki/Wikipedia:%E6%96%B0%E9%A0%81%E9%9D%A2%E5%B7%A1%E6%9F%A5
    sanddudu
        15
    sanddudu  
       2014-11-01 12:21:41 +08:00
    @qiayue 的确,维护数据格式的统一性还是有必要的
    djyde
        16
    djyde  
       2014-11-01 12:44:44 +08:00
    那还不如做个json免费托管服务。。。
    qiayue
        17
    qiayue  
    OP
       2014-11-01 12:51:23 +08:00
    @djyde 关键是数据的重复使用
    ksc010
        18
    ksc010  
       2014-11-01 13:04:04 +08:00
    @happywowwow 打开了三遍 还以为是我打开的姿势不对呢
    djyde
        19
    djyde  
       2014-11-01 13:08:40 +08:00
    @qiayue 把json托管做成github的形式,肯定会有值得重复使用的json repo。
    invite
        20
    invite  
       2014-11-01 13:26:44 +08:00
    数据谁维护? 怎么样防止数据被随意修改?
    bcxx
        21
    bcxx  
       2014-11-01 13:29:48 +08:00
    @qiayue 试试预先用 json schema 之类的东西定义好一些 entity 的属性?如果谁要加的话再另外进行讨论这样?
    testla
        22
    testla  
       2014-11-01 13:39:45 +08:00
    按照我的理解,这网站其实就是一个公用API的集合。
    每个API有属于自己的Git仓库以及数据库空间。
    数据谁来维护得要看API的功能本身。
    KiseXu
        23
    KiseXu  
       2014-11-01 13:47:41 +08:00 via Android
    数据输出格式不是问题,一个稳定、全面、保持更新可供调用的数据源才是核心
    qiayue
        24
    qiayue  
    OP
       2014-11-01 14:11:16 +08:00
    @bcxx 是的,每一种库,都需要事先定义好 schema ,然后大家来补充完善数据
    worldask
        25
    worldask  
       2014-11-01 14:46:42 +08:00
    可以先做一版放到github试试
    wcp1231
        26
    wcp1231  
       2014-11-01 18:28:27 +08:00
    @worldask
    @qiayue 一开始确实可以放在 GitHub ,然后每一种库提供一个 schema 或者 校验的程序,要添加修改数据的时候,跑一边校验至少能保证格式没错。在 GitHub 也能通过一些办法或 API 直接获取这些数据。。。
    gyorou
        27
    gyorou  
       2014-11-01 22:46:47 +08:00
    列举的东西现在都可以获取到吧。整合起来其实感觉没有多大必要性。而且整合起来太麻烦了。另外人人都可以编辑到最后我可以把觉得不爽的人的个人信息全部公开出去随便让人搜索之类的想想都口怕。
    qiayue
        28
    qiayue  
    OP
       2014-11-01 23:00:12 +08:00
    @gyorou 不会有隐私数据的,这个肯定会控制好
    cevincheung
        29
    cevincheung  
       2014-11-02 11:06:56 +08:00
    @qiayue 预先定义schema,这才好
    qiayue
        30
    qiayue  
    OP
       2014-11-02 11:24:45 +08:00
    @cevincheung 是的,需要预先定义好
    pythons
        31
    pythons  
       2014-11-02 23:08:46 +08:00
    提供基础服务, 非常好的想法. juhe.com 不就做这种事么.
    qiayue
        32
    qiayue  
    OP
       2014-11-02 23:21:42 +08:00
    @pythons 话说,就是因为 juhe 的丑闻才发帖的
    caomu
        33
    caomu  
       2014-11-02 23:58:44 +08:00 via Android
    不知道lz是想向哪种类型发展。比如说wedata.net 是一个公共的json库的服务,像一出名的自动翻页脚本的规则就依赖其上,但这个网站稳定性不好,有人在github上复制了一套。然后雅虎有推出过 datatables.org 也是一个尝试众包语义化网络信息的服务,可以结合yql和pipes,不过用的是笨重的xml。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   902 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 30ms · UTC 22:02 · PVG 06:02 · LAX 14:02 · JFK 17:02
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.