V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
grzhan
V2EX  ›  自然语言处理

Poplar - 基于 Web 技术的 NLP 文本标注工具

  •  
  •   grzhan · 2018-08-25 17:03:43 +08:00 · 19157 次点击
    这是一个创建于 2280 天前的主题,其中的信息可能已经有所发展或是发生改变。

    Poplar 是由我们 森亿智能 AI 团队自主研发的 NLP 文本标注工具。 基于内部版本的 NLP 标注系统已经稳定运行了两年,而这次经过了重新设计后以 GPLv3 协议开源。

    文本标注的效果如下图:

    这个工具的灵感主要来源于 brat ,而相对于 brat,poplar 采用了更加现代的 Web 技术进行开发,我们选用了 Typescript 作为开发语言,使用了 RxJSSvg.js 等库,同时借鉴了一些 FluxDDD 的思想,因此使项目在保证一定开发规范的前提下,达到了不错的实用效果。

    欢迎有需要的同学使用我们的 demo 项目来解决一些简单的标注问题,也欢迎大家到我们的项目里提交 issue 或 star 来支持我们的项目。

    6 条回复    2019-07-19 10:53:21 +08:00
    askfermi
        1
    askfermi  
       2018-08-25 18:09:08 +08:00
    我们做了 CV 的图像标注工具,感觉可以多交流一波:D https://github.com/unarxiv/cvtron
    grzhan
        2
    grzhan  
    OP
       2018-08-25 18:46:07 +08:00
    @askfermi 感觉你们的工具完成度很高,非常厉害。
    请问 unarxiv 大概是个什么形式的组织呢?
    askfermi
        3
    askfermi  
       2018-08-25 23:00:40 +08:00
    @grzhan 还有很多地方有坑,希望能在明年 4 月份左右搞定:D

    unarxiv 只是个(待定的)名字,因为这个项目还有学校的实验室和其他的公司参与,于是放在了一个独立的组织账号里。最终愿景是想做一个开源软件的基金会 /非盈利组织。
    grzhan
        4
    grzhan  
    OP
       2018-08-27 11:00:57 +08:00
    @askfermi 原来如此,相对 NLP 标注感觉 CV 这块可能逻辑上会更复杂一些。期待你们工具的正式发布 :)
    如果我们这边以后也开始接触 CV 的话,希望可以进行更多的交流
    askfermi
        5
    askfermi  
       2018-08-28 16:05:11 +08:00
    @grzhan 是的,感觉 CV 的标注相对比较简单。如果您这边后面有需要的话,可以随时联系我:D
    internetant
        6
    internetant  
       2019-07-19 10:53:21 +08:00
    @grzhan hi,V 友,这个项目特别棒!我目前负责我们公司的数据采集、标注,也正在接触智能医疗这块,OCR、NLP、语义分割等项目 (我司: https://www.testin.cn/business/ai/index.htm ),看能不能沟通下?

    应该有合作空间,可以加我微信:LinuxNews
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3407 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 34ms · UTC 11:01 · PVG 19:01 · LAX 03:01 · JFK 06:01
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.