V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 外包信息请发到 /go/outsourcing 节点。
• 不要把相同的信息发到不同的节点
moon1light
V2EX  ›  酷工作

[社招杭州] AI Agent 算法工程师(数据采集与内容智能方向) - BAT 安全团队

  •  
  •   moon1light · 6 小时 32 分钟前 · 171 次点击
    岗位名称
    算法 Agent 工程师(数据采集与内容智能方向)

    工作内容
    面向公开媒体数据采集场景,建设页面理解、正文抽取、字段标准化、内容去重归一等核心算法能力。
    负责文本分类、实体识别、属性/关系抽取、相似度计算、结构化建模等内容理解任务。
    参与检索召回与相关性优化,建设关键词检索、语义检索、混合召回、实体级召回等能力。
    基于规则、模型、LLM 和 Agent 工作流,提升采集链路的自适应处理能力与复杂任务自动化水平。
    建立评测集、质量指标和 badcase 迭代机制,持续优化抽取、召回和数据质量效果。
    推动算法能力在采集平台、内容处理平台和数据服务中的工程化落地。

    我们希望你具备
    扎实的 NLP/机器学习基础,熟悉分类、序列标注、抽取、匹配、聚类等任务。
    熟悉 Python/java ,有良好的工程实现能力。
    有信息抽取、检索召回、内容理解或数据结构化相关项目经验。
    了解大模型应用,具备结构化抽取、RAG 、Tool Use 或 Agent 工作流实践经验。
    了解网页采集和页面结构解析基本原理。
    具备评测、优化和持续迭代意识。

    加分项
    搜索/知识图谱/媒体内容理解相关经验
    OCR/ASR/多模态文本处理经验
    Embedding / Rerank / ES / 向量检索经验
    规则+模型+LLM 混合方案设计经验



    绿泡泡:wxid_xw0qqs5o9t1c22

    email:amp1X2NhbWlsZUAxNjMuY29t
    1 条回复    2026-04-07 23:49:15 +08:00
    CodeDaiQin
        1
    CodeDaiQin  
       5 小时 37 分钟前
    有其他机会吗
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   918 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 51ms · UTC 21:26 · PVG 05:26 · LAX 14:26 · JFK 17:26
    ♥ Do have faith in what you're doing.