Atlas Cloud 公司介绍及招聘信息
公司简介
Atlas Cloud (官网: https://www.atlascloud.ai )是一家快速发展的 AI 基础设施初创公司,专注于模型即服务( MaaS )和基础设施即服务( IaaS )。
公司总部位于纽约,在硅谷、北京和加拿大卡尔加里设有团队,为全球客户提供 大语言模型( LLM )训练、微调与推理服务所需的 GPU 与云基础设施。
我们正在构建面向下一代 AI 应用的高性能计算平台。
招聘岗位
1 、大模型推理框架工程师
工作内容
- 负责模型接口调用功能开发集成;
- 负责新模型适配上线、bugfix 、功能开发与算子集成;
- 负责推理服务镜像的制作、更新与管理;
- 负责大模型、图像以及视频场景单节点/服务的工程/算法性能的回归测试与压力测试;
- 负责大模型、图像以及视频推理框架的开发以及优化。
任职要求
- 计算机科学、信息工程、电子工程、机器人等专业本科及以上学历;
- 具备扎实的编程能力,熟练使用 Python/C++ 进行开发;
- 了解网络网关基本概念,能进行基础网络问题排查;
- 熟悉 OpenAI 接口调用和集成开发;
- 熟悉 sglang 、vLLM 等大模型推理系统,熟悉目前主流的大模型推理优化方法,如 pd 分离、分布式推理、投机采样等技术;
- 熟悉容器技术,了解云平台技术者优先;
- 具备良好的编程风格习惯、文档撰写能力、团队协作和沟通表达能力;
- 有高性能计算、计算机体系结构背景,熟悉系统性能调优方式,了解计算访存底层硬件实现原理者为加分项。
2 、首席技术支持工程师
工作内容
- 作为一线技术专家,处理复杂问题,包括 GPU 资源、Kubernetes 容器平台、API 调用与集成问题;
- 为客户提供 LLM 部署与推理优化建议,协助定位训练和推理性能瓶颈;
- 汇总客户问题与工单趋势,推动产品与工程团队持续优化平台稳定性;
- 编写并维护技术文档和知识库,降低重复工单,提高客户自助解决能力。
任职要求
基础要求
- 计算机、软件工程或相关专业,本科及以上学历;
- 5 年及以上云计算 / DevOps / 基础设施相关经验;
- 有项目沟通经验和带团队经验优先。
技术能力
- 熟悉 GPU 架构及云计算基础设施;
- 熟练使用 Kubernetes ,有容器平台运维或排错经验;
- 熟悉至少一种主流数据库( MySQL / PostgreSQL / MongoDB 等);
- 理解大语言模型( LLM )基本原理,有模型服务或推理相关经验;
- 能阅读并调试 Python / Go / Java / JavaScript 中至少一种语言;
- 有 REST / gRPC API 排错经验;
- 面向全球客户和团队协作,可接受晚间沟通或 on-call 支持。
语言能力
能进行技术层面的中英文沟通(对接海外客户和团队)
其他
可远程工作
3 、资深 Agent 开发工程师(偏算法)
工作内容
- 负责大模型应用框架的设计、开发和部署,根据业务需求转化为技术规范;
- 利用提示词工程/RAG/知识图谱/Function Call 等技术,设计 Agent 架构,构建金融、房地产等专业领域的大模型 Agent 系统;
- 对 Agent 算法性能指标进行分析,和算法团队一起解决算法瓶颈;
- 优化 Agent 决策逻辑,平衡计算成本和任务完成率等指标;
- 建立 System Prompt 版本管理机制,制定 Agent 测试指标和评级体系;
- 对接云平台后端以及推理框架,完成高可用方案实施与工程化落地。
任职要求
必备项
- 计算机、经济、金融等专业 985 本科及以上学历;
- 熟练掌握 Python ,有使用 Python 编程的大型项目经验;
- 熟练掌握大模型 Prompt 优化技巧,熟悉各类大模型的优劣势以及使用场景;
- 熟练掌握大模型预训练以及后训练技巧,熟悉大模型思维链以及 ToolCall 相关性能提升技巧;
- 掌握 RAG 、知识图谱以及向量库技术原理以及相关工具;
- 有较强的问题解决能力和创新思维,能自我驱动并独立开展研究与开发工作。
加分项
- 有基于主流 Agent 开源框架实操经验者优先;
- 有云端大型工程项目的落地经验以及优化经验者优先。
员工福利
- 具有竞争力的薪资;
- 五险一金,节假日福利;
- 良好的办公环境,轻松的办公氛围。
办公地址
北京市海淀区融科资讯中心
投递方式
请将您的简历发送至 [email protected] (邮件标题:应聘岗位+姓名),期待您的加入!