V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  ppj  ›  全部回复第 1 页 / 共 1 页
回复总数  11
2023-02-15 22:02:32 +08:00
回复了 liukanshan123 创建的主题 程序员 深度学习训练如何防止被炸显存
这个属于资源调度的范畴,可以使用调度器如 slurm/torque/openlava/lsf 等,采用 mig 算法来分配 GPU 资源。做到应用资源的隔离,防止 oom 的出现。

如果需要可 v 我: HPCLIB
2022-09-30 22:25:59 +08:00
回复了 ppj 创建的主题 Linux Lustre 并行文件系统运维
@abbottcn BeeGFS 自己使用没有问题,免费的。但是不能为第三方提供服务。
2022-09-19 13:11:22 +08:00
回复了 ppj 创建的主题 Linux 高性能计算: RoCE v2 vs. InfiniBand 网络该怎么选?
@abbottcn 分布式并行存储用的什么?小文件并行计算,存储软件选择也是影响 latency 的因素。
2022-09-19 09:39:14 +08:00
回复了 ppj 创建的主题 Linux 高性能计算: RoCE v2 vs. InfiniBand 网络该怎么选?
@abbottcn RoCE v2 已经广泛应用,只是目前国内超算 /高算的领导喜欢听人忽悠搞政绩而已。
2022-09-16 08:38:17 +08:00
回复了 ppj 创建的主题 Linux 什么是高性能计算?
@litguy 敢问贵司的名字是什么? burst buffer 是基于分布式并行存储软件?还是 MPI 上?
2022-08-12 11:48:56 +08:00
回复了 ppj 创建的主题 Python Python 每日一练:等分字符串
@krixaar 嗯嗯,多谢哈。
2022-06-06 17:48:44 +08:00
回复了 ppj 创建的主题 Linux Linux Shell 小白入门手册
@jarodlee 可以的,课程里有我的微信二维码,可以加我。
2022-06-06 12:49:54 +08:00
回复了 ppj 创建的主题 Python Python 测试(pytest) 入门
@yangxin0 测试工程师的职业生涯打怪升级路径可以是这样的:

黑盒测试 -> 自动化黑盒测试 -> 自动化白盒测试 -> 测试架构师 -> CICD 运维架构师
2022-06-05 22:44:29 +08:00
回复了 ppj 创建的主题 Linux Linux Shell 小白入门手册
@koebehshian Unix 比 Linux 出生的早,bash 在最早是在 unix 上运行的。
2022-05-29 23:12:24 +08:00
回复了 ppj 创建的主题 Linux 高性能计算 HPC 使用的容器技术
@FabricPath Right, I just used it and usability is great.
2022-04-12 23:52:54 +08:00
回复了 eccentric579 创建的主题 Python [求助提问] subprocess 的并行的一个问题
建议加数据 data 的获取和 p 放在 request 里,数据处理放在 process 里。
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1111 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 18ms · UTC 22:48 · PVG 06:48 · LAX 14:48 · JFK 17:48
Developed with CodeLauncher
♥ Do have faith in what you're doing.