V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
Eender
V2EX  ›  Python

AMD 跑深度学习

  •  
  •   Eender · 2020-06-01 17:53:27 +08:00 · 7174 次点击
    这是一个创建于 1634 天前的主题,其中的信息可能已经有所发展或是发生改变。

    现在 AMD 跑深度学习咋样?支持 cuda 吗?

    11 条回复    2020-06-02 10:35:21 +08:00
    forrestshuang
        1
    forrestshuang  
       2020-06-01 17:58:15 +08:00   ❤️ 1
    cuda 是英伟达的,amd 只能 cpu 跑 深度学习, 和 NV 的 GPU 差距可能到百倍。
    建议买一张二手的 1080Ti
    mayx
        2
    mayx  
       2020-06-01 17:59:55 +08:00 via Android
    可以用 OpenCL
    raycool
        3
    raycool  
       2020-06-01 18:03:24 +08:00
    是 AMD CPU 还是 GPU
    coderluan
        4
    coderluan  
       2020-06-01 18:07:42 +08:00
    不支持 CUDA, 虽然 AMD 也有 OpenCL, 但是只有少部分框架支持, 还是有限的支持, 除非特殊情况, 是不建议买的.
    misdake
        5
    misdake  
       2020-06-01 18:22:29 +08:00
    TensorFlow 有 ROCm 的 port,好像两年前左右开始支持,现在到 tensorflow-rocm 2.1.1 。
    tf 我没在 A 卡上用过哦不知道到底支持得怎么样。另外别的框架 lz 可以搜搜,tf 应该是跟得比较勤快的。
    Hayek
        6
    Hayek  
       2020-06-01 18:22:44 +08:00
    @forrestshuang
    @raycool
    @coderluan
    @mayx
    请问下楼上的高手,amd 的 cpu 和 intel 的 cpu 跑机器学习差距大吗?
    lvyuedong
        7
    lvyuedong  
       2020-06-01 18:54:32 +08:00 via Android
    amd 有 rocm,虽然支持很烂
    lvyuedong
        8
    lvyuedong  
       2020-06-01 18:55:24 +08:00 via Android
    @Hayek 不大,都很慢跟 gpu 有数量级的差距
    lithiumii
        9
    lithiumii  
       2020-06-01 19:37:23 +08:00 via Android
    @Hayek 有个小坑:pandas 和 bumpy 默认的依赖 mkl 是英特尔的,amd 直接装的话调用 mkl 会有负优化,要指定用 OpenBLAS 或者用某些环境变量
    lithiumii
        10
    lithiumii  
       2020-06-01 19:37:35 +08:00 via Android
    @lithiumii *numpy
    luyanaa
        11
    luyanaa  
       2020-06-02 10:35:21 +08:00
    印象里面 Github 上面 ROCm 跑 ResNet50 的 benchmark 相对价格不算很难看,主要是受 AMD 每代产品定位的拖累( Radeon VII 毕竟买的人实在太少,大多数人买的 Vega56/Vega64(GFX9 架构)或者 RX580(GFX8)说到底就是甜品卡,就算是平常的使用环境 RX580 也只能和 GTX1050Ti 或者 GTX1060 对比,Vega64 只能和 1070Ti 对比)。实际上我个人的统计(仅供参考,不保证完全控制变量,不保证实际使用体验,来源基本都是 Github 的 issue 和 lambdalabs 的测试数据) Resnet50 benchmark Vega64 比 1080Ti 慢 1/7,Radeon VII 甚至 ROCm2.7 能够接近 RTX2080Ti 的表现。但显然 ROCm 各方面的支持做的不好,新架构的支持偏慢( RDNA 我印象里面似乎还只有 unofficial 的 port,只是填了基础的坑,离开箱可用还差一些),性能还得一点点鸡血上去( Radeon VII 从 2.1.96 到 2.6 似乎 Image/sec 涨了快四分之一),等到满血了很可能下一代甚至下两代都已经出来了,而且动不动还有各种神奇的锅。(当然我以上的数据都只算了 ResNet50 的 Benchmark,因为这个 Benchmark 那个 issue 里测的最多,最方便进行有意义的统计,并不全面,但应该能反映一些问题)
    知乎里面可能比较值得参考的几个帖子: https://www.zhihu.com/question/53091802/answer/890213654
    https://zhuanlan.zhihu.com/p/80531243
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2996 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 31ms · UTC 14:04 · PVG 22:04 · LAX 06:04 · JFK 09:04
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.