根据下面这个链接给出的跑分 https://browser.geekbench.com/cuda-benchmarks
单纯看 cuda 性能的话,似乎 1660ti 比 1070 还要快那么 20%,但是我手里刚好有这两张卡的机器,用 AI 画图软件测试,都是 cuda 满载的情况,前者要比后者慢三倍以上。运行中也没有什么爆显存的问题,怎么回事呢?两者架构上应该也没有啥代差吧
1
murmur 2023-01-06 08:19:34 +08:00
|
2
TerranceL 2023-01-06 09:20:06 +08:00
AI 画图软件用 cuda core ,好像和“科学计算”的要求不一样,AI 很多时候用 FP16 就够了,但是科学计算好像要求 FP64 才行。
|
3
ttgo 2023-01-06 09:20:09 +08:00
我也一直琢磨,评测显卡的人那么多,怎么没人提炼丹性能性能呢。
|
4
hamhamham 2023-01-06 09:35:30 +08:00
|
5
madeye 2023-01-06 09:40:07 +08:00 5
GPU 的 AI 性能取决于很多方面,比如:
1. 是否有 Tensor Core 2. Tensor Core 数量和架构 3. 显存带宽 4. 软件是否有针对性的优化 现阶段 MLPerf 是最权威的 AI benchmark ,可以作为参考: https://mlcommons.org/en/ 另外 GTX 显卡因为没有 Tensor Core ,并不适合用来跑 inference |
6
tool2d 2023-01-06 09:48:07 +08:00 1
赞同 2 楼,我看 AI 绘图软件说明书,有写 1660 全系列的 FP16 有 BUG ,会自动切换到 FP32 来进行运算。
这样速度就会比别的显卡慢很多。 |
7
foursevenlove 2023-01-06 09:55:46 +08:00
|
8
pwrliang 2023-01-06 09:58:07 +08:00
我赞同 5 楼,因为他是 NVIDIA 的。lol
|
9
stoneabc 2023-01-06 10:12:07 +08:00
nvidia 官方 datasheet 。
或者 techpowerup 。 |
10
LeeReamond OP @madeye dailo 如果新选购的话,现在以深度学习训练和 AI 绘图等为主要使用场景,基本不游戏的,消费级显卡有什么性价比之选吗
|
11
RaulMadrid 2023-01-06 23:32:21 +08:00
直接看挖矿的算力值?
|
12
madeye 2023-01-07 09:10:38 +08:00 via iPad
@LeeReamond 4090ti 即可
|
15
leimao 2023-01-07 15:13:48 +08:00
数据中心显卡一般会发布一个 Datasheet 可以看一些基本参数,比如说
https://images.nvidia.com/content/technologies/volta/pdf/tesla-volta-v100-datasheet-letter-fnl-web.pdf 另外可以在 TechPowerUp 上查看基本所有 GPU 的参数: https://www.techpowerup.com/gpu-specs/ |