V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
LoveIsPain
V2EX  ›  Python

Python 深度学习训练神经网络模型时无故暂停问题的请教

  •  
  •   LoveIsPain · 2019-12-10 13:36:22 +08:00 · 3117 次点击
    这是一个创建于 1814 天前的主题,其中的信息可能已经有所发展或是发生改变。

    在这里想请教一个问题:

    在用迁移学习训练网络模型的时候,运行到第一个 Epoch 最后的时候,卡在那里不再往下走了,但程序并没有停,Cuda 也显示是仍在加速着,请问下这个是什么原因呢?谢谢!(这个做的是图片分类的任务,之前选用很少的几个类别进行训练的时候是完全没有任何问题的,但是类别扩展到几千类之后就出现这种情况了)

    2 条回复    2019-12-14 20:53:46 +08:00
    yoshiaki
        1
    yoshiaki  
       2019-12-13 14:04:47 +08:00
    我认为这是程序在跑 val 数据集导致的,跑完一个 epoch,显示的 val_acc 和 val_loss 就是这时候计算的,你几千类,batch_size 应该会大不少,不过详细也需要看过你代码才知道
    LoveIsPain
        2
    LoveIsPain  
    OP
       2019-12-14 20:53:46 +08:00 via iPhone
    谢谢您
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3248 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 31ms · UTC 13:00 · PVG 21:00 · LAX 05:00 · JFK 08:00
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.