推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
stevech
V2EX  ›  Python

小白请教,请问这种数据集要怎么分割训练集和测试集,并且建立训练模型呢?

  •  1
     
  •   stevech · Dec 27, 2018 · 2887 views
    This topic created in 2718 days ago, the information mentioned may be changed or developed.
    我的想法是把 CSV 文件中若干行的数据作为一个样本(列数定长,但行数不定长),然后在 n 个样本中分割训练集和测试集。
    请问这种变长的数据集可以用来建立训练模型吗?
    5 replies    2018-12-30 21:53:50 +08:00
    eagle40
        1
    eagle40  
       Dec 27, 2018
    还真挺白的:) 先找个 demo 照猫画虎做一遍不就知道了嘛
    tottea
        2
    tottea  
       Dec 28, 2018
    是目标检测的数据集吗?我最近做也用到 CSV 的数据格式
    stevech
        3
    stevech  
    OP
       Dec 28, 2018
    @tottea 是的 QAQ
    tottea
        4
    tottea  
       Dec 29, 2018
    @stevech 那这样按图片为单位来分割为训练 /测试集就好了,先把 csv 读进来,注意要以图片为单位,然后打乱,划分为两个集合,再分别写到 train.csv 和 val.csv 就好了
    stevech
        5
    stevech  
    OP
       Dec 30, 2018
    @tottea 谢谢!!
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3022 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 08:42 · PVG 16:42 · LAX 01:42 · JFK 04:42
    ♥ Do have faith in what you're doing.