V2EX › NoOneNoBody 的所有回复 › 第 76 页 / 共 171 页

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

1 ... 72 73 74 75 76 77 78 79 80 81 ... 171

❮

❯

271 天前

回复了 xqk111 创建的主题 › 问与答 › 想问问各位手机双持的多么，类似于一部苹果，一部安卓

安卓+安卓+安卓(功能机)+安卓(功能机)

271 天前

回复了 bright0908 创建的主题 › Python › 小白求推荐人工智能学习路线和教程

好多模型人家都弄好了，写个程序其实不难，不怕见笑，我只会抄
例如 sklearn AgglomerativeClustering 聚类核心代码就两行
agglomerative = AgglomerativeClustering(n_clusters=n_clusters)
clusters = agglomerative.fit_predict(scaled_weighted_features)
但是大量的工作是怎么整理数据符合 fit_predict 的要求，还有就是跑一次可能很耗时，如果结果不理想，就要重新组织数据再一次，再一次，再一次……

更多的工作在查错，因为数据量太大，你搞不清是哪一个样本出错的，或者是怎样的错误
例如跑着跑着断了，报错是维度不一致，想维度问题其实是想不通的，一般数据都是批量处理的，不会出现单个数据维度异常，其实更大可能是某个数据为空或者 np.nan ，模型优先“检查维度”导致报错是维度不一致
原始数据不为空，但一些转换处理会导致部分变为空，例如 rolling 移动窗口首尾有窗口不够的问题，diff 左右值求差必然少一个，过滤数据后忘了“补齐”或“对齐”……诸如此类

还有前面说的 float 类型的事，数据没错，程序逻辑也没错，就是跑起来就报错，因为 pytorch 默认 float32 ，但 numpy 默认 float64……破，搞了我几个小时，一直以为数据错了
如果用到 numba 加速的话，类型也是大问题

个人建议 numpy/pandas 还是要熟，有批量转换和查找的能力，“查找”就是定位，找到哪一行哪一列的数据

我近半年写的代码，写出来都是很快，随机模拟生成数据都能跑，就是用实际数据就断，估计近半时间都是在花类型的查“错”上

272 天前

回复了 bright0908 创建的主题 › Python › 小白求推荐人工智能学习路线和教程

我是从人脸识别开始的……
机器学习可以不看，但 numpy ，pandas 还是要懂，无论什么学习，整理数据还是必须的，你不能靠 for 来完成数据处理
机器学习可以不看，但 sklearn 文档还是该知道怎么查，sklearn 的文档比较有用

ps: python 的类型问题烦死人，float32 和 float64 没指定好，都能导致 pytorch 跑不起来

273 天前

回复了 alphat 创建的主题 › 分享发现 › 3 月 1 日起快递不得擅自放驿站：违者将被罚款

我个人坚持送到家门是正确的，但我也从来不需要送到家门，除了大件和需要安装的，一直都不写真实地址

@ivvei #46
你这句话适合所有行业计件的岗位，如果他们都没压力，社会很和谐
我查物流时，经常看到快递员早上 8 点就开始派送了，那么加上装箱等等时间，估计早上七点就到岗了

这年头，想工作轻松自在，毫无压力，没多少人能做到

274 天前

回复了 Hole 创建的主题 › 职场话题 › 休年假期间直属领导连续打了 13 个电话

岳飞？

274 天前

回复了 drymonfidelia 创建的主题 › OpenAI › 开发出 GPT 的为什么不是 Google? Google 明显比 OpenAI 早研究 AI,做搜索的在数据集上应该也比 OpenAI 有优势,Gemini 明显还是比 GPT4 弱很多,出来的代码全是废话+Bug,指出来都不给修改

术业有专攻

274 天前

回复了 hello202311 创建的主题 › 问与答 › 请教一下用 emeditor 打开特别慢，一搜索就卡死！

重装吧，估计你的 em 什么配置搅乱了
或者找个免安装版本试一下，如果两个都是这样，那就不是 em 问题，可能是系统的问题了

275 天前

回复了 NoOneNoBody 创建的主题 › Python › 有什么思路实现均匀取值，或者什么包可以做这事

@bugcoder #14
刚写完，还真是用了直方图计数，大致原理是这几句
bin_edges = np.linspace(np.min(sequence), np.max(sequence)+.1, n+1)
hints, _ = np.histogram(sequence, bins=bin_edges)
indices = np.cumsum(hints)[:-1]
arr = np.split(sequence, indices)
然后从 arr 逐个按权重提取

275 天前

回复了 jsjcjsjc 创建的主题 › 正则表达式 › 这个可以用正则表达式做到吗?GPT 聊了半天了

@jsjcjsjc #3
没用过，一般都可以，主要是 windows 格式的文本的话要注意，换行符是两个字符，单纯\n 是不行的，要\n\r

275 天前

回复了 jsjcjsjc 创建的主题 › 正则表达式 › 这个可以用正则表达式做到吗?GPT 聊了半天了

你的编辑器支持多行正则就可以了

275 天前

回复了 NoOneNoBody 创建的主题 › Python › 有什么思路实现均匀取值，或者什么包可以做这事

@Famio #9
和我的思路很接近，只是这个思路处理密度接近均匀的可行，但我没想好#2 所说那种密度不均的情况，而且这种样本可能性不小

275 天前

回复了 NoOneNoBody 创建的主题 › Python › 有什么思路实现均匀取值，或者什么包可以做这事

@yuyue001 #8
我本意是想 gpt 帮我找找哪个包的方法能实现，它阅读的手册肯定比我多很多，我以为 sklearn 有方法已经能完成这个，没想到没有找到

275 天前

回复了 NoOneNoBody 创建的主题 › Python › 有什么思路实现均匀取值，或者什么包可以做这事

@lsk569937453 #2
原数列本来就密度不均的话，那也是没办法，只能抽取，不能生成
a 应是 1,100,205, 1000
b: 1, 8, 16, 1000
c:1, 600, 1000, 20000

@Oldletter #1
不需要唯一答案，只需要基本满足条件，其实就是减少随机抽样出现“密度过于集中”这种不可控的情况，人为干预一下

276 天前

回复了 uni 创建的主题 › Visual Studio Code › 为什么 vscode 对 Python 的语法解析这么慢

python 是层层依赖，项目大（主要是依赖多）的话确实分析很耗时
我项目不大，但依赖很多，也很耗时，就因为这个原因转 sublime+pyright 了

276 天前

回复了 omerg 创建的主题 › 成都 › 狗卵子电信

没有良民证都是罪犯

276 天前

回复了 CNM47589 创建的主题 › 问与答 › 卸载 potplayer 之后，右键菜单的残留选项怎么去除

有右键管理工具如 dism++，火绒等屏蔽了
或者注册表把 potplayer 搜出来逐个删掉，网上有 bat 脚本

276 天前

回复了 bladey 创建的主题 › 问与答 › 对于 3 岁的小孩有没有必要报在线英语、思维之类的启蒙课程，大家持什么观点

我只想说，3 岁小孩没有“学习”和“上课”的概念
不是说不做教育，而是学前所有的教育都不应走“课堂”这个概念，不能定时定点，不能强行灌输
5 岁后开始走模拟课堂，目的也是和小学接轨，避免一下子整体环境变换难以适应

想想小时候有没有因为上课和学习的事埋怨过父母，没觉得自己也在慢慢变成“老一辈”的样子么？

276 天前

回复了 HaroldFinchNYC 创建的主题 › 程序员 › 为什么拿手机使用图床网站？理解不了

看标题是觉得你不适合运营，不懂市场
进来一看，180 度翻转，你很懂打广告嘛，明明就说在说“我家产品不仅博客能用，手机也能用，而且用户很多”

1 ... 72 73 74 75 76 77 78 79 80 81 ... 171

❮

❯