V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  noahlias  ›  全部回复第 7 页 / 共 10 页
回复总数  193
1  2  3  4  5  6  7  8  9  10  
211 天前
回复了 loyth06 创建的主题 职场话题 关于外包经历的一个疑问
曾经觉得中国人口数量多是一个优势

现在越来越发现 人口数量是一个就业的巨大劣势
是我的错觉吗?
@SayHelloHi 这个不一样好吗 这个是用 metasearch +webarchive 来获取搜索信息的 它等同于搜索引擎
而且需要你部署一个服务 也不是实时的 而且它只获取了网站的 snippet 和 bing/google 这些搜索引擎 API 返回的结果差不多 然而你要获取网站的大纲和详细信息 一定是要用到 html parser 的
官方描述的是 第三方抓取 网页等
```
是否开放类似 Kimi 智能助手中的搜索接口?

目前并没有开放搜索的计划,API 用户可以使用例如 Apify 、Crawlbase 或者 ArchiveBox 等第三方解决方案。
```
但是之前看同类型 elmo.chat 介绍类似的技术方案的时候 html parser 用的是阅读模式
( https://github.com/mozilla/readability)

详情可以看这个技术方案介绍
https://x.com/yadong_xie/status/1774672630194520283
你要想到一个问题 中国人的基数 有白嫖的话 这个成本会很大
而且很容易链式反应 马上就传播了 厂商就要做各种防薅策略哈哈
@Pters 搜了一下并没有机器的网络和 io 有个进程
https://github.com/search?q=repo%3Ajxxghp%2FMoviePilot%20psutil.&type=code
212 天前
回复了 rookiemaster 创建的主题 OpenAI 如何测试 gpt 的版本
可以参考这个 https://nicholas.carlini.com/writing/2024/evaluation_examples/index.html

这上面的问题都很有意思哈哈哈 我第一眼看到的是这个问题
https://nicholas.carlini.com/writing/2024/evaluation_examples/python_to_c_loop_update.html

AI 都是大笨蛋
又是这个法国人, 这个人可以说是计算机科学的神了, 现在开始搞 AI 了是吧
我觉得 你这种是 corner case 多行注释 行内注释呢 不规范注释呢 比如
```python
'''
hello world
'''
# type:ignore



print("hi") #hi
```
应该怎么展示呢 中间有 blank line 呢 还得考虑统一编码风格
讲个笑话 美国地址生成器生成的地址竟然真的能用
黑盒不是很危险吗(老板要是想 code review 咋办)
python 做这种分发的话 我觉得不应该封装一些核心 你认为有价值的逻辑吗 用 c/c++ /rust 等 bind
219 天前
回复了 laters 创建的主题 程序员 有没有什么思路可以实现自动配置开发环境
devcontainer 是最方便的咯 按照你的项目实际需求来
I use yabai
231 天前
回复了 Canglin 创建的主题 Python Python 疑问
我记得发帖的时候可以用 markdown 你这格式看着难受
231 天前
回复了 Davy 创建的主题 Google Gemini Pro 1.5 开放访问了
早就有了
我以为是 api 有了捏
才发现灰度
1  2  3  4  5  6  7  8  9  10  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3658 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 32ms · UTC 10:23 · PVG 18:23 · LAX 02:23 · JFK 05:23
Developed with CodeLauncher
♥ Do have faith in what you're doing.