我们有一个需求,想要根据 isbn 号来获取图书的一些基本信息(名称、作者和出版社等),于是有两种方法,一个是直接找一个图书信息网站,看他们有没有提供 isbn 搜索的接口,二就是把 isbn 号发给大模型,让它来帮我们搜一下并且整合返回一下;
因为我们公司已经搭建了一套大模型沟通的东西,就直接想用第二个方法来了。问题就来了,我在豆包、deepseek 等网站上使用同样的提示词,跟在我们公司走沟通豆包和 deepseek 大模型的接口获取到的内容差别很大,页面是正确的,但是接口返回的就是错误的,在接口里面让它们返回参考的链接地址,结果给我的也都是假的地址,跳转后根本不存在,这是因为使用模型的版本不同造成的吗?还是有什么其他原因导致?
提示词: """ 你是教材书目检索助手。请根据给定 ISBN 进行联网检索,并基于检索结果做严格一致匹配,输出严格 JSON ,不要输出 markdown 。
ISBN: 7506813718
输出字段:
要求:
豆包页面返回: {"matched": true,"match_type": "isbn_exact","confidence": 100,"evidence": {"isbn": "7506813718","book_name": "金银岛(中英对照)","editor": "史蒂文森","publishing_house": "中国书籍出版社"},"references": [{"title": "《金银岛 (中英对照)》 [价格 目录 书评 正版] _中图网 (原中国图书网)","link": "https://m.bookschina.com/1458650.htm"}],"book_info": {"cover": "","book_name": "金银岛(中英对照)","editor": "史蒂文森","publishing_house": "中国书籍出版社","publishing_date": "2005-07-01","isbn": "7506813718","award_info": "","subject": "外语","tags": ["中英对照", "世界名著", "英语读物"],"intro_info": [{"title": "内容简介","content": ""},{"title": "作者简介","content": ""},{"title": "丛书信息","content": ""}],"directory": "","attachments": []}}
接口返回: {'book_info': {'attachments': [], 'award_info': '', 'book_name': '数据结构与算法分析( C 语言描述)', 'cover': 'https://img1.doubanio.com/view/subject/s/public/s34432501.jpg', 'directory': [], 'editor': 'Mark Allen Weiss', 'intro_info': [{'content': '', 'title': '内容简介'}, {'content': '', 'title': '作者简介'}, {'content': '', 'title': '本书特色'}], 'isbn': '9787302634386', 'publishing_date': '2023-09', 'publishing_house': '清华大学出版社', 'subject': '计算机科学与技术', 'tags': ['数据结构', '算法分析', 'C 语言', '计算机教材']}, 'confidence': 100, 'evidence': {'book_name': '数据结构与算法分析( C 语言描述)', 'editor': 'Mark Allen Weiss', 'isbn': '9787302634386', 'publishing_house': '清华大学出版社'}, 'match_type': 'isbn_exact', 'matched': True, 'references': [{'link': 'https://book.douban.com/subject/36504507/', 'title': '豆瓣读书'}, {'link': 'https://www.tup.tsinghua.edu.cn/bookdetail.aspx?ISBN=9787302634386', 'title': '清华大学出版社官网'}]}
1
foxthree OP 求助一下大家!
|
2
foxthree OP 接口返回的数据贴错了,但也可以直接理解为一个错误的书籍,和错误的链接
|
3
yunv2 1 天前
1.豆包、deepseek 页面,其实是智能体,这些页面可以理解为在大模型接口的基础上,添加了前置的处理流程;针对不同的问题、文件等,有一系列的前置处理;甚至使用的模型,都和对外公开的模型不一样;
2.你对接的大模型接口,只是大模型的接口; |
4
panda188 1 天前
你需要加 websearch 这种工具,或者什么书目检索的 mcp 这种吧?
|