兄弟们，来要一点 AI 相关的面试题

非纯算法相关，而是工作涉及 AI 的那种面试题，RAG 、AGENT 、DIFY 之类的，找了大模型出题效果不好，要真题

2 replies

HENQIGUAI

May 8

这个我熟啊，给：
1. 如何实现多 Agent 协作系统？
2. 什么是 RAG （ Retrieval Augmented Generation ）？
3. Java 如何实现 streaming response ？
4. 什么是 hallucination （幻觉）？为什么会发生？
5. LangChain4j 如何返回结构化 JSON ？
6. 如何实现 SSE 推送？
7. 如何评估 Agent 的执行效果？
8. LLM 服务如何做缓存？
9. LangChain4j 如何实现 Tool 调用？
10. 什么是 AI Agent ？
11. 什么是 Prompt Engineering ？
12. Agent 和普通 ChatBot 有什么区别？
13. RAG latency 怎么优化？
14. Java 调用 OpenAI API 如何设计 SDK ？
15. RAG pipeline 的完整流程是什么？
16. RAG 系统主要组件有哪些？
17. 如何设计一个 AI 问答系统架构？
18. RAG 如何做 rerank ？
19. AI 系统如何做监控？
20. embedding 和向量相似度搜索是什么？
21. 什么是 ChatMemory ？
22. Java LLM 服务如何做连接池管理？
23. 如何评估 RAG 系统效果？
24. Agent memory 有哪些类型？
25. 如何实现对话历史 memory ？
26. Transformer 架构核心原理是什么？
27. 如何减少大模型 hallucination ？
28. LLM API 如何设计接口？
29. chunk size 为什么很重要？如何选择？
30. 如何实现 hybrid search （向量 + keyword ）？
31. 什么是 ReAct Agent ？
32. Spring AI 和 LangChain4j 有什么区别？
33. 什么是 Tool Calling ？
34. embedding 模型如何选择？
35. AI Chat 系统的整体架构是什么？
36. 文档切分有哪些策略？
37. LLM 服务如何做限流？
38. LangChain4j 如何实现 prompt template ？
39. ChatGPT 的 system / user / assistant role 有什么作用？
40. LLM 为什么推理成本高？
41. AI 系统如何记录 Prompt 和 Response ？
42. Agent 如何做任务规划（ planning ）？
43. LLM latency 如何优化？
44. 如何设计 Prompt 管理系统？
45. streaming response 如何实现？
46. MCP （ Model Context Protocol ）是什么？
47. Agent workflow 和普通 workflow 有什么区别？
48. 大模型上下文窗口是什么？如何突破长度限制？

9684xtpa

May 8

@HENQIGUAI 感谢感谢，想给你非常多的打赏，但是平台设置只能给 10 个币