非纯算法相关,而是工作涉及 AI 的那种面试题,RAG 、AGENT 、DIFY 之类的,找了大模型出题效果不好,要真题
非纯算法相关,而是工作涉及 AI 的那种面试题,RAG 、AGENT 、DIFY 之类的,找了大模型出题效果不好,要真题
1
HENQIGUAI 6 days ago 这个我熟啊,给:
1. 如何实现多 Agent 协作系统? 2. 什么是 RAG ( Retrieval Augmented Generation )? 3. Java 如何实现 streaming response ? 4. 什么是 hallucination (幻觉)?为什么会发生? 5. LangChain4j 如何返回结构化 JSON ? 6. 如何实现 SSE 推送? 7. 如何评估 Agent 的执行效果? 8. LLM 服务如何做缓存? 9. LangChain4j 如何实现 Tool 调用? 10. 什么是 AI Agent ? 11. 什么是 Prompt Engineering ? 12. Agent 和普通 ChatBot 有什么区别? 13. RAG latency 怎么优化? 14. Java 调用 OpenAI API 如何设计 SDK ? 15. RAG pipeline 的完整流程是什么? 16. RAG 系统主要组件有哪些? 17. 如何设计一个 AI 问答系统架构? 18. RAG 如何做 rerank ? 19. AI 系统如何做监控? 20. embedding 和向量相似度搜索是什么? 21. 什么是 ChatMemory ? 22. Java LLM 服务如何做连接池管理? 23. 如何评估 RAG 系统效果? 24. Agent memory 有哪些类型? 25. 如何实现对话历史 memory ? 26. Transformer 架构核心原理是什么? 27. 如何减少大模型 hallucination ? 28. LLM API 如何设计接口? 29. chunk size 为什么很重要?如何选择? 30. 如何实现 hybrid search (向量 + keyword )? 31. 什么是 ReAct Agent ? 32. Spring AI 和 LangChain4j 有什么区别? 33. 什么是 Tool Calling ? 34. embedding 模型如何选择? 35. AI Chat 系统的整体架构是什么? 36. 文档切分有哪些策略? 37. LLM 服务如何做限流? 38. LangChain4j 如何实现 prompt template ? 39. ChatGPT 的 system / user / assistant role 有什么作用? 40. LLM 为什么推理成本高? 41. AI 系统如何记录 Prompt 和 Response ? 42. Agent 如何做任务规划( planning )? 43. LLM latency 如何优化? 44. 如何设计 Prompt 管理系统? 45. streaming response 如何实现? 46. MCP ( Model Context Protocol )是什么? 47. Agent workflow 和普通 workflow 有什么区别? 48. 大模型上下文窗口是什么?如何突破长度限制? |