HiHuo · 工程与 AI
最新文章
欢迎来到 HiHuo 技术博客!这里分享关于软件工程、系统架构、AI 技术的实战经验与深度思考。
AI 技术实战
在K8s上部署大模型推理服务:从0到日均千万调用
GPU调度、模型并发、成本优化的生产级实践指南。涵盖 Kubernetes、大模型推理、GPU调度、vLLM、Triton Inference Server、成本优化等主题。
关键词: Kubernetes · 大模型推理 · GPU调度 · vLLM · 成本优化
从零搭建企业级RAG系统:我踩过的10个坑
向量数据库选型、Embedding模型选择、检索优化的生产实践。深入分析 Milvus、Qdrant、Weaviate 等向量数据库的实战应用。
关键词: RAG · 向量数据库 · Embedding · 检索优化 · LangChain
Agent应用开发实战:从Demo到生产环境的鸿沟
ReAct、Function Calling实现、错误处理、超时控制、成本控制的生产级实践。从Demo到生产的完整经验总结。
关键词: AI Agent · ReAct · Function Calling · LangChain · 成本优化
文章分类
- 系统架构: 分布式系统、微服务、云原生实践
- 后端开发: Go 语言、数据库、中间件深度解析
- 前端技术: Vue3、TypeScript、工程化实践
- AI 技术: 大模型训练、推理优化、AI 平台建设
- 运维实践: DevOps、CI/CD、容器化部署
更多精彩内容,敬请期待...