HiHuo
首页
博客
手册
工具
关于
首页
博客
手册
工具
关于

HiHuo · 工程与 AI

📚

手册系统

Go / AI / 前端进阶学习手册

🤖

AI 工具

内置 AI 模型与生成工具

⚙️

工程化实践

云端部署与微服务最佳实践

最新文章

欢迎来到 HiHuo 技术博客!这里分享关于软件工程、系统架构、AI 技术的实战经验与深度思考。

AI 技术实战

在K8s上部署大模型推理服务:从0到日均千万调用

GPU调度、模型并发、成本优化的生产级实践指南。涵盖 Kubernetes、大模型推理、GPU调度、vLLM、Triton Inference Server、成本优化等主题。

关键词: Kubernetes · 大模型推理 · GPU调度 · vLLM · 成本优化


从零搭建企业级RAG系统:我踩过的10个坑

向量数据库选型、Embedding模型选择、检索优化的生产实践。深入分析 Milvus、Qdrant、Weaviate 等向量数据库的实战应用。

关键词: RAG · 向量数据库 · Embedding · 检索优化 · LangChain


Agent应用开发实战:从Demo到生产环境的鸿沟

ReAct、Function Calling实现、错误处理、超时控制、成本控制的生产级实践。从Demo到生产的完整经验总结。

关键词: AI Agent · ReAct · Function Calling · LangChain · 成本优化


文章分类

  • 系统架构: 分布式系统、微服务、云原生实践
  • 后端开发: Go 语言、数据库、中间件深度解析
  • 前端技术: Vue3、TypeScript、工程化实践
  • AI 技术: 大模型训练、推理优化、AI 平台建设
  • 运维实践: DevOps、CI/CD、容器化部署

更多精彩内容,敬请期待...

© 2025 HiHuo.com