发布时间2026年4月28日在 AMD 笔记本上本地跑 Qwen3-4B:一套不依赖 CUDA 的轻量部署方案AILLMQwenllama.cpp本地部署在一台没有 NVIDIA GPU 的 AMD 笔记本上,用 GGUF + llama.cpp 跑通 Qwen3-4B。本篇重点不是“把模型跑起来”,而是把选型、下载、校验和运行方式整理成一套可复现、可维护的最小闭环。继续阅读 →
发布时间2026年4月9日RAG 不只是接个向量库:从最小系统到工程判断AIRAG知识库工程实践RAG 真正难的不是把检索接到模型前面,而是把文档边界、召回质量、上下文约束和评估体系做对。本文按工程链路拆开 RAG,讲清楚第一版系统该怎么做,问题通常死在哪,以及什么时候才值得上更复杂的优化。继续阅读 →
发布时间2026年2月3日Agent、MCP、Skills 的简单介绍AIAgentMCPSkills用工程化视角解释 Agent、MCP 和 Skills 的关系,梳理从闭环系统、协议标准到技能单元的基本概念和实践方式。继续阅读 →
发布时间2025年12月27日低配 NAT VPS 上部署 Xray(完整可行方案)网络XrayVLESSVPS在 1 核 256MB 的 NAT VPS 上,用 Xray-core + VLESS + TCP 跑出一个安全、稳定、可长期维护的最小可行方案。继续阅读 →