部署 Kong
k8s 部署 kong-k8s.yaml 注意修改 pg_password 的信息 这里使用了 host 模式+ ClusterFirstWithHostNet 的配置 (因为 host 模式速度最快,性能也是最好的,可以兼顾 docker 部署 + k8s 部署) 数据库依旧是本机 127.0.0.1 因为 ui 界面是没有账号密码的,所以 需要使用 nginx 进行反代处理,所以除了 8000 端口全部是 127.0.0.1进行监…
Tech AI
全部
k8s 部署 kong-k8s.yaml 注意修改 pg_password 的信息 这里使用了 host 模式+ ClusterFirstWithHostNet 的配置 (因为 host 模式速度最快,性能也是最好的,可以兼顾 docker 部署 + k8s 部署) 数据库依旧是本机 127.0.0.1 因为 ui 界面是没有账号密码的,所以 需要使用 nginx 进行反代处理,所以除了 8000 端口全部是 127.0.0.1进行监…
Pod 是“横向扩展(多进程/多机器)”,Uvicorn Worker 是“纵向扩展(单容器多进程)”。 核心区别 |**特性**|**K8s Pod 副本 (Replicas)**|**FastAPI/Uvicorn Workers**| | --- | --- | --- | |**层级**|容器级(由 K8s 管理)|进程级(由 Python 管理)| |**隔离性**|**强隔离**。每个 Pod 有独立内存、网络栈、文件系统…
(将第一段替换为新类别的简要说明。此指导将显示在类别选择区域中,因此请尽量将其保持在 200 个字符以内。) 使用以下段落提供详细描述或者建立类别准则或规则: 为什么应使用此类别?它用来做什么? 此类别和我们已经有的类别究竟有什么不同? 此类别中的话题一般包含什么? 我们需要此类别吗?我们可以将其与其他类别或子类别合并吗?
部署k8s(使用 k3s) 一般在*/root/k8s进行配置* vim */root/k8s/config.yaml* 部署命令 部署可视化 查看信息: 注意该应用只能 https 访问,如果 5 分钟没有设置密码,kubectl delete pod -n portainer --all 重新启动下。 这里贴一下我的 nginx, /etc/nginx/sites-available/k8s-ui 部署k8s 项目的配置信息 我不…

k8s 是什么? **K8s 不是用来取代 Docker 的,它是用来管理 Docker 的。** Kubernetes (容器编排): 它的核心能力是**“管理”和“调度”。你不需要告诉它“怎么做”,你只需要告诉它“我想要什么状态”(比如:我要服务一直活着,且要有 3 个分身)。K8s 会想尽办法去维持**这个状态。 **Docker (容器引擎):** 它的核心能力是**“打包”**和**“运行”**。你给它一个指令,它就帮你起一…

创建 collection 建立索引: 使用稀疏向量 **表结构**、**度量标准**和**算法参数**三个维度。 字段属性 (Schema Fields) 在向量数据库中,每一行数据不再只是简单的文本,而是由以下核心字段组成: **FloatVector(1024)**: **概念**: 这是一个高维向量字段。 **1024 (维度)**: 这必须与你的 Embedding 模型(如 BGE-M3)输出的维度完全一致。它代表了将一段…

**Ping 显示的 time=44ms 就是一个 RTT(往返时间)。** 它代表“去 + 回”的总时间。 **底层绝对没有除以 2。** 操作系统显示的数字就是 {回来} - {出发}。 物理极限 与损耗 光到底有多快? 结论: 如果你们之间拉了一条笔直的“完美光纤”,中间没有任何路由器阻拦,物理极限只需要 22ms 就能跑个来回! 既然理论极限是 22ms,你测出来是 44ms,说明**你的网络并不快,甚至还有很大的损耗空间**…

铁律 1:网络 I/O 必须 await **(如:请求 OpenAI、查数据库、Redis、读写 S3)** **为什么要 await?** 因为这些操作**不费 CPU**。CPU 只是发了个指令,然后就在那傻等。 如果你不用 await,CPU 就会像个傻子一样盯着网卡,什么都不干。用了 await,CPU 就能在等待期间去处理别人的请求。 **做法**:使用支持异步的库(httpx, asyncpg, motor),直接 aw…
结构说明 设计如下的结构: 中心包管理 建立中心 项目配置 建设“一号车间” (go-react-prod) Root,必须加环境变量才能配置。 安装系统服务 (让它永久后台运行) 不要跑 ./run.sh,直接装服务。 当你下次想加 new-api 项目时,只需要重复第二步和第三步即可 这样就可以了