1 个三级分类
三级分类
技术体系化整理、工程实践与开发笔记。
专题分组
1 个三级分类
三级分类
2 个三级分类
3 个三级分类
2 个三级分类
2 个三级分类
3 个三级分类
容器与云原生| **策略** | **场景(最适合做什么)** | **优点** | | --- | --- | --- | | **Round Robin (轮询)** | **标准 API、无状态服务**。比如查天气、查公共信息。 | 绝对公平,请求被均匀地洒在每个 Pod 上。 | | **Least Connections (最小连接数)** | **耗时长的任务**。比如 **RAG 向量计算**。 | 谁手里的活少,就把新活给谁,避免…
k8s 部署 kong-k8s.yaml 注意修改 pg_password 的信息 这里使用了 host 模式+ ClusterFirstWithHostNet 的配置 (因为 host 模式速度最快,性能也是最好的,可以兼顾 docker 部署 + k8s 部署) 数据库依旧是本机 127.0.0.1 因为 ui 界面是没有账号密码的,所以 需要使用 nginx 进行反代处理,所以除了 8000 端口全部是 127.0.0.1进行监…
Pod 是“横向扩展(多进程/多机器)”,Uvicorn Worker 是“纵向扩展(单容器多进程)”。 核心区别 |**特性**|**K8s Pod 副本 (Replicas)**|**FastAPI/Uvicorn Workers**| | --- | --- | --- | |**层级**|容器级(由 K8s 管理)|进程级(由 Python 管理)| |**隔离性**|**强隔离**。每个 Pod 有独立内存、网络栈、文件系统…
(将第一段替换为新类别的简要说明。此指导将显示在类别选择区域中,因此请尽量将其保持在 200 个字符以内。) 使用以下段落提供详细描述或者建立类别准则或规则: 为什么应使用此类别?它用来做什么? 此类别和我们已经有的类别究竟有什么不同? 此类别中的话题一般包含什么? 我们需要此类别吗?我们可以将其与其他类别或子类别合并吗?
容器与云原生部署k8s(使用 k3s) 一般在*/root/k8s进行配置* vim */root/k8s/config.yaml* 部署命令 部署可视化 查看信息: 注意该应用只能 https 访问,如果 5 分钟没有设置密码,kubectl delete pod -n portainer --all 重新启动下。 这里贴一下我的 nginx, /etc/nginx/sites-available/k8s-ui 部署k8s 项目的配置信息 我不…
容器与云原生k8s 是什么? **K8s 不是用来取代 Docker 的,它是用来管理 Docker 的。** Kubernetes (容器编排): 它的核心能力是**“管理”和“调度”。你不需要告诉它“怎么做”,你只需要告诉它“我想要什么状态”(比如:我要服务一直活着,且要有 3 个分身)。K8s 会想尽办法去维持**这个状态。 **Docker (容器引擎):** 它的核心能力是**“打包”**和**“运行”**。你给它一个指令,它就帮你起一…
AI 大模型开发创建 collection 建立索引: 使用稀疏向量 **表结构**、**度量标准**和**算法参数**三个维度。 字段属性 (Schema Fields) 在向量数据库中,每一行数据不再只是简单的文本,而是由以下核心字段组成: **FloatVector(1024)**: **概念**: 这是一个高维向量字段。 **1024 (维度)**: 这必须与你的 Embedding 模型(如 BGE-M3)输出的维度完全一致。它代表了将一段…
主要步骤 对于 rag 体系,主要分为以下的步骤: | **阶段** | **核心动作** | **进阶动作** | | --- | --- | --- | | **数据准备** | 数据etl、分块、元数据提取、Embedding、索引建立 | 语义切分、元数据提取 | | **用户输入** | 接收 Query | **查询改写、子问题拆解** | | **召回** | 向量数据库检索 | **混合检索 (Hybrid Searc…
计算机网络**Ping 显示的 time=44ms 就是一个 RTT(往返时间)。** 它代表“去 + 回”的总时间。 **底层绝对没有除以 2。** 操作系统显示的数字就是 {回来} - {出发}。 物理极限 与损耗 光到底有多快? 结论: 如果你们之间拉了一条笔直的“完美光纤”,中间没有任何路由器阻拦,物理极限只需要 22ms 就能跑个来回! 既然理论极限是 22ms,你测出来是 44ms,说明**你的网络并不快,甚至还有很大的损耗空间**…
铁律 1:网络 I/O 必须 await **(如:请求 OpenAI、查数据库、Redis、读写 S3)** **为什么要 await?** 因为这些操作**不费 CPU**。CPU 只是发了个指令,然后就在那傻等。 如果你不用 await,CPU 就会像个傻子一样盯着网卡,什么都不干。用了 await,CPU 就能在等待期间去处理别人的请求。 **做法**:使用支持异步的库(httpx, asyncpg, motor),直接 aw…