JACIN Blog

TECH FOR CODING

Tech AI

166篇文章
2025 — 2026持续创作

全部

文章166

VPS服务器配置与部署

部署 Kong

k8s 部署 kong-k8s.yaml 注意修改 pg_password 的信息 这里使用了 host 模式+ ClusterFirstWithHostNet 的配置 (因为 host 模式速度最快,性能也是最好的,可以兼顾 docker 部署 + k8s 部署) 数据库依旧是本机 127.0.0.1 因为 ui 界面是没有账号密码的,所以 需要使用 nginx 进行反代处理,所以除了 8000 端口全部是 127.0.0.1进行监…

·17 min read
容器与云原生

K8s pod 副本与 Uvicorn Workers

Pod 是“横向扩展(多进程/多机器)”,Uvicorn Worker 是“纵向扩展(单容器多进程)”。 核心区别 |**特性**|**K8s Pod 副本 (Replicas)**|**FastAPI/Uvicorn Workers**| | --- | --- | --- | |**层级**|容器级(由 K8s 管理)|进程级(由 Python 管理)| |**隔离性**|**强隔离**。每个 Pod 有独立内存、网络栈、文件系统…

·5 min read
容器与云原生

关于“容器与云原生”类别

(将第一段替换为新类别的简要说明。此指导将显示在类别选择区域中,因此请尽量将其保持在 200 个字符以内。) 使用以下段落提供详细描述或者建立类别准则或规则: 为什么应使用此类别?它用来做什么? 此类别和我们已经有的类别究竟有什么不同? 此类别中的话题一般包含什么? 我们需要此类别吗?我们可以将其与其他类别或子类别合并吗?

·1 min read
容器与云原生

部署 k8s 与配置项目

部署k8s(使用 k3s) 一般在*/root/k8s进行配置* vim */root/k8s/config.yaml* 部署命令 部署可视化 查看信息: 注意该应用只能 https 访问,如果 5 分钟没有设置密码,kubectl delete pod -n portainer --all 重新启动下。 这里贴一下我的 nginx, /etc/nginx/sites-available/k8s-ui 部署k8s 项目的配置信息 我不…

·20 min read
部署 k8s 与配置项目
容器与云原生

K8s 简单介绍

k8s 是什么? **K8s 不是用来取代 Docker 的,它是用来管理 Docker 的。** Kubernetes (容器编排): 它的核心能力是**“管理”和“调度”。你不需要告诉它“怎么做”,你只需要告诉它“我想要什么状态”(比如:我要服务一直活着,且要有 3 个分身)。K8s 会想尽办法去维持**这个状态。 **Docker (容器引擎):** 它的核心能力是**“打包”**和**“运行”**。你给它一个指令,它就帮你起一…

·18 min read
K8s 简单介绍
AI 大模型开发

使用 attu 创建向量数据库

创建 collection 建立索引: 使用稀疏向量 **表结构**、**度量标准**和**算法参数**三个维度。 字段属性 (Schema Fields) 在向量数据库中,每一行数据不再只是简单的文本,而是由以下核心字段组成: **FloatVector(1024)**: **概念**: 这是一个高维向量字段。 **1024 (维度)**: 这必须与你的 Embedding 模型(如 BGE-M3)输出的维度完全一致。它代表了将一段…

·12 min read
使用 attu 创建向量数据库
AI 大模型开发

RAG 架构的认识

主要步骤 对于 rag 体系,主要分为以下的步骤: | **阶段** | **核心动作** | **进阶动作** | | --- | --- | --- | | **数据准备** | 数据etl、分块、元数据提取、Embedding、索引建立 | 语义切分、元数据提取 | | **用户输入** | 接收 Query | **查询改写、子问题拆解** | | **召回** | 向量数据库检索 | **混合检索 (Hybrid Searc…

·15 min read
计算机网络

ping 延迟、三次握手、 TLS/SSL 握手 延迟

**Ping 显示的 time=44ms 就是一个 RTT(往返时间)。** 它代表“去 + 回”的总时间。 **底层绝对没有除以 2。** 操作系统显示的数字就是 {回来} - {出发}。 物理极限 与损耗 光到底有多快? 结论: 如果你们之间拉了一条笔直的“完美光纤”,中间没有任何路由器阻拦,物理极限只需要 22ms 就能跑个来回! 既然理论极限是 22ms,你测出来是 44ms,说明**你的网络并不快,甚至还有很大的损耗空间**…

·10 min read
ping 延迟、三次握手、 TLS/SSL 握手 延迟
Python 开发

Python 异步编程 async 处理规则

铁律 1:网络 I/O 必须 await **(如:请求 OpenAI、查数据库、Redis、读写 S3)** **为什么要 await?** 因为这些操作**不费 CPU**。CPU 只是发了个指令,然后就在那傻等。 如果你不用 await,CPU 就会像个傻子一样盯着网卡,什么都不干。用了 await,CPU 就能在等待期间去处理别人的请求。 **做法**:使用支持异步的库(httpx, asyncpg, motor),直接 aw…

·7 min read
Git

自用 VPS 配置 github action self-hosted runner

结构说明 设计如下的结构: 中心包管理 建立中心 项目配置 建设“一号车间” (go-react-prod) Root,必须加环境变量才能配置。 安装系统服务 (让它永久后台运行) 不要跑 ./run.sh,直接装服务。 当你下次想加 new-api 项目时,只需要重复第二步和第三步即可 这样就可以了

·1 min read