openai流式解析
这篇笔记聚焦 Python 中 OpenAI Chat Completions 的异步流式调用,适用于希望把模型响应按片段实时输出到终端或业务层的开发场景。内容先从环境变量读取入手,强调用 os.getenv 获取 OPENAI_API_KEY、OPENAI_BASE_URL 和 OPENAI_MODEL,并说明 python-dotenv 的安装包名与导入模块名不同:通过 pip install python-dotenv 安装,但代码中从 dotenv 导入 load_dotenv。核心示例封装了一个 AsyncOpenAIOut 类,在初始化阶段创建 AsyncOpenAI 客户端,在 gpt_stream 方法中组合 history、system_prompt 和用户消息,并以 stream=True 发起请求。代码通过 async for 遍历 OpenAI 返回的流式 response,检查 chunk.choices[0].delta.content 后用 yield 逐块产出内容,因此调用方也需要用 async for 消费这个异步生成器。文章还补充了 print(chunk) 在事件循环中的行为:它是同步执行,但在简单逐步输出场景通常可接受;若希望更严格地避免占用事件循环,可以用 asyncio.to_thread(print, chunk) 放到后台线程执行。整体价值在于把 .env 配置、AsyncOpenAI 初始化、消息组装、流式响应解析和 async for/yield 的语义串成一个可运行样例,适合正在接入 OpenAI 兼容接口或学习 Python 异步流处理的开发者。