来源:程序员老廖
功能概览
用户注册/登录:用户名+密码注册,MySQL 存储,INSERT IGNORE 原子去重
Token 认证:登录后 Redis 存储 token,1 小时过期
WebSocket 实时聊天:RFC 6455 完整实现,支持文本帧、Ping/Pong、Close
消息持久化:Redis List 存储最近 200 条聊天记录
历史消息推送:WebSocket 连接建立后推送最近 50 条历史消息
全员广播:消息实时推送给所有在线 WebSocket 客户端
HTTP Keep-Alive:复用 TCP 连接减少开销
嵌入式前端:商业 IM 风格 UI,左右分栏布局,彩色头像,连接状态指示器,响应式适配
系统架构
整体架构
线程模型
数据流
用户注册流程
WebSocket 聊天消息流程
文件结构与模块职责
chatapp/ | +-- coro_net.h 核心协程网络层 | |-- FireAndForget 协程返回类型,启动即忘 | |-- Worker epoll 事件循环 + 协程句柄管理 + 跨线程调度 | |-- AsyncRead 异步 socket 读 awaiter | |-- AsyncWrite 异步 socket 写 awaiter | +-- SwitchToWorker 跨线程切换 awaiter | +-- async_redis.h Redis 异步访问层 | |-- RedisAwaiter Redis 命令结果容器 | |-- WorkerRedis hiredis-async 适配器,集成 Worker epoll | +-- AsyncRedisCommand co_await Redis 命令 awaiter | +-- async_mysql.h MySQL 异步访问层 | |-- ThreadPool 通用线程池,条件变量调度 | |-- MySQLPool MySQL 连接池,阻塞 acquire/release | |-- MySQLResult SQL 查询结果 | |-- AsyncMySQLQuery co_await SQL 执行 awaiter | +-- mysql_escape SQL 参数转义 | +-- http_server.h HTTP 协议层 | |-- HttpRequest 请求解析:方法、路径、头、body、JSON、Cookie | |-- HttpResponse 响应构建:状态码、头、body、JSON、重定向 | +-- json_escape JSON 字符串转义 | +-- websocket.h WebSocket 协议层 | |-- ws_crypto SHA1 + Base64 握手算法 | |-- WSOpcode 帧类型枚举 | |-- WSFrame 帧结构 | |-- ws_encode_frame 服务端帧编码,无 mask | |-- WSClient 在线客户端信息 | +-- WSManager 连接管理器,广播 | +-- chat_page.h 嵌入式前端页面(从 chat_app.h 分离) | +-- HTML_PAGE 商业 IM 风格前端(左右分栏、彩色头像、连接状态) | +-- chat_app.h 业务逻辑层 | |-- generate_token 随机 token 生成 | |-- hash_password FNV-1a 密码哈希 | |-- handle_http_conn HTTP/WebSocket 主协程 | +-- 路由处理 注册/登录/发消息/获取消息/WebSocket | +-- main.cpp 入口 | |-- worker_thread Worker 线程函数 | |-- init_mysql_tables 建表 | +-- main 参数解析、初始化、accept 循环 | +-- Makefile 编译脚本 +-- benchmark.cpp HTTP 压测工具 +-- ws_bench.cpp WebSocket 压测工具 +-- bench_layers.cpp 分层性能测试 +-- bench_pool.sh 连接池参数调优脚本 +-- test_ws.py WebSocket 功能测试脚本项目源码:C++20协程项目-高并发Web聊天室,包括协程如何调用MySQL+Redis
核心设计详解
协程网络层 coro_net.h
这是整个系统的基石,将 epoll 事件驱动与 C++20 协程无缝结合。
FireAndForget —— 协程返回类型
class FireAndForget { struct promise_type { FireAndForget get_return_object() { return {}; } std::suspend_never initial_suspend() { return {}; } // 创建即启动 std::suspend_never final_suspend() noexcept { return {}; } // 结束不挂起 void return_void() {} void unhandled_exception() { std::terminate(); } }; };FireAndForget 是一种 "启动即忘" 的协程。协程创建后立即开始执行( initial_suspend 返回
suspend_never ),执行完成后自动销毁( final_suspend 返回 suspend_never )。调用者不需要管理协程生命周期。
这种设计适用于 "每连接一个协程" 的模型:accept 后创建协程,协程自己管理 fd 的整个生命周期。
Worker —— epoll 事件循环
Worker 是系统的核心调度器,每个 Worker 在独立线程上运行,管理:
epoll 事件循环:处理 socket IO 事件
协程句柄映射:fd → coroutine_handle 的映射表
ready_events 缓存:处理事件到达但协程未注册 handle 的时序窗口
跨线程唤醒:eventfd 机制,支持从任意线程唤醒 Worker
自定义 FdHandler:支持 hiredis-async 等第三方库注册自己的 fd 处理逻辑
AsyncRead/AsyncWrite —— 异步 IO Awaiter
关键优化: await_ready 的先尝试读取(fast path)避免了在数据已就绪时不必要的 suspend/resume 开销。高吞吐场景下,大部分 IO 操作可以在 await_ready 中直接完成。
Redis 异步访问 async_redis.h
Redis 使用 hiredis-async 库,与 Worker 的 epoll 深度集成。
每 Worker 一个 Redis 连接的设计:
Redis 协议天然支持 pipeline —— 多个命令可以在一个 TCP 连接上交错发送
hiredis-async 内部维护命令队列,自动 pipeline
一个连接即可服务该 Worker 上的所有协程,无需连接池
MySQL 异步访问 async_mysql.h
MySQL C API ( libmysqlclient ) 是同步阻塞的,无法直接集成到 epoll。解决方案:线程池 + 连接池 + 协程挂起。
关键设计决策:
1. 为什么不用 MySQL 非阻塞 API?
MySQL C API 的非阻塞模式需要 mysql_real_connect_nonblocking 等函数,API 复杂且文档不足
MariaDB Connector/C 的非阻塞 API 与 MySQL 不兼容
线程池方案简单可靠,性能损失可控
2. 连接池大小如何选择?
连接数 = min(CPU 核数 x 2, 并发协程数)
8-16 连接已足够饱和大部分场景(MySQL IO 本身是瓶颈)
连接过多反而增加 MySQL 内部锁竞争
3. 协程如何不阻塞 Worker 线程?
await_suspend 把 SQL 任务提交到 ThreadPool 后立即返回
Worker 线程可以继续处理其他协程的 IO 事件
SQL 执行完成后通过 worker->schedule + eventfd 唤醒 Worker
HTTP 协议层 http_server.h
实现了 HTTP/1.1 的核心子集:
请求解析:方法、路径、Query String、Headers、Body、JSON 提取
响应构建:状态码、Headers、Content-Length 自动计算
Keep-Alive:通过 Connection header 判断是否复用连接
无第三方依赖:手写解析器,约 230 行代码
WebSocket 协议层 websocket.h
完整实现 RFC 6455 WebSocket 协议:
WebSocket 帧格式 (RFC 6455 Section 5.2):
Opcode | 类型 | 用途 |
|---|---|---|
0x1 | Text frame | 聊天消息 |
0x8 | Close frame | 关闭连接 |
0x9 | Ping frame | 保活检测 |
0xA | Pong frame | Ping 响应 |
客户端→服务端:必须 mask(4 字节 XOR 密钥)
服务端→客户端:不能 mask
WSManager —— 连接管理与广播
class WSManager { map<int, WSClient> clients_; // fd -> client info mutex mu_; void broadcast(const string& message) { string frame = ws_encode_frame(WS_TEXT, message); lock_guard lock(mu_); for (auto& [fd, client] : clients_) { ::write(fd, frame.data(), frame.size()); // 同步写 } } };业务逻辑层 chat_app.h
前端 UI 架构
嵌入式前端采用商业 IM 风格设计,参考微信 Web / Telegram 等产品的交互范式:
配色方案:
元素 | 颜色 | 说明 |
|---|---|---|
主色调 | #07c160 | 微信绿 |
背景色 | #f0f0f0 | 浅灰 |
侧边栏 | #2e2e2e | 深色 |
自己的气泡 | #95ec69 | 绿色 |
他人的气泡 | #ffffff | 白色 |
前端特性:
特性 | 实现方式 |
|---|---|
彩色头像 | 根据用户名哈希从 12 色板选色,首字母大写显示 |
消息气泡 | 自己绿色右对齐,他人白色左对齐,微信同款圆角 |
连接状态 | 绿色/红色/橙色闪烁圆点,实时反映 WebSocket 状态 |
多行输入 | textarea 自动扩展高度,Shift+Enter 换行,Enter 发送 |
响应式布局 | 768px 以下侧边栏隐藏,通过汉堡菜单切换显示 |
断线重连 | WebSocket 断开后 2 秒自动重连,状态指示器联动 |
侧边栏预览 | 最新消息自动更新到聊天室描述区域 |
核心协程生命周期
handle_http_connection 是系统的核心协程,管理单个 TCP 连接的完整生命周期:
协程并发模型
本项目采用 "每个连接一个协程" 的并发模型。每当主线程 accept 一个新的客户端 TCP 连接时,就会创建一个独立
的 handle_http_connection 协程实例。该协程独立管理这个连接的完整生命周期:从读取 HTTP 请求、路由分
发、到 WebSocket 消息循环、最终关闭连接。
一个连接 = 一个协程
关键特征:
每个连接独立:协程 A 的 co_await AsyncRead 挂起时,Worker 线程立刻去执行协程 B 的就绪操作,不会阻塞
M:N 映射:M 个协程映射到 N 个 Worker 线程。当前默认 N=4,可支撑 10,000+ 并发连接
连接亲和性:一个协程从创建到销毁始终在同一个 Worker 线程上运行,不跨线程迁移
FireAndForget —— 启动即忘的协程生命周期
handle_http_connection 的返回类型是 FireAndForget ,这并不意味着"发出去就不管了",而是 "调用者不需要 co_await 等待它完成" 。协程创建后自行运行,直到连接关闭时自动销毁:
协程调度全景图
与其他并发模型的对比
模型 | 并发方式 | 10K 连接开销 | 代码风格 | 缺点 |
|---|---|---|---|---|
每连接一个线程 | OS 线程 | ~80GB 栈内存 | 同步、直观 | 线程数受限,上下文切换重 |
事件回调 | 回调函数 | 极低 | 回调嵌套、状态机 | 可读性差,错误处理复杂 |
每连接一个协程 | 协程 + epoll | ~几十 MB | 同步风格,异步执行 | 需要编译器支持 C++20 |
本项目的协程模型兼具了线程的 代码可读性 和事件驱动的 性能。每个连接的处理逻辑看起来就像普通的顺序代 码,但在 co_await 处自动让出执行权,让 Worker 线程去服务其他连接。
请求处理全流程
HTTP 请求处理流程
用户注册流程
为什么用 INSERT IGNORE 而不是 SELECT + INSERT?
原子性:没有检查和插入之间的竞态条件
单次 SQL:一次往返替代两次
+88% QPS:从 5.4K 提升到 10.1K
用户登录流程
WebSocket 建连流程
WebSocket 消息流程
协程调度机制
Worker 事件循环
AsyncRead/AsyncWrite 原理
三阶段协议:
为什么要在 await_ready 中先尝试 syscall?
高吞吐场景下,TCP 接收缓冲区经常有数据,try-first 可以跳过整个 suspend/resume 流程。
跨线程调度 SwitchToWorker
ready_events 缓存机制与 Bug 修复
问题场景
Stale ready_events Bug ====================== Timeline: t0: Main thread accept(fd=37), add_client_fd(37, EPOLLIN|EPOLLET) Data is already in TCP buffer (client sent HTTP request) t1: Worker epoll_wait returns EPOLLIN for fd=37 But handles_[37] is nullptr (coroutine hasn't registered yet) --> ready_events_[37] = EPOLLIN (cached!) t2: Coroutine starts, first AsyncRead: await_ready: ::read(37) succeeds! returns data --> return true (no suspend needed) --> ready_events_[37] is NOT cleared t3: ... HTTP processing, WebSocket handshake ... t4: WebSocket msg loop, AsyncRead for new frame: await_ready: ::read(37) returns EAGAIN (no data) --> return false, proceed to await_suspend t5: await_suspend -> set_client_handle(37, h) Worker finds ready_events_[37] has EPOLLIN --> immediately resume coroutine! t6: await_resume: ::read(37) returns -1 (EAGAIN!) --> return -1 t7: WebSocket loop: if (n <= 0) break; --> Connection closed! BUG!修复方案
bool await_ready() { result_ = ::read(fd_, buf_, len_); if (result_ >= 0 || (errno != EAGAIN && errno != EWOULDBLOCK)) { // 读取成功,清除可能残留的 stale ready_events if (t_worker) t_worker->clear_ready_events(fd_); return true; } return false; }同时在 WebSocket 消息循环中增加 EAGAIN 防御性重试:
ssize_t n; do { n = co_await AsyncRead(client_fd, (char*)header, 2); } while (n < 0 && (errno == EAGAIN || errno == EWOULDBLOCK || errno == EINTR)); if (n <= 0) break;双层防御:
clear_ready_events 从根源消除 stale 缓存
EAGAIN 重试作为额外保险
连接复用策略
Redis:每 Worker 一个 hiredis-async 连接
为什么不用连接池?
Redis 单线程处理命令,pipeline 已达最大吞吐
多连接到同一 Redis 实例不会提升性能
一个连接简化了管理,减少了资源消耗
MySQL:全局连接池 + 线程池
为什么不直接在协程中使用 MySQL?
MySQL C API 是同步阻塞的,会阻塞整个 Worker 线程
一个被阻塞的 Worker 线程意味着该 Worker 上的所有协程都停止调度
线程池隔离了阻塞操作,Worker 线程永远不会被 MySQL 阻塞
编译与运行
依赖安装
sudo apt install g++ libhiredis-dev libmysqlclient-dev redis-server mysql-server数据库准备
mysql -u root -e " CREATE DATABASE IF NOT EXISTS chatapp CHARACTER SET utf8mb4; CREATE USER IF NOT EXISTS 'chatuser'@'localhost' IDENTIFIED BY 'chatpass'; GRANT ALL PRIVILEGES ON chatapp.* TO 'chatuser'@'localhost'; FLUSH PRIVILEGES; "编译
make # 编译 chatserver, benchmark, ws_bench make clean # 清理运行
./chatserver --port 9090 --workers 4 --mysql-user chatuser --mysql-pass chatpass浏览器访问 http://127.0.0.1:9090
完整参数
./chatserver [options] --port N HTTP 端口 (默认: 8080) --workers N Worker 线程数 (默认: 4) --redis-host H Redis 地址 (默认: 127.0.0.1) --redis-port N Redis 端口 (默认: 6379) --mysql-host H MySQL 地址 (默认: 127.0.0.1) --mysql-port N MySQL 端口 (默认: 3306) --mysql-user U MySQL 用户 (默认: root) --mysql-pass P MySQL 密码 (默认: 空) --mysql-db D MySQL 数据库 (默认: chatapp) --mysql-pool N MySQL 连接池大小 (默认: 8) --thread-pool N 线程池大小 (默认: 8)性能测试
测试环境:单机,MariaDB 10.6,Redis 7.x,g++ 11.4,C++20,4 Worker 线程
HTTP 注册/登录性能
压测工具
./benchmark [options] -h HOST 目标地址 (默认: 127.0.0.1) -p PORT 目标端口 (默认: 9090) -t N 线程数 (默认: 4) -c N 每线程连接数 (默认: 1) -n N 总请求数 (默认: 1000) -m MODE 模式: register 或 login -k 启用 Keep-Alive注册性能
方案 | 连接池 | QPS | 说明 |
|---|---|---|---|
纯 MySQL INSERT, 16连接直连 | - | 16,155 | 基准上限 |
INSERT IGNORE + HTTP + 协程 | 8 | 10,163 | 达到基准的 63% |
INSERT IGNORE + HTTP + 协程 | 16 | 10,905 | 达到基准的 67% |
INSERT IGNORE + HTTP + 协程 | 32 | 12,392 | 达到基准的 77% |
登录性能
连接模式 | 并发连接数 | QPS |
|---|---|---|
短连接 | 64 | 9,259 |
Keep-Alive | 16 | 9,461 |
Keep-Alive | 32 | 10,493 |
Keep-Alive | 64 | 10,799 |
WebSocket 性能
压测工具
./ws_bench [options] -h HOST 目标地址 (默认: 127.0.0.1) -p PORT 目标端口 (默认: 9090) -c N 并发连接数 (默认: 100) -n N 总消息数 (默认: 1000) -t N 线程数 (默认: 4) -m MODE 模式: connect, throughput, echo, concurrent连接容量
并发连接数 | 成功率 | 连接速率 | 总耗时 |
|---|---|---|---|
50 | 100% | 1,356 conn/s | 0.15s |
500 | 100% | 2,110 conn/s | 1.24s |
1,000 | 100% | 2,469 conn/s | 1.96s |
2,000 | 100% | 1,949 conn/s | 4.77s |
5,000 | 100% | 1,429 conn/s | 12.3s |
10,000 | 100% | 3,144 conn/s | 20.5s |
4 Worker 线程可维护 10,000+ 并发 WebSocket 长连接。连接建立耗时主要来自 HTTP 注册/登录,WebSocket握手本身很快。
回声延迟(单发送者 + N-1 旁观者)
在线连接 | 成功率 | P50 | P90 | P95 | P99 | Max |
|---|---|---|---|---|---|---|
1 | 100% | 0.27ms | 0.27ms | 0.28ms | 0.28ms | 1.5ms |
10 | 100% | 0.27ms | 0.28ms | 0.29ms | 1.65ms | 3.2ms |
100 | 100% | 0.79ms | 1.10ms | 1.38ms | 2.09ms | 6.3ms |
500 | 93.8% | 28.1ms | 778ms | 1,323ms | 1,936ms | 1,997ms |
100 连接以内,P50 延迟 < 1ms。500 连接时广播成为瓶颈,延迟急剧上升。
消息吞吐量(发送 + 广播全接收)
连接数 | 消息/连接 | 发送 QPS | 接收率 | 广播 QPS | 总耗时 |
|---|---|---|---|---|---|
10 | 100 | 19,856 | 100% | 2,451 | 4.1s |
50 | 20 | 14,990 | 100% | 3,518 | 14.2s |
100 | 10 | 13,387 | 100% | 3,796 | 26.4s |
消息零丢失。发送 QPS ~15-20K,广播 QPS ~2.5-3.8K(计入 N 倍扇出)。
并发回声(多连接同时发+收)
连接数 | 消息总数 | 成功率 | QPS | P50 | P90 | P99 | Max |
|---|---|---|---|---|---|---|---|
10 | 1,000 | 100% | 20,387 | 0.06ms | 0.29ms | 0.58ms | 1.9ms |
50 | 1,000 | 100% | 17,537 | 0.26ms | 0.30ms | 1.91ms | 2.2ms |
100 | 1,0000 | 100% | 20,335 | 0.26ms | 0.29ms | 1.06ms | 5.5ms |
并发模式下 QPS 稳定在 ~20K echo/s,P50 < 0.3ms。
总结
本项目展示了 C++20 协程在实际网络应用中的完整实践:
维度 | 数据 |
|---|---|
代码规模 | ~1,500 行 C++ |
并发连接 | 10,000+ WebSocket |
HTTP QPS | 10K-12K 注册/s |
WebSocket 延迟 | P50 < 0.3ms |
消息吞吐 | ~20K msg/s |
Worker 线程 | 4 个 |
外部依赖 | hiredis, libmysqlclient |
协程的核心价值:用同步代码的可读性,获得异步代码的性能。
项目源码:C++20协程项目-高并发Web聊天室,包括协程如何调用MySQL+Redis