C++项目里如何优雅地让onnxruntime自动选CPU还是GPU？一个实战代码片段分享-二趣网

C++项目中实现ONNX Runtime自动选择CPU/GPU的工程实践

在深度学习模型部署的实际工程中，我们经常遇到一个典型问题：开发环境的硬件配置与生产环境不一致。比如你的开发机配备了高性能GPU，但部署服务器可能只有CPU；或者你的团队中部分成员安装了ONNX Runtime的GPU版本，而其他人只安装了CPU版本。本文将分享一种优雅的解决方案，让你的C++代码能够自动适应不同环境，无需为每个环境单独修改代码。

1. 理解ONNX Runtime的执行提供者机制

ONNX Runtime通过"执行提供者"(Execution Provider)的概念来抽象不同硬件后端的实现。这种设计使得同一套API可以透明地运行在多种硬件平台上。常见的执行提供者包括：

CPUExecutionProvider: 默认的CPU实现
CUDAExecutionProvider: NVIDIA GPU加速
DMLExecutionProvider: DirectML for Windows GPU
TensorRTExecutionProvider: NVIDIA TensorRT优化

每个安装的ONNX Runtime版本所支持的提供者列表可能不同。例如，标准的onnxruntimePyPI包只包含CPU支持，而onnxruntime-gpu包则包含CUDA支持。

关键原理：我们可以通过运行时查询可用提供者列表，然后根据环境能力动态配置Session。这种方法比编译时硬编码更灵活，也更容易维护。

2. 基础实现：检测并选择最佳提供者

让我们从一个基础但完整的实现开始：

#include <iostream> #include <onnxruntime_cxx_api.h> #include <algorithm> // for std::find using namespace Ort; std::string selectBestProvider(const SessionOptions& options) { auto providers = GetAvailableProviders(); // 优先顺序：CUDA > DML > CPU const std::vector<std::string> preferredOrder = { "CUDAExecutionProvider", "DMLExecutionProvider", "CPUExecutionProvider" }; for (const auto& preferred : preferredOrder) { if (std::find(providers.begin(), providers.end(), preferred) != providers.end()) { return preferred; } } return "CPUExecutionProvider"; // 默认回退 } void configureSessionWithBestProvider(SessionOptions& options) { auto provider = selectBestProvider(options); if (provider == "CUDAExecutionProvider") { OrtCUDAProviderOptions cudaOptions; options.AppendExecutionProvider_CUDA(cudaOptions); std::cout << "Using CUDA execution provider" << std::endl; } else if (provider == "DMLExecutionProvider") { OrtDmlProviderOptions dmlOptions; options.AppendExecutionProvider_DML(dmlOptions); std::cout << "Using DML execution provider" << std::endl; } else { std::cout << "Using CPU execution provider" << std::endl; } }

这个实现有几个值得注意的特点：

明确的优先级顺序：代码中定义了硬件提供者的优先选择顺序
自动回退机制：如果没有找到优先的提供者，会自动回退到CPU
清晰的日志输出：帮助调试和确认运行时选择

3. 工程化改进：构建可复用的提供者管理器

在实际项目中，我们往往需要更灵活的控制和更多的配置选项。下面展示一个更工程化的实现：

class ExecutionProviderManager { public: struct ProviderConfig { bool enableCuda = true; bool enableDml = false; int cudaDeviceId = 0; float cudaGpuMemLimit = 0.0f; // 0 means no limit }; static void ConfigureSession(SessionOptions& options, const ProviderConfig& config = {}) { auto providers = GetAvailableProviders(); bool configured = false; if (config.enableCuda && hasProvider(providers, "CUDAExecutionProvider")) { OrtCUDAProviderOptions cudaOpt; cudaOpt.device_id = config.cudaDeviceId; cudaOpt.gpu_mem_limit = config.cudaGpuMemLimit; options.AppendExecutionProvider_CUDA(cudaOpt); configured = true; } else if (config.enableDml && hasProvider(providers, "DMLExecutionProvider")) { OrtDmlProviderOptions dmlOpt; options.AppendExecutionProvider_DML(dmlOpt); configured = true; } if (!configured) { std::cout << "No preferred provider available, using CPU" << std::endl; } } private: static bool hasProvider(const std::vector<std::string>& providers, const std::string& target) { return std::find(providers.begin(), providers.end(), target) != providers.end(); } };

这个改进版提供了：

可配置的选项：通过ProviderConfig结构体控制各个提供者的启用状态和参数
更清晰的接口：静态方法封装了所有实现细节
更好的可扩展性：添加新的提供者支持只需扩展ConfigureSession方法

4. 实际应用示例与性能考量

让我们看一个完整的应用示例，并讨论一些性能优化技巧：

int main() { // 初始化环境 Env env; SessionOptions options; // 配置提供者 - 这里可以灵活调整参数 ExecutionProviderManager::ProviderConfig config; config.enableCuda = true; config.cudaDeviceId = 0; config.cudaGpuMemLimit = 4 * 1024 * 1024 * 1024; // 4GB ExecutionProviderManager::ConfigureSession(options, config); // 创建会话 const wchar_t* modelPath = L"model.onnx"; Session session(env, modelPath, options); // 使用会话进行推理... }

性能优化提示：

GPU内存管理：通过gpu_mem_limit参数可以控制ONNX Runtime使用的GPU内存上限，防止内存耗尽

线程池配置：对于CPU执行，合理设置线程数可以提升性能：

options.SetIntraOpNumThreads(4); // 设置内部操作线程数 options.SetInterOpNumThreads(2); // 设置并行操作线程数

执行模式：对于某些模型，启用并行执行可能提升性能：
```
options.SetExecutionMode(ExecutionMode::ORT_PARALLEL);
```

5. 跨平台兼容性与错误处理

在实际部署中，我们需要考虑不同平台和错误情况：

try { ExecutionProviderManager::ConfigureSession(options); // 检查模型文件是否存在 if (!std::filesystem::exists(modelPath)) { throw std::runtime_error("Model file not found"); } Session session(env, modelPath, options); // 检查输入输出数量是否符合预期 auto inputCount = session.GetInputCount(); auto outputCount = session.GetOutputCount(); // ... 其他初始化检查 } catch (const std::exception& e) { std::cerr << "Initialization failed: " << e.what() << std::endl; // 尝试回退到纯CPU模式 try { SessionOptions cpuOptions; Session session(env, modelPath, cpuOptions); std::cerr << "Fallback to CPU-only mode succeeded" << std::endl; } catch (...) { std::cerr << "Fallback to CPU also failed" << std::endl; return -1; } }

关键错误处理策略：

模型文件检查：确保模型路径有效
提供者回退：当首选提供者失败时尝试回退到CPU
输入输出验证：检查模型的输入输出是否符合预期
异常捕获：使用try-catch块处理可能的运行时错误

6. 高级主题：自定义提供者选择策略

对于更复杂的应用场景，你可能需要实现自定义的选择策略。例如：

class CustomProviderSelector { public: virtual std::string selectProvider( const std::vector<std::string>& available, const ModelMetadata& modelInfo) = 0; virtual void configureProvider( SessionOptions& options, const std::string& provider) = 0; }; class DefaultProviderSelector : public CustomProviderSelector { public: std::string selectProvider( const std::vector<std::string>& available, const ModelMetadata& modelInfo) override { // 根据模型大小决定是否使用GPU if (modelInfo.size > 100 * 1024 * 1024 && hasProvider(available, "CUDAExecutionProvider")) { return "CUDAExecutionProvider"; } return "CPUExecutionProvider"; } void configureProvider( SessionOptions& options, const std::string& provider) override { if (provider == "CUDAExecutionProvider") { OrtCUDAProviderOptions cudaOpt; // 自定义CUDA配置 options.AppendExecutionProvider_CUDA(cudaOpt); } } };

这种设计允许你：

根据模型特性（如大小、操作类型）动态选择提供者
实现复杂的多条件选择逻辑
为不同提供者定制不同的配置参数

7. 实际项目中的集成建议

在实际C++项目中集成ONNX Runtime时，考虑以下最佳实践：

封装为独立模块：将ONNX Runtime相关代码封装在单独的类或命名空间中
统一配置接口：提供清晰的配置接口，而不是散落在代码各处的硬编码
日志与监控：记录提供者选择过程和推理性能指标
版本兼容性：处理不同ONNX Runtime版本间的API差异

一个典型的项目结构可能如下：

src/ inference/ onnx_runtime_wrapper.h onnx_runtime_wrapper.cpp provider_manager.h model_loader.h

在onnx_runtime_wrapper.cpp中，你可以集中管理所有与ONNX Runtime交互的代码，包括提供者选择、会话管理和错误处理。

企业官网建设流程全解析

C++项目中实现ONNX Runtime自动选择CPU/GPU的工程实践

1. 理解ONNX Runtime的执行提供者机制

2. 基础实现：检测并选择最佳提供者

3. 工程化改进：构建可复用的提供者管理器

4. 实际应用示例与性能考量

5. 跨平台兼容性与错误处理

6. 高级主题：自定义提供者选择策略

7. 实际项目中的集成建议

热门文章

文章分类

标签云

需要专业的网站建设服务？

企业官网建设流程全解析

C++项目中实现ONNX Runtime自动选择CPU/GPU的工程实践

1. 理解ONNX Runtime的执行提供者机制

2. 基础实现：检测并选择最佳提供者

3. 工程化改进：构建可复用的提供者管理器

4. 实际应用示例与性能考量

5. 跨平台兼容性与错误处理

6. 高级主题：自定义提供者选择策略

7. 实际项目中的集成建议

热门文章

文章分类

标签云

相关文章

林肯发现有人的地方就开始直播?

林肯考律师是因为他喜欢的女孩答应只要他出人头地就跟他结婚。

彻批 “可证伪性”：作为科学划界标准的理论破产与谬误本质

需要专业的网站建设服务？