【Inference】Support OpenVINO CPU High-Performance Inference #69122

ckl117 · 2024-11-01T10:47:14Z

PR Category

Performance Optimization

PR Types

New features

Description

Pcard-71500
增加WITH_OPENVINO=ON选项接入OpenVINO第三方库；
增加openvino_subgraph_pass实现全图转OpenVINO；
支持openvino engine缓存和设置推理线程数(复用set_cpu_math_library_num_threads()方法)；

whl包增加23MB，SDK库增加75MB

文档PR
PaddlePaddle/Paddle-Inference-Demo#543

Python API

config = paddle_infer.Config(pdmodel, pdparam)
cache_dir = os.path.join(os.path.dirname(pdmodel), '__cache__')
config.set_optim_cache_dir(cache_dir)
config.set_cpu_math_library_num_threads(10)
config.enable_openvino_engine(config.Precision.Float32)
predictor = paddle_infer.create_predictor(config)

部分模型测试

paddle-bot · 2024-11-01T10:47:21Z

你的PR提交成功，感谢你对开源项目的贡献!
请关注后续CI自动化测试结果，详情请参考Paddle-CI手册。
Your PR has been submitted. Thanks for your contribution!
Please wait for the result of CI firstly. See Paddle CI Manual for details.

support openvino run in paddle

CLAassistant · 2024-11-06T03:37:18Z

All committers have signed the CLA.

CLAassistant · 2024-11-06T03:37:18Z

Thank you for your submission! We really appreciate it. Like many open source projects, we ask that you all sign our Contributor License Agreement before we can accept your contribution.
1 out of 2 committers have signed the CLA.

✅ ckl117
❌ bukejiyu
_{You have signed the CLA already but the status is still pending? Let us recheck it.}

… ov_test

qingqing01

CPU whl包、SDK库增加的体积也给下吧
单测需要更加完善下，增加Python端测试以及无法转成功的case。

qingqing01 · 2024-12-10T05:32:42Z

paddle/phi/kernels/impl/load_combine_kernel_impl.h

@@ -213,12 +213,6 @@ void LoadCombineKernel(const Context& dev_ctx,
  auto filename = file_path;
  auto out_var_names = out;

-  PADDLE_ENFORCE_GT(out_var_names.size(),


去掉这里check的原因是？

openvino_subgraph_pass会将所有参数全部删掉，在使用config.use_optimized_model(True)时会加载一个空的pdiparams文件。

qingqing01 · 2024-12-10T05:32:46Z

paddle/phi/kernels/impl/save_combine_kernel_impl.h

@@ -62,13 +62,6 @@ void SerializeCombineTensor(const Context& dev_ctx,
                            const std::vector<const phi::DenseTensor*>& x,
                            bool save_as_fp16,
                            std::ostream& ss) {
-  PADDLE_ENFORCE_GT(x.size(),


去掉这里check的原因是？

qingqing01 · 2024-12-10T05:34:27Z

patches/openvino/convert.patch

@@ -0,0 +1,578 @@
+diff --git a/src/frontends/paddle/src/default_opset.hpp b/src/frontends/paddle/src/default_opset.hpp


OpenVINO官方仓库代码合入后，此patch还是去掉吧

好的。后续等OpenVINO官方合入后再删吧

ckl117 · 2024-12-10T05:42:01Z

paddle/scripts/paddle_build.sh

@@ -4165,18 +4167,19 @@ function run_setup(){
    echo "if you use setup.py to compile,please export envs as following in /paddle ..."
    cat << EOF
    ========================================
-    export CMAKE_BUILD_TYPE=${CMAKE_BUILD_TYPE:-Release} WITH_GPU=${WITH_GPU:-OFF} WITH_SHARED_PHI=${WITH_SHARED_PHI:-OFF} WITH_TENSORRT=${WITH_TENSORRT:-ON} WITH_ROCM=${WITH_ROCM:-OFF} WITH_CINN=${WITH_CINN:-OFF} WITH_DISTRIBUTE=${distibuted_flag} WITH_MKL=${WITH_MKL:-ON} WITH_AVX=${WITH_AVX:-OFF} CUDA_ARCH_NAME=${CUDA_ARCH_NAME:-All} NEW_RELEASE_PYPI=${NEW_RELEASE_PYPI:-OFF} NEW_RELEASE_ALL=${NEW_RELEASE_ALL:-OFF} NEW_RELEASE_JIT=${NEW_RELEASE_JIT:-OFF} WITH_PYTHON=${WITH_PYTHON:-ON} CUDNN_ROOT=/usr/ WITH_TESTING=${WITH_TESTING:-ON} WITH_COVERAGE=${WITH_COVERAGE:-OFF} WITH_INCREMENTAL_COVERAGE=${WITH_INCREMENTAL_COVERAGE:-OFF} CMAKE_MODULE_PATH=/opt/rocm/hip/cmake CMAKE_EXPORT_COMPILE_COMMANDS=ON WITH_INFERENCE_API_TEST=${WITH_INFERENCE_API_TEST:-ON} INFERENCE_DEMO_INSTALL_DIR=${INFERENCE_DEMO_INSTALL_DIR} PY_VERSION=${PY_VERSION:-3.8} CMAKE_INSTALL_PREFIX=${INSTALL_PREFIX:-/paddle/build} WITH_PSCORE=${pscore_flag} WITH_PSLIB=${pslib_flag} WITH_GLOO=${gloo_flag} WITH_XPU=${WITH_XPU:-OFF} WITH_IPU=${WITH_IPU:-OFF} XPU_SDK_ROOT=${XPU_SDK_ROOT:-""} WITH_XPU_BKCL=${WITH_XPU_BKCL:-OFF} -WITH_XPU_XRE5=${WITH_XPU_XRE5:-OFF} WITH_ARM=${WITH_ARM:-OFF} WITH_STRIP=${WITH_STRIP:-ON} ON_INFER=${ON_INFER:-OFF} WITH_HETERPS=${WITH_HETERPS:-OFF} CUDA_ARCH_BIN=${CUDA_ARCH_BIN} WITH_RECORD_BUILDTIME=${WITH_RECORD_BUILDTIME:-OFF} WITH_UNITY_BUILD=${WITH_UNITY_BUILD:-OFF} WITH_ONNXRUNTIME=${WITH_ONNXRUNTIME:-OFF} WITH_CUDNN_FRONTEND=${WITH_CUDNN_FRONTEND:-OFF} -DWITH_CPP_TEST=${WITH_CPP_TEST:-OFF}
+    export CMAKE_BUILD_TYPE=${CMAKE_BUILD_TYPE:-Release} WITH_GPU=${WITH_GPU:-OFF} WITH_SHARED_PHI=${WITH_SHARED_PHI:-OFF} WITH_TENSORRT=${WITH_TENSORRT:-ON} WITH_OPENVINO=${WITH_OPENVINO:-ON} WITH_ROCM=${WITH_ROCM:-OFF} WITH_CINN=${WITH_CINN:-OFF} WITH_DISTRIBUTE=${distibuted_flag} WITH_MKL=${WITH_MKL:-ON} WITH_AVX=${WITH_AVX:-OFF} CUDA_ARCH_NAME=${CUDA_ARCH_NAME:-All} NEW_RELEASE_PYPI=${NEW_RELEASE_PYPI:-OFF} NEW_RELEASE_ALL=${NEW_RELEASE_ALL:-OFF} NEW_RELEASE_JIT=${NEW_RELEASE_JIT:-OFF} WITH_PYTHON=${WITH_PYTHON:-ON} CUDNN_ROOT=/usr/ WITH_TESTING=${WITH_TESTING:-ON} WITH_COVERAGE=${WITH_COVERAGE:-OFF} WITH_INCREMENTAL_COVERAGE=${WITH_INCREMENTAL_COVERAGE:-OFF} CMAKE_MODULE_PATH=/opt/rocm/hip/cmake CMAKE_EXPORT_COMPILE_COMMANDS=ON WITH_INFERENCE_API_TEST=${WITH_INFERENCE_API_TEST:-ON} INFERENCE_DEMO_INSTALL_DIR=${INFERENCE_DEMO_INSTALL_DIR} PY_VERSION=${PY_VERSION:-3.8} CMAKE_INSTALL_PREFIX=${INSTALL_PREFIX:-/paddle/build} WITH_PSCORE=${pscore_flag} WITH_PSLIB=${pslib_flag} WITH_GLOO=${gloo_flag} WITH_XPU=${WITH_XPU:-OFF} WITH_IPU=${WITH_IPU:-OFF} XPU_SDK_ROOT=${XPU_SDK_ROOT:-""} WITH_XPU_BKCL=${WITH_XPU_BKCL:-OFF} -WITH_XPU_XRE5=${WITH_XPU_XRE5:-OFF} WITH_ARM=${WITH_ARM:-OFF} WITH_STRIP=${WITH_STRIP:-ON} ON_INFER=${ON_INFER:-OFF} WITH_HETERPS=${WITH_HETERPS:-OFF} CUDA_ARCH_BIN=${CUDA_ARCH_BIN} WITH_RECORD_BUILDTIME=${WITH_RECORD_BUILDTIME:-OFF} WITH_UNITY_BUILD=${WITH_UNITY_BUILD:-OFF} WITH_ONNXRUNTIME=${WITH_ONNXRUNTIME:-OFF} WITH_CUDNN_FRONTEND=${WITH_CUDNN_FRONTEND:-OFF} -DWITH_CPP_TEST=${WITH_CPP_TEST:-OFF}


CPU单测流水线增加OpenVINO

ckl117 · 2024-12-10T05:42:09Z

paddle/scripts/paddle_build.sh

    ========================================
 EOF
    echo "if you use cmake to compile,please Configuring cmake in /paddle/build ..."
    cat <<EOF
    ========================================
-    cmake .. -DCMAKE_BUILD_TYPE=${CMAKE_BUILD_TYPE:-Release} -DWITH_GPU=${WITH_GPU:-OFF} -DWITH_SHARED_PHI=${WITH_SHARED_PHI:-OFF} -DWITH_TENSORRT=${WITH_TENSORRT:-ON} -DWITH_ROCM=${WITH_ROCM:-OFF} -DWITH_CINN=${WITH_CINN:-OFF} -DWITH_DISTRIBUTE=${distibuted_flag} -DWITH_MKL=${WITH_MKL:-ON} -DWITH_AVX=${WITH_AVX:-OFF} -DCUDA_ARCH_NAME=${CUDA_ARCH_NAME:-All} -DNEW_RELEASE_PYPI=${NEW_RELEASE_PYPI:-OFF} -DNEW_RELEASE_ALL=${NEW_RELEASE_ALL:-OFF} -DNEW_RELEASE_JIT=${NEW_RELEASE_JIT:-OFF} -DWITH_PYTHON=${WITH_PYTHON:-ON} -DCUDNN_ROOT=/usr/ -DWITH_TESTING=${WITH_TESTING:-ON} -DWITH_COVERAGE=${WITH_COVERAGE:-OFF} -DWITH_INCREMENTAL_COVERAGE=${WITH_INCREMENTAL_COVERAGE:-OFF} -DCMAKE_MODULE_PATH=/opt/rocm/hip/cmake -DCMAKE_EXPORT_COMPILE_COMMANDS=ON -DWITH_INFERENCE_API_TEST=${WITH_INFERENCE_API_TEST:-ON} -DINFERENCE_DEMO_INSTALL_DIR=${INFERENCE_DEMO_INSTALL_DIR} -DPY_VERSION=${PY_VERSION:-3.8} -DCMAKE_INSTALL_PREFIX=${INSTALL_PREFIX:-/paddle/build} -DWITH_PSCORE=${pscore_flag} -DWITH_PSLIB=${pslib_flag} -DWITH_GLOO=${gloo_flag} -DWITH_XPU=${WITH_XPU:-OFF} -DWITH_IPU=${WITH_IPU:-OFF} -DXPU_SDK_ROOT=${XPU_SDK_ROOT:-""} -DWITH_XPU_BKCL=${WITH_XPU_BKCL:-OFF} -DWITH_XPU_XRE5=${WITH_XPU_XRE5:-OFF} -DWITH_ARM=${WITH_ARM:-OFF} -DWITH_STRIP=${WITH_STRIP:-ON} -DON_INFER=${ON_INFER:-OFF} -DWITH_HETERPS=${WITH_HETERPS:-OFF} -DCUDA_ARCH_BIN=${CUDA_ARCH_BIN} -DWITH_RECORD_BUILDTIME=${WITH_RECORD_BUILDTIME:-OFF} -DWITH_UNITY_BUILD=${WITH_UNITY_BUILD:-OFF} -DWITH_ONNXRUNTIME=${WITH_ONNXRUNTIME:-OFF} -DWITH_CUDNN_FRONTEND=${WITH_CUDNN_FRONTEND:-OFF} -DWITH_CPP_TEST=${WITH_CPP_TEST:-OFF}
+    cmake .. -DCMAKE_BUILD_TYPE=${CMAKE_BUILD_TYPE:-Release} -DWITH_GPU=${WITH_GPU:-OFF} -DWITH_SHARED_PHI=${WITH_SHARED_PHI:-OFF} -DWITH_TENSORRT=${WITH_TENSORRT:-ON} -DWITH_OPENVINO=${WITH_OPENVINO:-ON} -DWITH_ROCM=${WITH_ROCM:-OFF} -DWITH_CINN=${WITH_CINN:-OFF} -DWITH_DISTRIBUTE=${distibuted_flag} -DWITH_MKL=${WITH_MKL:-ON} -DWITH_AVX=${WITH_AVX:-OFF} -DCUDA_ARCH_NAME=${CUDA_ARCH_NAME:-All} -DNEW_RELEASE_PYPI=${NEW_RELEASE_PYPI:-OFF} -DNEW_RELEASE_ALL=${NEW_RELEASE_ALL:-OFF} -DNEW_RELEASE_JIT=${NEW_RELEASE_JIT:-OFF} -DWITH_PYTHON=${WITH_PYTHON:-ON} -DCUDNN_ROOT=/usr/ -DWITH_TESTING=${WITH_TESTING:-ON} -DWITH_COVERAGE=${WITH_COVERAGE:-OFF} -DWITH_INCREMENTAL_COVERAGE=${WITH_INCREMENTAL_COVERAGE:-OFF} -DCMAKE_MODULE_PATH=/opt/rocm/hip/cmake -DCMAKE_EXPORT_COMPILE_COMMANDS=ON -DWITH_INFERENCE_API_TEST=${WITH_INFERENCE_API_TEST:-ON} -DINFERENCE_DEMO_INSTALL_DIR=${INFERENCE_DEMO_INSTALL_DIR} -DPY_VERSION=${PY_VERSION:-3.8} -DCMAKE_INSTALL_PREFIX=${INSTALL_PREFIX:-/paddle/build} -DWITH_PSCORE=${pscore_flag} -DWITH_PSLIB=${pslib_flag} -DWITH_GLOO=${gloo_flag} -DWITH_XPU=${WITH_XPU:-OFF} -DWITH_IPU=${WITH_IPU:-OFF} -DXPU_SDK_ROOT=${XPU_SDK_ROOT:-""} -DWITH_XPU_BKCL=${WITH_XPU_BKCL:-OFF} -DWITH_XPU_XRE5=${WITH_XPU_XRE5:-OFF} -DWITH_ARM=${WITH_ARM:-OFF} -DWITH_STRIP=${WITH_STRIP:-ON} -DON_INFER=${ON_INFER:-OFF} -DWITH_HETERPS=${WITH_HETERPS:-OFF} -DCUDA_ARCH_BIN=${CUDA_ARCH_BIN} -DWITH_RECORD_BUILDTIME=${WITH_RECORD_BUILDTIME:-OFF} -DWITH_UNITY_BUILD=${WITH_UNITY_BUILD:-OFF} -DWITH_ONNXRUNTIME=${WITH_ONNXRUNTIME:-OFF} -DWITH_CUDNN_FRONTEND=${WITH_CUDNN_FRONTEND:-OFF} -DWITH_CPP_TEST=${WITH_CPP_TEST:-OFF}


CPU单测流水线增加OpenVINO

update binding input/output by index

ckl117 · 2024-12-12T03:16:25Z

CPU whl包、SDK库增加的体积也给下吧

单测需要更加完善下，增加Python端测试以及无法转成功的case。

whl包增加23MB，SDK库增加75MB。
已补充python单测覆盖resnet模型，FP32和FP16精度以及batchsize=2的场景。

wanghuancoder

LGTM

zhangbo9674

LGTM

XiaoguangHu01

LGTM

…addlePaddle#69122)" This reverts commit 9675759.

ckl117 added 5 commits October 31, 2024 02:43

test submodule

b13648e

Update submodule openvino to branch pnc

1adc141

third_part load

6c19771

update openvino dirty

6b5d16b

support paddle to openvino

1f4187a

ckl117 requested review from wanghuancoder and XiaoguangHu01 as code owners November 1, 2024 10:47

ckl117 changed the title ~~Paddle支持OpenVINO~~ 第三方库接入OpenVINO Nov 1, 2024

ckl117 mentioned this pull request Nov 4, 2024

【OpenVINO】支持全图转OpenVINO #69035

Closed

bukejiyu and others added 2 commits November 6, 2024 00:37

support openvino run in paddle

b9de2b3

Merge pull request #2 from bukejiyu/support_openvino

f974103

support openvino run in paddle

ckl117 added 8 commits November 13, 2024 02:55

code check and update openvino commit

116e111

delete param and op in openvino pass

f88eb19

first delete op and var, Reduce the use of 100MB of memory

2ddcc8e

openvino support save and run opt model

7d1c0e5

Merge branch 'develop' of https://github.com/PaddlePaddle/Paddle into…

a502040

… ov_test

check

dd2f603

test_resnet50

47c9be2

add openvino to paddle_build.sh

404b59d

ckl117 requested review from risemeup1, zhangbo9674 and XieYunshen as code owners November 21, 2024 08:47

ckl117 and others added 4 commits November 21, 2024 11:24

check paddle_build.sh

fde76bd

support more intputs type

f985f8d

Merge branch 'ov_test' into support_openvino

6a70fbf

CI-Coverage

c200cf3

ckl117 requested a review from zhwesky2010 as a code owner November 22, 2024 08:44

ckl117 added 5 commits December 5, 2024 07:39

update openvino commit

ca611ae

update openvino

aa68c97

Merge branch 'develop' of https://github.com/PaddlePaddle/Paddle into…

ed56db3

… ov_test

code check

b765185

check

b476afc

yuanlehome previously approved these changes Dec 9, 2024

View reviewed changes

ckl117 changed the title ~~第三方库接入OpenVINO~~ 【Inference】Support OpenVINO CPU high-performance inference Dec 10, 2024

qingqing01 reviewed Dec 10, 2024

View reviewed changes

ckl117 commented Dec 10, 2024

View reviewed changes

add test for openvino

cb16e69

ckl117 dismissed yuanlehome’s stale review via cb16e69 December 11, 2024 08:29

ckl117 and others added 4 commits December 11, 2024 08:32

check

8c1aff8

update binding input/output by index

8971c4f

Merge pull request #6 from bukejiyu/support_openvino

a18f6fc

update binding input/output by index

code check

2a96625

check test

8e3589b

ckl117 changed the title ~~【Inference】Support OpenVINO CPU high-performance inference~~ 【Inference】Support OpenVINO CPU High-Performance Inference Dec 13, 2024

qingqing01 approved these changes Dec 13, 2024

View reviewed changes

wanghuancoder approved these changes Dec 13, 2024

View reviewed changes

risemeup1 approved these changes Dec 13, 2024

View reviewed changes

YuanRisheng approved these changes Dec 13, 2024

View reviewed changes

zhangbo9674 approved these changes Dec 13, 2024

View reviewed changes

XiaoguangHu01 approved these changes Dec 13, 2024

View reviewed changes

winter-wang approved these changes Dec 13, 2024

View reviewed changes

luotao1 approved these changes Dec 13, 2024

View reviewed changes

XieYunshen approved these changes Dec 13, 2024

View reviewed changes

yuanlehome merged commit 9675759 into PaddlePaddle:develop Dec 13, 2024
28 checks passed

ckl117 added a commit to ckl117/Paddle that referenced this pull request Dec 17, 2024

Revert "【Inference】Support OpenVINO CPU High-Performance Inference (P…

3891381

…addlePaddle#69122)" This reverts commit 9675759.

		@@ -0,0 +1,578 @@
		diff --git a/src/frontends/paddle/src/default_opset.hpp b/src/frontends/paddle/src/default_opset.hpp

【Inference】Support OpenVINO CPU High-Performance Inference #69122

【Inference】Support OpenVINO CPU High-Performance Inference #69122

Uh oh!

Conversation

ckl117 commented Nov 1, 2024 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

PR Category

PR Types

Description

Uh oh!

paddle-bot bot commented Nov 1, 2024

Uh oh!

CLAassistant commented Nov 6, 2024 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

CLAassistant commented Nov 6, 2024

Uh oh!

qingqing01 left a comment

Choose a reason for hiding this comment

Uh oh!

qingqing01 Dec 10, 2024

Choose a reason for hiding this comment

Uh oh!

ckl117 Dec 10, 2024

Choose a reason for hiding this comment

Uh oh!

qingqing01 Dec 10, 2024

Choose a reason for hiding this comment

Uh oh!

ckl117 Dec 10, 2024

Choose a reason for hiding this comment

Uh oh!

qingqing01 Dec 10, 2024

Choose a reason for hiding this comment

Uh oh!

ckl117 Dec 12, 2024

Choose a reason for hiding this comment

Uh oh!

ckl117 Dec 10, 2024 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Choose a reason for hiding this comment

Uh oh!

ckl117 Dec 10, 2024 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Choose a reason for hiding this comment

Uh oh!

ckl117 commented Dec 12, 2024 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

wanghuancoder left a comment

Choose a reason for hiding this comment

Uh oh!

zhangbo9674 left a comment

Choose a reason for hiding this comment

Uh oh!

XiaoguangHu01 left a comment

Choose a reason for hiding this comment

Uh oh!

Uh oh!

Uh oh!

ckl117 commented Nov 1, 2024 •

edited

Loading

CLAassistant commented Nov 6, 2024 •

edited

Loading

ckl117 Dec 10, 2024 •

edited

Loading

ckl117 Dec 10, 2024 •

edited

Loading

ckl117 commented Dec 12, 2024 •

edited

Loading