コンテンツにスキップ

縮小オペレーター設定ファイル

縮小オペレーター設定ファイル

Section titled “縮小オペレーター設定ファイル”

縮小オペレーター設定ファイルは、ONNX Runtimeのソースからビルドするスクリプトへの入力です。これは、ランタイムに含まれるオペレーターを指定します。ONNX Runtimeでオペレーターのセットを縮小することで、ビルドバイナリのサイズを小さくできます。小さなランタイムは、モバイルやWebデプロイメントなどの制約のある環境で使用されます。

この記事では、create_reduced_build_config.pyスクリプトを使用して縮小オペレーター設定ファイルを生成する方法を説明します。また、ONNXモデルをORT形式に変換することで縮小オペレーター設定ファイルを生成することもできます。

  • TOC

create_reduced_build_config.pyスクリプト

Section titled “create_reduced_build_config.pyスクリプト”

縮小オペレーター設定ファイルを作成するには、モデルに対してcreate_reduced_build_config.pyスクリプトを実行します。

カーネル設定ファイルは必要に応じて手動で編集できます。設定は、ONNX形式またはORT形式のモデルから作成できます。