ESPnet3 Inference Providers

Masao SomekiLess than 1 minute

🔎 ESPnet3 Inference Providers

Inference workloads usually want the same pattern:

build a read-only dataset of "items to decode"
load a model once per worker (often onto GPU)
run forward(idx, **env) repeatedly over indices

InferenceProvider is a small convenience base class for this pattern. It is an EnvironmentProvider that standardises the environment keys to:

dataset
model

Implementation reference: espnet3/parallel/inference_provider.py.

Provider / Runner
Infer config
Inference stage
espnet3/parallel/base_runner.py

✅ What you implement

Subclasses implement two constructors:

build_dataset(cfg) → returns dataset-like object
build_model(cfg) → returns model-like object

InferenceProvider then builds an environment dict like:

{
  "dataset": <your dataset>,
  "model": <your model>,
  **params,  # optional extras
}

🧩 Minimal example

from espnet3.parallel.base_runner import BaseRunner
from espnet3.parallel.inference_provider import InferenceProvider


class MyProvider(InferenceProvider):
    @staticmethod
    def build_dataset(cfg):
        return load_samples(cfg.dataset)  # user-defined

    @staticmethod
    def build_model(cfg):
        model = load_model(cfg.model)  # user-defined
        return model.eval()


class MyRunner(BaseRunner):
    @staticmethod
    def forward(idx: int, *, dataset, model, **env):
        x = dataset[idx]
        return model.decode(x, **env)


provider = MyProvider(cfg, params={"beam_size": 8})
runner = MyRunner(provider)
results = runner(range(len(provider.build_env_local()["dataset"])))