Model Instance Group

`model_navigator.api.triton.InstanceGroup` `dataclass`

Configuration for model instance group.

Read more in Triton Inference server model configuration

Parameters:

Name	Type	Description	Default
`kind`	`Optional[DeviceKind]`	Kind of this instance group.	`None`
`count`	`Optional[int]`	For a group assigned to GPU, the number of instances created for each GPU listed in 'gpus'. For a group assigned to CPU the number of instances created.	`None`
`name`	`Optional[str]`	Optional name of this group of instances.	`None`
`gpus`	`List[int]`	GPU(s) where instances should be available.	`dataclasses.field(default_factory=lambda : [])`
`passive`	`bool`	Whether the instances within this instance group will be accepting inference requests from the scheduler.	`False`
`host_policy`	`Optional[str]`	The host policy name that the instance to be associated with.	`None`
`profile`	`List[str]`	For TensorRT models containing multiple optimization profile, this parameter specifies a set of optimization profiles available to this instance group.	`dataclasses.field(default_factory=lambda : [])`

`__post_init__()`

Validate the configuration for early error handling.

Source code in model_navigator/triton/specialized_configs/common.py

def __post_init__(self) -> None:
    """Validate the configuration for early error handling."""
    if self.count is not None and self.count < 1:
        raise ModelNavigatorWrongParameterError("The `count` must be greater or equal 1.")

    if self.kind not in [None, DeviceKind.KIND_GPU, DeviceKind.KIND_AUTO] and len(self.gpus) > 0:
        raise ModelNavigatorWrongParameterError(
            f"`gpus` cannot be set when device is not {DeviceKind.KIND_GPU} or {DeviceKind.KIND_AUTO}"
        )

`model_navigator.api.triton.DeviceKind`

Bases: enum.Enum

Device kind for model deployment.

Read more in Triton Inference server model configuration

Parameters:

Name	Description	Default
`KIND_AUTO`	"KIND_AUTO"	required
`KIND_CPU`	"KIND_CPU"	required
`KIND_GPU`	"KIND_GPU"	required

Model Instance Group

model_navigator.api.triton.InstanceGroup dataclass

__post_init__()

model_navigator.api.triton.DeviceKind

`model_navigator.api.triton.InstanceGroup` `dataclass`

`__post_init__()`

`model_navigator.api.triton.DeviceKind`