vllm.model_executor.model_loader.reload.utils ¶

get_info_size ¶

get_info_size(info: LayerReloadingInfo) -> int

Calculate the number of bytes used by loaded weights for a given layer

:param info: layerwise info to get size of :return: number of bytes used by loaded weights

Source code in vllm/model_executor/model_loader/reload/utils.py

def get_info_size(info: LayerReloadingInfo) -> int:
    """
    Calculate the number of bytes used by loaded weights for a given layer

    :param info: layerwise info to get size of
    :return: number of bytes used by loaded weights
    """
    return sum(
        value.nbytes
        for _, args in info.loaded_weights
        for value in args.arguments.values()
        if isinstance(value, torch.Tensor) and value.device.type not in ("meta", "cpu")
    )

get_layer_params_buffers ¶

get_layer_params_buffers(layer: Module) -> LayerTensors

Get all parameters and buffers of a module as a tuple of dicts.

Source code in vllm/model_executor/model_loader/reload/utils.py

def get_layer_params_buffers(layer: torch.nn.Module) -> LayerTensors:
    """Get all parameters and buffers of a module as a tuple of dicts."""
    return (
        {name: param for name, param in layer._parameters.items() if param is not None},
        {name: buffer for name, buffer in layer._buffers.items() if buffer is not None},
    )

get_layer_size ¶

get_layer_size(layer: Module) -> int

Calculate total number of elements across loadable tensors in a layer.

Excludes SKIP_TENSORS (e.g. _expert_map) which are never moved to meta device and never loaded via weight_loader during layerwise reload.

Source code in vllm/model_executor/model_loader/reload/utils.py

def get_layer_size(layer: torch.nn.Module) -> int:
    """Calculate total number of elements across loadable tensors in a layer.

    Excludes SKIP_TENSORS (e.g. _expert_map) which are never moved to meta
    device and never loaded via weight_loader during layerwise reload.
    """
    from .meta import SKIP_TENSORS

    return sum(
        tensor.numel()
        for name, tensor in get_layer_tensors(layer).items()
        if name not in SKIP_TENSORS
    )

get_layer_tensors ¶

get_layer_tensors(layer: Module) -> dict[str, Tensor]

Get all parameters and buffers from a module as a dict.

Source code in vllm/model_executor/model_loader/reload/utils.py

def get_layer_tensors(layer: torch.nn.Module) -> dict[str, torch.Tensor]:
    """Get all parameters and buffers from a module as a dict."""
    params, buffers = get_layer_params_buffers(layer)
    return params | buffers

has_device_tensors ¶

has_device_tensors(bound_args: BoundArguments) -> bool

Return True if the loaded weights exist on an accelerator device

:param bound_args: args to load weights :return: True if weights are on accelerator device

Source code in vllm/model_executor/model_loader/reload/utils.py

def has_device_tensors(bound_args: BoundArguments) -> bool:
    """
    Return True if the loaded weights exist on an accelerator device

    :param bound_args: args to load weights
    :return: True if weights are on accelerator device
    """
    return any(
        isinstance(value, torch.Tensor) and value.device.type not in ("meta", "cpu")
        for value in bound_args.arguments.values()
    )