semantic_router.encoders.vit

On this page

VitEncoder Objects
__init__
__call__

VitEncoder Objects

class VitEncoder(DenseEncoder)

Encoder for Vision Transformer models. This class provides functionality to encode images using a Vision Transformer model via Hugging Face. It supports various image processing and model initialization options.

init

def __init__(**data)

Initialize the VitEncoder. Arguments:

**data (dict): Additional keyword arguments for the encoder.

call

def __call__(imgs: List[Any], batch_size: int = 32) -> List[List[float]]

Encode a list of images into embeddings using the Vision Transformer model. Arguments:

imgs (List[Any]): The images to encode.
batch_size (int): The batch size for encoding.

Returns: List[List[float]]: The embeddings for the images.

tfidf voyage

Get Started

User Guide

Client Reference

semantic_router.encoders.vit

VitEncoder Objects

init

call

Get Started

User Guide

Client Reference

​VitEncoder Objects

​__init__

​__call__

VitEncoder Objects

init

call