formatron/v0.4.2/exllamav2_8py_source.html

"""

This module integrates the ExLlamaV2 library by providing convenience utilities.

"""

import typing

from copy import copy, deepcopy

import kbnf

import torch

from exllamav2 import ExLlamaV2Tokenizer, ExLlamaV2

from exllamav2.generator.base import ExLlamaV2Filter

from formatron.config import EngineGenerationConfig

from formatron.formatter import FormatterBase, FormatterBuilder

from formatron.integrations._utils import get_original_characters

from functools import lru_cache


def create_engine_vocabulary(tokenizer: ExLlamaV2Tokenizer) -> kbnf.Vocabulary:

    """

    Create a vocabulary for the KBNF engine.

    """


    assert hasattr(tokenizer.tokenizer_model, "vocab"), (f"tokenizer({tokenizer})"

                                                         f" with tokenizer_model({tokenizer.tokenizer_model})"

                                                         f" does not have vocab attribute!")

    vocab = {tokenizer.tokenizer_model.id_to_piece(

        i): i for i in range(tokenizer.tokenizer_model.vocab_size())}

    new_vocab = get_original_characters(vocab)

    return kbnf.Vocabulary({v: kbnf.Token(k) for k, v in new_vocab.items()},

                           {k: v for k, v in enumerate(vocab)})


def create_formatter_filter(model: ExLlamaV2, tokenizer: ExLlamaV2Tokenizer,


                            formatter_builder: FormatterBuilder,

                            engine_config: EngineGenerationConfig = None) -> ExLlamaV2Filter:

    """


    Create a formatter filter for the ExLlamaV2 engine.

    """

    vocab = create_engine_vocabulary(tokenizer)

    f = formatter_builder.build(

        vocab, lambda tokens: tokenizer.decode(torch.tensor(tokens)))

    return FormatterFilter(model, tokenizer, f, engine_config)


class FormatterFilter(ExLlamaV2Filter):


    """

    ExLlamaV2Filter that uses a formatter to mask logits.

    """


    def __init__(self, model, tokenizer, formatter: FormatterBase,


                 config: EngineGenerationConfig = None):

        super().__init__(model, tokenizer)

        self._formatter = formatter

        if config is None:

            config = EngineGenerationConfig()

        self._config = config

        self._pass_tokens = set()


    def is_completed(self) -> bool:


        """

        Check if the formatter is completed.

        """


        return self._formatter.is_completed()


    def clone(self, c=None) -> "FormatterFilter":


        if c is None:

            c = FormatterFilter.__new__(FormatterFilter)

        c.model = self.model

        c.tokenizer = self.tokenizer

        c.sequence_str = self.sequence_str

        # formatter does not have mutable public state anyway

        c._formatter = copy(self._formatter)

        c._config = deepcopy(self._config)

        c._pass_tokens = self._pass_tokens

        return c


    def begin(self, prefix_str: str) -> None:


        if self._config.reset_at_beginning:

            self._formatter.reset()

        if self._config.read_prompt:

            prompt = prefix_str.encode("utf-8")

            self._formatter.accept_bytes(prompt)


    def reset(self) -> None:


        self._formatter.reset()


    def feed(self, token: int):


        if self._formatter.is_completed():

            return None

        self._formatter.accept_token(token)


    # adapted from https://github.com/Dan-wanna-M/formatron/issues/14


    # Old version for compatibility

    def next_set(self) -> typing.Tuple[typing.Set[int], typing.Set[int]]:


        if self._formatter.is_completed():

            return {self.tokenizer.eos_token_id}, {self.tokenizer.eos_token_id}

        self._formatter.compute_allowed_tokens()

        self._pass_tokens.clear()

        self._pass_tokens.update(self._formatter.get_allowed_tokens_since_last_computation())

        return self._pass_tokens, set()


    # adapted from https://github.com/Dan-wanna-M/formatron/issues/14


    def next(self) -> typing.Tuple[typing.Sequence[int], typing.Sequence[int]]:


        # Kludge to maintain compatibility with exllamav2 <= 0.2.0

        if not hasattr(self, "allow_return_type_list"):

            return self.next_set()

        if self._formatter.is_completed():

            return [self.tokenizer.eos_token_id], [self.tokenizer.eos_token_id]

        self._formatter.compute_allowed_tokens()

        return self._formatter.get_allowed_tokens_since_last_computation(), []


    # adapted from https://github.com/Dan-wanna-M/formatron/issues/14


    def use_background_worker(self) -> bool:


        return True


    @property


    def formatter_captures(self) -> dict[str, typing.Any]:

        return self._formatter.captures


formatron.config.EngineGenerationConfig
Configuration for how an KBNF engine should be used in text generation.
Definition config.py:14

formatron.integrations.exllamav2.FormatterFilter
ExLlamaV2Filter that uses a formatter to mask logits.
Definition exllamav2.py:46

formatron.integrations.exllamav2.FormatterFilter.begin
None begin(self, str prefix_str)
Definition exllamav2.py:75

formatron.integrations.exllamav2.FormatterFilter._pass_tokens
_pass_tokens
Definition exllamav2.py:55

formatron.integrations.exllamav2.FormatterFilter._formatter
_formatter
Definition exllamav2.py:51

formatron.integrations.exllamav2.FormatterFilter.feed
feed(self, int token)
Definition exllamav2.py:85

formatron.integrations.exllamav2.FormatterFilter.clone
"FormatterFilter" clone(self, c=None)
Definition exllamav2.py:63

formatron.integrations.exllamav2.FormatterFilter.reset
None reset(self)
Definition exllamav2.py:82

formatron.integrations.exllamav2.FormatterFilter.use_background_worker
bool use_background_worker(self)
Definition exllamav2.py:111

formatron.integrations.exllamav2.FormatterFilter.__init__
__init__(self, model, tokenizer, FormatterBase formatter, EngineGenerationConfig config=None)
Definition exllamav2.py:49

formatron.integrations.exllamav2.FormatterFilter.next
typing.Tuple[typing.Sequence[int], typing.Sequence[int]] next(self)
Definition exllamav2.py:101

formatron.integrations.exllamav2.FormatterFilter.formatter_captures
dict[str, typing.Any] formatter_captures(self)
Definition exllamav2.py:122

formatron.integrations.exllamav2.FormatterFilter.next_set
typing.Tuple[typing.Set[int], typing.Set[int]] next_set(self)
Definition exllamav2.py:92

formatron.integrations.exllamav2.FormatterFilter.is_completed
bool is_completed(self)
Check if the formatter is completed.
Definition exllamav2.py:60

formatron.integrations.exllamav2.FormatterFilter._config
_config
Definition exllamav2.py:54

formatron.config
Configuration classes for Formatron.
Definition config.py:1

formatron.formatter
This module contains the Formatter class and its related classes.
Definition formatter.py:1

formatron.integrations._utils
Definition _utils.py:1

formatron.integrations.exllamav2.create_formatter_filter
ExLlamaV2Filter create_formatter_filter(ExLlamaV2 model, ExLlamaV2Tokenizer tokenizer, FormatterBuilder formatter_builder, EngineGenerationConfig engine_config=None)
Create a formatter filter for the ExLlamaV2 engine.
Definition exllamav2.py:36

formatron.integrations.exllamav2.create_engine_vocabulary
kbnf.Vocabulary create_engine_vocabulary(ExLlamaV2Tokenizer tokenizer)
Create a vocabulary for the KBNF engine.
Definition exllamav2.py:20