Fix `.generate(input_ids=...)` #485

borzunov · 2023-08-30T02:36:07Z

This PR fixes the following code (a popular way to run .generate()):

import torch
from transformers import AutoTokenizer
from petals import AutoDistributedModelForCausalLM

model_name = "Maykeye/TinyLlama-v0"
tokenizer = AutoTokenizer.from_pretrained(model_name, use_fast=False, add_bos_token=False)
model = AutoDistributedModelForCausalLM.from_pretrained(model_name)

inputs = tokenizer("A cat sat on", return_tensors="pt")
outputs = model.generate(**inputs, max_new_tokens=4)
tokenizer.decode(outputs[0])

borzunov added 6 commits August 30, 2023 02:35

Fix .generate(input_ids=...) and .generate(inputs_embeds=...)

b3136be

Fix flapping test

68ff865

black

13e61a7

Fix test

7fe2635

Remove inputs_embeds support

06accbc

Fix test

4ed2d0b

borzunov changed the title ~~Fix .generate(input_ids=...) and .generate(inputs_embeds=...)~~ Fix .generate(input_ids=...) Aug 30, 2023

borzunov merged commit a26559f into main Aug 30, 2023

borzunov deleted the input-ids branch August 30, 2023 02:59

borzunov mentioned this pull request Aug 30, 2023

model.generate(input_ids=...) support #481

Closed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Fix `.generate(input_ids=...)` #485

Fix `.generate(input_ids=...)` #485

borzunov commented Aug 30, 2023 •

edited

Loading

Fix .generate(input_ids=...) #485

Fix .generate(input_ids=...) #485

Conversation

borzunov commented Aug 30, 2023 • edited Loading

Fix `.generate(input_ids=...)` #485

Fix `.generate(input_ids=...)` #485

borzunov commented Aug 30, 2023 •

edited

Loading