linagora
/

Llamipa

action prediction

Model card Files Files and versions

Kqte commited on May 1, 2025

Commit

8bcfbaa

·

verified ·

1 Parent(s): ae471e2

Upload 2 files

Files changed (2) hide show

model/parse_gold.py +44 -0
model/parse_incremental.py +1 -1

model/parse_gold.py ADDED Viewed

	@@ -0,0 +1,44 @@

+import torch
+import json
+from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline
+from datasets import load_dataset
+from tqdm import tqdm
+device_map = "auto"
+model = AutoModelForCausalLM.from_pretrained(
+    "/path/to/llamipa/adapter",
+    return_dict=True,
+    torch_dtype=torch.float16,
+    device_map=device_map)
+tokenizer = AutoTokenizer.from_pretrained("/path/to/meta-llama3-8b/",add_eos_token=True)
+tokenizer.pad_token_id = tokenizer.eos_token_id + 1
+tokenizer.padding_side = "right"
+pipe = pipeline(task="text-generation", model=model, tokenizer=tokenizer, pad_token_id=tokenizer.pad_token_id, max_new_tokens=100)
+test_dataset = load_dataset("json", data_files={'test':'/path/to/parser_test_15_gold.jsonl'})["test"]
+def formatting_prompts_func(example):
+     output_texts = []
+     for i in range(len(example['sample'])):
+         text = f"<|begin_of_text|>Identify the discourse structure (DS) for the new turn in the following excerpt :\n {example['sample'][i]}\n ### DS:"
+         output_texts.append(text)
+     return output_texts
+test_texts = formatting_prompts_func(test_dataset)
+print("Test Length:", len(test_texts))
+f = open("/path/to/test-output-file.txt","w")
+for text in tqdm(test_texts):
+    print(text)
+    print(pipe(text)[0]["generated_text"], file=f)
+f.close()

model/parse_incremental.py CHANGED Viewed

@@ -89,7 +89,7 @@ def format_gen(preds):
 def formatting_prompts_func(example):
-    output_text = '<|begin_of_text|>Identify the discourse structure (DS) for the new turn in the following excerpt :\n' + example + '\n ### DS:'
     return output_text
 f = open("/path/to/test-output-file.txt","w")

 def formatting_prompts_func(example):
+    output_text = '<|begin_of_text|>Identify the discourse structure (DS) for the new turn in the following excerpt :\n ' + example + '\n ### DS:'
     return output_text
 f = open("/path/to/test-output-file.txt","w")