当前位置:   article > 正文

Langfuse标注数据集

Langfuse标注数据集

一、手工标注

1、创建数据集

2、打分

3、指定数据集

并且可以在Expected Output中输入期望的输出

二、上传数据集

1、编写代码

  1. from langfuse import Langfuse
  2. import os
  3. # 加载 .env 到环境变量
  4. from dotenv import load_dotenv, find_dotenv
  5. _ = load_dotenv(find_dotenv())
  6. import json
  7. from langfuse.model import CreateDatasetRequest, CreateDatasetItemRequest
  8. from tqdm import tqdm
  9. data = []
  10. with open('my_langfusedataset.jsonl', 'r', encoding='utf-8') as fp:
  11. for line in fp:
  12. example = json.loads(line.strip())
  13. item = {
  14. "input": {
  15. "outlines": example["outlines"],
  16. "user_input": example["user_input"]
  17. },
  18. "expected_output": example["label"]
  19. }
  20. data.append(item)
  21. # init
  22. langfuse = Langfuse()
  23. for item in tqdm(data[:50]):
  24. langfuse.create_dataset_item(
  25. dataset_name="myDataset1",
  26. input=item["input"],
  27. expected_output=item["expected_output"]
  28. )

声明:本文内容由网友自发贡献,转载请注明出处:【wpsshop博客】
推荐阅读
相关标签
  

闽ICP备14008679号