Quality_evaluation/stuff/extracting.py
Aleksandr Dubchak 98d5e90894 mind2web
2026-04-23 00:04:11 +03:00

31 lines
No EOL
1,003 B
Python

import json
INPUT_PATH = "../Mind2Web/test_task/test_task_2.json"
OUTPUT_PATH = "../Mind2Web/test_1_task_2.json"
with open(INPUT_PATH, "r") as f:
data = json.load(f)
# --- защита от кривых данных ---
if isinstance(data, dict):
print("⚠️ Файл уже обрезан (dict вместо list)")
task = data
elif isinstance(data, list):
print(f"✅ Найден список задач: {len(data)}")
task = data[0]
else:
raise ValueError("❌ Неизвестный формат JSON")
# --- проверка структуры ---
print("Ключи задачи:", task.keys())
if "confirmed_task" not in task:
print("❌ ВНИМАНИЕ: нет confirmed_task — файл уже обрезан или не тот")
else:
print("✅ Цель:", task["confirmed_task"])
# --- сохранение ---
with open(OUTPUT_PATH, "w") as f:
json.dump(task, f, indent=2, ensure_ascii=False)
print(f"💾 Сохранено в {OUTPUT_PATH}")