HotpotQA推理问答报错

Open WOWCharlotte opened this issue 6 months ago • 0 comments

编写eva.py文件

import json
import logging
import os
from typing import List

from kag.common.benchmarks.evaluate import Evaluate
from kag.examples.utils import delay_run
from kag.open_benchmark.utils.eval_qa import EvalQa, running_paras, do_main
from kag.common.conf import KAG_CONFIG
from kag.common.registry import import_modules_from_path
from kag.interface import SolverPipelineABC
from kag.solver.reporter.trace_log_reporter import TraceLogReporter

logger = logging.getLogger(__name__)


class EvaForQA(EvalQa):
    """
    init for kag client
    """

    def __init__(self, solver_pipeline_name="kag_solver_pipeline"):
        super().__init__(task_name="2wiki", solver_pipeline_name=solver_pipeline_name)

    async def qa(self, query, gold):
        reporter: TraceLogReporter = TraceLogReporter()

        pipeline = SolverPipelineABC.from_config(
            KAG_CONFIG.all_config[self.solver_pipeline_name]
        )
        answer = await pipeline.ainvoke(query, reporter=reporter, gold=gold)

        logger.info(f"\n\nso the answer for '{query}' is: {answer}\n\n")

        info, status = reporter.generate_report_data()
        return answer, {"info": info.to_dict(), "status": status}

    async def async_process_sample(self, data):
        sample_idx, sample, ckpt = data
        question = sample["question"]
        gold = sample["answer"]
        try:
            if ckpt and question in ckpt:
                print(f"found existing answer to question: {question}")
                prediction, trace_log = ckpt.read_from_ckpt(question)
            else:
                prediction, trace_log = await self.qa(query=question, gold=gold)
                if ckpt:
                    ckpt.write_to_ckpt(question, (prediction, trace_log))
            metrics = self.do_metrics_eval([question], [prediction], [gold])
            return sample_idx, prediction, metrics, trace_log
        except Exception as e:
            import traceback

            logger.warning(
                f"process sample failed with error:{traceback.print_exc()}\nfor: {sample['question']} {e}"
            )
            return None

    def load_data(self, file_path):
        with open(file_path, "r") as f:
            return json.load(f)

    def do_metrics_eval(self, questionList: List[str], predictions: List[str], golds: List[str]):
        eva_obj = Evaluate()
        return eva_obj.getBenchMark(questionList, predictions, golds)

    def do_recall_eval(self, sample, references):
        eva_obj = Evaluate()
        paragraph_support_idx_set = [
            idx["paragraph_support_idx"] for idx in sample["question_decomposition"]
        ]
        golds = []
        for idx in paragraph_support_idx_set:
            golds.append(
                eva_obj.generate_id(
                    sample["paragraphs"][idx]["title"],
                    sample["paragraphs"][idx]["paragraph_text"],
                )
            )
        return eva_obj.recall_top(predictionlist=references, goldlist=golds)


if __name__ == "__main__":
    import_modules_from_path("./prompt")
    delay_run(hours=0)
    # 解析命令行参数
    parser = running_paras()
    args = parser.parse_args()
    qa_file_path = os.path.join(
        os.path.abspath(os.path.dirname(__file__)), f"{args.qa_file}"
    )
    do_main(
        qa_file_path=qa_file_path,
        thread_num=args.thread_num,
        upper_limit=args.upper_limit,
        collect_file=args.res_file,
        eval_obj=EvaForQA(),
    )

2.运行eva.py报错

PS D:\Python Project\KAG-master\kag\examples\HotpotQA\solver> python eva.py --qa_file ./data/qa_sub.json
2025-06-07 17:09:07 - INFO - root - found config file: D:\Python Project\KAG-master\kag\examples\HotpotQA\kag_config.yaml
2025-06-07 17:09:07 - INFO - root - Done init config from local file
2025-06-07 17:09:15 - WARNING - ZODB.FileStorage - Ignoring index for D:\Python Project\KAG-master\kag\examples\HotpotQA\solver\ckpt\kag_checkpoint_0_1.ckpt
parallelQaAndEvaluate 2wiki completing:   0%|                                                                              | 0/2 [00:00<?, ?it/s]Traceback (most recent call last):
  File "D:\Python Project\KAG-master\kag\examples\HotpotQA\solver\eva.py", line 47, in async_process_sample
    prediction, trace_log = await self.qa(query=question, gold=gold)
  File "D:\Python Project\KAG-master\kag\examples\HotpotQA\solver\eva.py", line 29, in qa
    KAG_CONFIG.all_config[self.solver_pipeline_name]
KeyError: 'kag_solver_pipeline'
2025-06-07 17:09:15 - WARNING - __main__ - process sample failed with error:None
for: When did Lothair Ii's mother die? 'kag_solver_pipeline'
Traceback (most recent call last):
  File "D:\Python Project\KAG-master\kag\examples\HotpotQA\solver\eva.py", line 47, in async_process_sample
    prediction, trace_log = await self.qa(query=question, gold=gold)
  File "D:\Python Project\KAG-master\kag\examples\HotpotQA\solver\eva.py", line 29, in qa
    KAG_CONFIG.all_config[self.solver_pipeline_name]
KeyError: 'kag_solver_pipeline'
2025-06-07 17:09:15 - WARNING - __main__ - process sample failed with error:None
for: Which film was released first, Aas Ka Panchhi or Phoolwari? 'kag_solver_pipeline'
parallelQaAndEvaluate 2wiki completing: 100%|█████████████████████████████████████████████████████████████████████| 2/2 [00:00<00:00, 400.47it/s] 
{'processNum': 0, 'cost': 0.03635144233703613, 'task_name': '2wiki'}
processNum: 0   cost: 0.03635144233703613       task_name: 2wiki

Jun 07 '25 09:06 WOWCharlotte