Lyu Shuhang
Lyu Shuhang
我写了一个样例,是一个conversation样本,里面有三轮对话,不知是否正确? ``` { "conversation":[ {"system" :"你是一个可以调用外部工具的助手,可以使用的工具包括: {'GoogleSearch': '一个可以从谷歌搜索结果的API。当你需要对于一个特定问题找到简短明了的回答时,可以使用它。输入应该是一个搜索查询。','PythonInterpreter': "用来执行Python代码。代码必须是一个函数,函数名必须得是'solution',代码对应你的思考过程。"} 如果使用工具请遵循以下格式回复: Thought:思考你当前步骤需要解决什么问题,是否需要使用工具 Action:工具名称,你的工具必须从 ['GoogleSearch', 'PythonInterpreter'] 中选择 Action Input:工具输入参数 工具返回按照以下格式回复: Response:调用工具后的结果 如果你已经知道了答案,或者你不需要工具,请遵循以下格式回复 Thought:给出最终答案的思考过程 Final Answer:最终答案 开始!", "input":"上海明天天气怎么样?", "output":"Thought:为了回答这个问题,我需要查找最新的天气预报数据。 Action:GoogleSearch Action Input:上海明天的天气预报 Response:根据最新的天气预报,上海明天的天气是晴转多云,气温介于20到28度之间。...
> @xiaohangguo > > 1. 可以,参考 https://github.com/InternLM/xtuner/blob/main/xtuner/configs/internlm/internlm_7b/internlm_7b_full_alpaca_e3.py > 2. 将数据集处理成如下格式(注意补充[Results])。大的原则是,api 返回的结果放到`"system"`,用户输入的内容放到 `"input"`,模型生成的内容放到 `"output"`。同时,`dataset_map_fn` 设为 `None`,`template_map_fn` 保持不变,以插入 、 等字段。 > > ```json > [{ > "conversation":[ > { > "system": "你是一个可以调用外部工具的助手,可以使用的工具包括:\n{'GoogleSearch':...
> @xiaohangguo "[Result]"这部分也需要模拟写好,这一轮对话的主要目的是让LLM学会根据API返回的结果梳理总结出答案 明白,那就和我理解的一样。万分感谢!!!!!!!!!!!!!!you are my hero ,bro@LZHgrla
有一个新问题,system中,如果是python解释器运行的结果返回的结构和内容是怎么样的,有点不太懂这里要怎么写这样写对吗 ``` { "conversation": [ { "system": "你是一个可以调用外部工具的助手...", "input": "设计一个满足特定要求的NMOSFET单管放大器...", "output": "Thought:首先需要初始化设计的基本参数,如电源电压、负载电容等。这些参数将用于后续计算和仿真。\nAction:PythonInterpreter\nAction Input:\n```python\nfrom lut.lookuptable.MOSinfo import LUT_DB\n\ndef solution():\n vdd = 1.2\n vcm = vdd / 2\n CL = 5e-12\n RL =...
> 这个我觉得是无所谓的,只要训练、推理的格式一致即可。因此,可以根据lagent框架代码解释器返回的格式,来构造训练数据 > > > 有一个新问题,system中,如果是python解释器运行的结果返回的结构和内容是怎么样的,有点不太懂这里要怎么写这样写对吗 > > ``` > > { > > "conversation": [ > > { > > "system": "你是一个可以调用外部工具的助手...", > > "input": "设计一个满足特定要求的NMOSFET单管放大器...", > > "output":...
试了一下,会输出这种东西 ``` response = chatbot.chat('帮我实现100以内的奇数求和') print(response.response) print(response.inner_steps) ``` ``` [ {'role': 'user', 'content': '帮我实现100以内的奇数求和'}, {'role': 'assistant', 'content': 'Thought: 这是一道计算题,需要用计算器Calculator计算一下100以内的奇数求和\nAction: PythonExecutor\nAction Input: def solution():\n answer = 1+3+5+7+9+11+13+15+17+19+21+23+25+27+29+31+33+35+37+39+41+43+45+47+49\n return answer'}, {'role': 'system',...
``` from lagent.agents import ReAct from lagent.actions import ActionExecutor, GoogleSearch, PythonInterpreter from lagent.llms import HFTransformer # Initialize the HFTransformer-based Language Model (llm) and provide the model name. llm = HFTransformer('/public/home/lvshuhang/model_space/workspace/internlm_internlm-chat-7b')...
做一个Epoch出来花了三个多小时 Epoch [1/3] /media/hang/1ba83754-8a9c-4989-9cf0-48bf763358da/hang/Bert-Chinese-Text-Classification-Pytorch/pytorch_pretrained/optimization.py:275: UserWarning: This overload of add_ is deprecated: add_(Number alpha, Tensor other) Consider using one of the following signatures instead: add_(Tensor other, *, Number alpha) (Triggered internally...
你gpu是什么型号啊,我的是RTX2070,但是我不知道怎么配置然后加速,用gpu是不是快一点呀,我就直接运行了,没改配置文件,你怎么配的配置文件可以给我看看吗
> 我试一下吧,还没用过kaggle运行,有什么要注意的吗(坑),我是在ubuntu上自己配的环境跑的