Lyu Shuhang comments

Results 30 comments of


                                            Lyu Shuhang

Msagent fine-tune datasets formatting

我写了一个样例，是一个conversation样本，里面有三轮对话，不知是否正确？ ``` { "conversation":[ {"system" :"你是一个可以调用外部工具的助手，可以使用的工具包括： {'GoogleSearch': '一个可以从谷歌搜索结果的API。当你需要对于一个特定问题找到简短明了的回答时，可以使用它。输入应该是一个搜索查询。','PythonInterpreter': "用来执行Python代码。代码必须是一个函数，函数名必须得是'solution'，代码对应你的思考过程。"} 如果使用工具请遵循以下格式回复： Thought:思考你当前步骤需要解决什么问题，是否需要使用工具 Action:工具名称，你的工具必须从 ['GoogleSearch', 'PythonInterpreter'] 中选择 Action Input:工具输入参数工具返回按照以下格式回复： Response:调用工具后的结果如果你已经知道了答案，或者你不需要工具，请遵循以下格式回复 Thought:给出最终答案的思考过程 Final Answer:最终答案开始!", "input":"上海明天天气怎么样？", "output":"Thought:为了回答这个问题，我需要查找最新的天气预报数据。 Action:GoogleSearch Action Input:上海明天的天气预报 Response:根据最新的天气预报，上海明天的天气是晴转多云，气温介于20到28度之间。...

Msagent fine-tune datasets formatting

> @xiaohangguo > > 1. 可以，参考 https://github.com/InternLM/xtuner/blob/main/xtuner/configs/internlm/internlm_7b/internlm_7b_full_alpaca_e3.py > 2. 将数据集处理成如下格式（注意补充[Results]）。大的原则是，api 返回的结果放到`"system"`，用户输入的内容放到 `"input"`，模型生成的内容放到 `"output"`。同时，`dataset_map_fn` 设为 `None`，`template_map_fn` 保持不变，以插入、等字段。 > > ```json > [{ > "conversation":[ > { > "system": "你是一个可以调用外部工具的助手，可以使用的工具包括：\n{'GoogleSearch':...

Msagent fine-tune datasets formatting

> @xiaohangguo "[Result]"这部分也需要模拟写好，这一轮对话的主要目的是让LLM学会根据API返回的结果梳理总结出答案明白，那就和我理解的一样。万分感谢！！！！！！！！！！！！！！you are my hero ,bro@LZHgrla

Msagent fine-tune datasets formatting

有一个新问题，system中，如果是python解释器运行的结果返回的结构和内容是怎么样的，有点不太懂这里要怎么写这样写对吗 ``` { "conversation": [ { "system": "你是一个可以调用外部工具的助手...", "input": "设计一个满足特定要求的NMOSFET单管放大器...", "output": "Thought:首先需要初始化设计的基本参数，如电源电压、负载电容等。这些参数将用于后续计算和仿真。\nAction:PythonInterpreter\nAction Input:\n```python\nfrom lut.lookuptable.MOSinfo import LUT_DB\n\ndef solution():\n vdd = 1.2\n vcm = vdd / 2\n CL = 5e-12\n RL =...

Msagent fine-tune datasets formatting

> 这个我觉得是无所谓的，只要训练、推理的格式一致即可。因此，可以根据lagent框架代码解释器返回的格式，来构造训练数据 > > > 有一个新问题，system中，如果是python解释器运行的结果返回的结构和内容是怎么样的，有点不太懂这里要怎么写这样写对吗 > > ``` > > { > > "conversation": [ > > { > > "system": "你是一个可以调用外部工具的助手...", > > "input": "设计一个满足特定要求的NMOSFET单管放大器...", > > "output":...

Msagent fine-tune datasets formatting

试了一下，会输出这种东西 ``` response = chatbot.chat('帮我实现100以内的奇数求和') print(response.response) print(response.inner_steps) ``` ``` [ {'role': 'user', 'content': '帮我实现100以内的奇数求和'}, {'role': 'assistant', 'content': 'Thought: 这是一道计算题，需要用计算器Calculator计算一下100以内的奇数求和\nAction: PythonExecutor\nAction Input: def solution():\n answer = 1+3+5+7+9+11+13+15+17+19+21+23+25+27+29+31+33+35+37+39+41+43+45+47+49\n return answer'}, {'role': 'system',...

Msagent fine-tune datasets formatting

``` from lagent.agents import ReAct from lagent.actions import ActionExecutor, GoogleSearch, PythonInterpreter from lagent.llms import HFTransformer # Initialize the HFTransformer-based Language Model (llm) and provide the model name. llm = HFTransformer('/public/home/lvshuhang/model_space/workspace/internlm_internlm-chat-7b')...

大家运行时间是多久呢？

做一个Epoch出来花了三个多小时 Epoch [1/3] /media/hang/1ba83754-8a9c-4989-9cf0-48bf763358da/hang/Bert-Chinese-Text-Classification-Pytorch/pytorch_pretrained/optimization.py:275: UserWarning: This overload of add_ is deprecated: add_(Number alpha, Tensor other) Consider using one of the following signatures instead: add_(Tensor other, *, Number alpha) (Triggered internally...

大家运行时间是多久呢？

你gpu是什么型号啊，我的是RTX2070，但是我不知道怎么配置然后加速，用gpu是不是快一点呀，我就直接运行了，没改配置文件，你怎么配的配置文件可以给我看看吗

大家运行时间是多久呢？

> 我试一下吧，还没用过kaggle运行，有什么要注意的吗（坑），我是在ubuntu上自己配的环境跑的