xjk
Results
1
comments of
xjk
> @ > > > 首先你需要弄清楚 letta 能不能支持接入一个自定义的自己部署的 vllm。RL 的核心是要搞到 prompt-response pairs,response 指的是 LLM 生成的 tokens。如果是自己部署的 vllm,就都还有希望,兜底你可以 hack vllm 把 token 拿出来。如果不是自己部署的,那就要看 letta 有没有提供在线的可以追踪 token 记录的服务了。 > > > 看样子如果我想强化学习letta的agent,就需要把letta的agent按上面的格式进行一下重构,首先模型文件用vllm部署成llm服务,提供endpoint,然后单独提供mcp_servers,是吗?...