lzfhust
lzfhust
**Is your feature request related to a problem? (你需要的功能是否与某个问题有关?)** 当前brpc对thrift协议,仅支持单个参数。thrift协议的多参数形式应用广泛,国内一些公司内部也在使用。希望brpc官方也能支持多参数 **Describe the solution you'd like (描述你期望的解决方法)** brpc同时支持单参数、多参数 **Describe alternatives you've considered (描述你想到的折衷方案)** **Additional context/screenshots (更多上下文/截图)** 1). 通过 xxx_args来实现多参数: 1.1. client:...
### What did you do? 1. we are running prometheus with victoriametrics as the remote storage. At the same time, prometheus runs with the local tsdb. Now, we are trying...
### Describe the bug We are using vmagent to scrape metrics. When delete the existing kubernetes clusters from kubernetes_sd_configs, OOM happened and vmagent had been killed. The number of targets...
**Is your feature request related to a problem? (你需要的功能是否与某个问题有关?)** 线上C++应用基于brpc开发,使用的是jemalloc(不是tcmalloc);在发生内存泄露的时候,希望有工具辅助排查内存泄露点 **Describe the solution you'd like (描述你期望的解决方法)** brpc支持jemalloc下的内存profiling;支持线上开启,使用 **Describe alternatives you've considered (描述你想到的折衷方案)** **Additional context/screenshots (更多上下文/截图)**
我们在我们的训练任务中尝试测试集成xpu timer,来统计矩阵乘和NCCL的指标。现在发现,在LD_PRELOAD之后,会导致训练时间加长,大概时间延迟7%左右。 训练环境: 2Node,每个Node是8张H20的卡。 训练框架:LlamaFactory nccl版本:NCCL_2.21.5 cuda版本:12.4 想咨询下:这是符合预期的吗,还是有什么特殊的配置或者设定需要注意?