caoyutingtjpu

Results 2 issues of caoyutingtjpu

## Description 一组三主三从的cluster集群,集群单个分片存储数据约为20G。在从库执行cluster failover [force|takeover],主动故障转移会失败。 1)调大lockdbxwaittimeout参数,比如500,会切换成功,这个参数是跟数据存储量有关吗? 2)如果数据不到G级别,默认参数可以切换成功 3)即使调大lockdbxwaittimeout参数,在主从没有offset延迟情况下,整个切换时间是达到5min ## Expected Behavior 主动故障转移快速切换成功 ## Current Behavior 主动故障转移失败,提示Manual failover timed out ## Possible Solution 增大lockdbxwaittimeout该参数,会切换成功 ## Steps to Reproduce (for bugs) ##...

使用官方示例 transformers做serving,显存40G,循环调用,A100 40G显存直接打满,如果不重启,这部分显存不释放 ``` from FlagEmbedding import FlagModel sentences_1 = ["样例数据-1", "样例数据-2"] sentences_2 = ["样例数据-3", "样例数据-4"] model = FlagModel('BAAI/bge-large-zh-v1.5', query_instruction_for_retrieval="为这个句子生成表示以用于检索相关文章:", use_fp16=True) # Setting use_fp16 to True speeds up computation with...