SimCSE issues

关于准确率和F1值的一些困惑

1

![image](https://github.com/bojone/SimCSE/assets/31085549/b18028bc-b9a7-4939-85c9-03a250ff641f) 我在您的代码上训练了lcqmc数据集，这是我得到的准确率和F1，您看这个值是否正常（我觉得太低了些）

hfy-only

tensorflow.python.framework.errors_impl.InternalError: Blas xGEMMBatched launch failed : a.shape=[1536,64,64], b.shape=[1536,64,64], m=64, n=64, k=64, batch_size=1536

为啥报这个错误呢？请问下要跑这个模型需要多大的资源呢？

yqstar

同一个batch中相同的句子一起输入模型，在这一次正向传播中 dropout是一样的吧?

2

lihaixiang

你好，遇到了一个疑问，我用自己的中文数据在这个预训练中文模型上做了微调https://huggingface.co/cyclone/simcse-chinese-roberta-wwm-ext，用于生成不同句子的向量，计算其相似度来做匹配。实际应用发现，当两个句子仅有靠前位置的词语不同时，得到的向量差异较大，相似度较低。但当两个句子仅有中间/靠后位置词语不同时，得到的向量一致，相似度为1。不知道这种情况是本质上是什么原因导致的呢，大佬们有没有遇到这种问题，以及我该如何做一些调整呢？

XingyuZhu-Pamela

使用 tf.keras 训练报错

1

通过设置 TF_KERAS==1 , 切换至 tf.keras. 启动训练脚本后可正常编译模型, 但训练时报错. 报错信息如下: `Traceback (most recent call last): File "train.py", line 94, in train_generator.forfit(), steps_per_epoch=len(train_generator), epochs=1 File "/Users/yuxi/opt/anaconda3/envs/TrainingRobot/lib/python3.7/site-packages/tensorflow_core/python/keras/engine/training.py", line 728, in fit use_multiprocessing=use_multiprocessing) File "/Users/yuxi/opt/anaconda3/envs/TrainingRobot/lib/python3.7/site-packages/tensorflow_core/python/keras/engine/training_v2.py",...

Dcyx

评测相关系数的疑惑

all_corrcoefs = [] for (a_vecs, b_vecs), labels in zip(all_vecs, all_labels): a_vecs = l2_normalize(a_vecs) b_vecs = l2_normalize(b_vecs) sims = (a_vecs * b_vecs).sum(axis=1) corrcoef = compute_corrcoef(labels, sims) all_corrcoefs.append(corrcoef) sims和labels都是维度为1的一维向量。方差为0，为什么可以求相关系数? 是我理解错了吗

MingFL

The pooling method for SIMCSE is not linear but tanh

Hi, This maybe the reason why you get worse result. You can refer the source code of transformers [BertPooler](https://github.com/huggingface/transformers/blob/1c191efc3abc391072ff0094a8108459bc08e3fa/src/transformers/models/bert/modeling_bert.py#L624)

world2vec

batch_labels = np.zeros_like(batch_token_ids[:, :1]) ；batch_labels都为0，那batch_token_ids和dropout的batch_token_ids的相似度矩阵y_pred不应该为1吗

4

lonngxiang

有关MLM+CL做无监督训练的问题

请问在做MLM+CL无监督训练的时候是直接用随机mask掉之后的句子做dropout计算CLloss吗？，例如，先对句子A=[a,b,c,d,e,f]做随机MASK得到B=[a,[MASK],c,[MASK],e,f], 再把句子B两次输入到bert模型中得到dropout之后的两个句子对，然后计算得到CL loss和MLM loss 请问我说的对么？

joczu

simcse loss的一些疑惑

已解决

liujingqiao

SimCSE
SimCSE copied to clipboard

Metadata

关于准确率和F1值的一些困惑

tensorflow.python.framework.errors_impl.InternalError: Blas xGEMMBatched launch failed : a.shape=[1536,64,64], b.shape=[1536,64,64], m=64, n=64, k=64, batch_size=1536

同一个batch中相同的句子一起输入模型，在这一次正向传播中 dropout是一样的吧?

词语位置对句子向量的影响

使用 tf.keras 训练报错

评测相关系数的疑惑

The pooling method for SIMCSE is not linear but tanh

batch_labels = np.zeros_like(batch_token_ids[:, :1]) ；batch_labels都为0，那batch_token_ids和dropout的batch_token_ids的相似度矩阵y_pred不应该为1吗

有关MLM+CL做无监督训练的问题

simcse loss的一些疑惑

← Metadata

Owner

Metadata

SimCSE SimCSE copied to clipboard

Metadata

← Metadata

Owner

Metadata

SimCSE
SimCSE copied to clipboard