晓空 comments

Results 47 comments of


                                            晓空

能够成功安装，但是尝试启动子系统会在没有报错的情况下闪退

![image](https://github.com/cinit/WSAPatch/assets/29683578/b17866b9-48ee-472f-b711-ca602d0b3d56) 好的，目前我对ADB也进行了测试，目前一切正常，并且也能够从magisk获取到root权限

【需要帮助】WARNING: JPCommonLabel_make() in jcomon_label.c: No phoneme.

![image](https://user-images.githubusercontent.com/29683578/221095951-35b83767-2367-45e9-9d97-40c395a9ddff.png) 这是完整的报错信息，由于远程桌面复制文本会丢失格式，不知道是什么情况，所以就直接截图了如果无法看到图片，以下是原始文本内容 ``` START: /content/whisper-vits-japanese/filelists/train_filelist.txt WARNING: JPCommonLabel_make() in jcomon_label.c: No phoneme. WARNING: JPCommonLabel_make() in jcomon_label.c: No phoneme. WARNING: JPCommonLabel_push_word() in jpcommon_label.c: First mora should not be long vowel symbol....

【需要帮助】WARNING: JPCommonLabel_make() in jcomon_label.c: No phoneme.

> 你好你好！这个是属于提示而不是报错，不会影响程序运行和后续训练。这种现象是因为whisper可以指定语种，但是无法锁定语种。如果日语语音中出现了英语/汉语的话，whisper仍然会识别出这些语种，这些单词因为不是日语单词，在预处理阶段没法被标注上语调/节律mora，所以会出现提示。感谢解答也就是说我接着往下跑就行了对吧，另外我想问一下推断应该是在何时进行的呢？按照我的理解似乎是在完成上面一步训练了之后再进行推断，然后如果对模型后续再进行了训练的话推断还是要重新进行的，是这样吗？最后补充一下，其实我还没有去试能不能接着往下炼，今天colab似乎不肯让我连GPU后端了(x

【需要帮助】WARNING: JPCommonLabel_make() in jcomon_label.c: No phoneme.

> 是的继续跑就行，不会影响后续的操作。推断一般是等到200/300epoch之后，暂停掉训练部分然后运行推断，推断完后回去点击训练部分还可以继续训练。着急的话100epoch后就可以停下训练，推断体验一下感谢，之后我会去试试的

【需要帮助】WARNING: JPCommonLabel_make() in jcomon_label.c: No phoneme.

> 是的继续跑就行，不会影响后续的操作。推断一般是等到200/300epoch之后，暂停掉训练部分然后运行推断，推断完后回去点击训练部分还可以继续训练。着急的话100epoch后就可以停下训练，推断体验一下因为之前的训练集没有保存完整，所以我花了一些时间去重新跑了一次whisper 但是训练的时候似乎出现了一些其他的状况，并没有像您说的一样正常跑下去，稍后我会把log贴上来，希望您可以帮我看一下怎么回事

【需要帮助】WARNING: JPCommonLabel_make() in jcomon_label.c: No phoneme.

``` [INFO] {'train': {'log_interval': 200, 'eval_interval': 1000, 'seed': 1234, 'epochs': 800, 'learning_rate': 0.0002, 'betas': [0.8, 0.99], 'eps': 1e-09, 'batch_size': 24, 'fp16_run': True, 'lr_decay': 0.999875, 'segment_size': 8192, 'init_lr_ratio': 1, 'warmup_epochs': 0,...

【需要帮助】WARNING: JPCommonLabel_make() in jcomon_label.c: No phoneme.

> 您好，这是因为音频采样深度不等于16bit，cofig里默认参数为2的15次方"max_wav_value": 32768.0 您可以选择：A. 批量修改采样深度为16bit 或者是 B.按照音频的采样深度将"max_wav_value"改为2的n-1次方感谢您的解答，不过我有个地方还是没有理解您的意思请问B方案的n是指采样深度的比特数吗？我用计算器算了一下，以16bit为例，2^15刚好为32768 因为考虑到国内从谷歌网盘取回这么大规模的文件确实比价困难，所以我考虑先尝试一下方案B 要是不行的话我就去用海外的windows服务器直接跑格式工厂做转换吧，总之感谢您的帮助了

【需要帮助】WARNING: JPCommonLabel_make() in jcomon_label.c: No phoneme.

您好，不过好像出现了一些意料之外的状况我将colab的运行时切换到了None状态，然后利用python执行了以下代码 ``` # 查看采样深度 import wave with wave.open('/content/drive/MyDrive/sliced_audio/$2$min0618 #15328_0.wav', 'rb') as f: print(f.getsampwidth() * 8) # 采样深度（单位：位） with wave.open('/content/drive/MyDrive/sliced_audio/$2$min0658_0.wav', 'rb') as f: print(f.getsampwidth() * 8) # 采样深度（单位：位） with wave.open('/content/drive/MyDrive/sliced_audio/$2$min0675_1.wav',...

【需要帮助】WARNING: JPCommonLabel_make() in jcomon_label.c: No phoneme.

这是我后面做了一些测试之后的补充 !file '/content/whisper-vits-japanese/audio/pm_a02_02_isl0093.wav' 这是您提供的White老师的原始数据集中的音频 /content/whisper-vits-japanese/audio/pm_a02_02_isl0093.wav: RIFF (little-endian) data, WAVE audio, Microsoft PCM, 16 bit, mono 22050 Hz !file '/content/drive/MyDrive/sliced_audio/$2$min0675_1.wav' 这个是我自己训练集中的音频内容 /content/drive/MyDrive/sliced_audio/$2$min0675_1.wav: RIFF (little-endian) data, WAVE audio, Microsoft PCM, 16 bit,...

【需要帮助】WARNING: JPCommonLabel_make() in jcomon_label.c: No phoneme.

您好，我在海外的服务器上挂了一个下午把文件取回来了然后安装大小排序确实找到了一些不正常的wav文件（大小为1kb），大约有115个左右然后还有一些2-30kb左右的文件，我在尝试找出所有时长为0的文件然后将他们分离出来这是相关的信息 Input #0, wav, from 'C:\Users\用户名\Downloads\[test]\$4$min1411 #18074_0.wav': Duration: N/A, bitrate: 352 kb/s Stream #0:0: Audio: pcm_s16le ([1][0][0][0] / 0x0001), 22050 Hz, 1 channels, s16, 352 kb/s 可以看到时间为0，那么我想将他们删掉应该就可以正常训练了吧？