晓空

Results 47 comments of 晓空

![image](https://github.com/cinit/WSAPatch/assets/29683578/b17866b9-48ee-472f-b711-ca602d0b3d56) 好的,目前我对ADB也进行了测试,目前一切正常,并且也能够从magisk获取到root权限

![image](https://user-images.githubusercontent.com/29683578/221095951-35b83767-2367-45e9-9d97-40c395a9ddff.png) 这是完整的报错信息,由于远程桌面复制文本会丢失格式,不知道是什么情况,所以就直接截图了 如果无法看到图片,以下是原始文本内容 ``` START: /content/whisper-vits-japanese/filelists/train_filelist.txt WARNING: JPCommonLabel_make() in jcomon_label.c: No phoneme. WARNING: JPCommonLabel_make() in jcomon_label.c: No phoneme. WARNING: JPCommonLabel_push_word() in jpcommon_label.c: First mora should not be long vowel symbol....

> 你好你好!这个是属于提示而不是报错,不会影响程序运行和后续训练。这种现象是因为whisper可以指定语种,但是无法锁定语种。如果日语语音中出现了英语/汉语的话,whisper仍然会识别出这些语种,这些单词因为不是日语单词,在预处理阶段没法被标注上语调/节律mora,所以会出现提示。 感谢解答 也就是说我接着往下跑就行了对吧,另外我想问一下推断应该是在何时进行的呢?按照我的理解似乎是在完成上面一步训练了之后再进行推断,然后如果对模型后续再进行了训练的话推断还是要重新进行的,是这样吗? 最后补充一下,其实我还没有去试能不能接着往下炼,今天colab似乎不肯让我连GPU后端了(x

> 是的 继续跑就行,不会影响后续的操作。推断一般是等到200/300epoch之后,暂停掉训练部分然后运行推断,推断完后回去点击训练部分还可以继续训练。着急的话100epoch后就可以停下训练,推断体验一下 感谢,之后我会去试试的

> 是的 继续跑就行,不会影响后续的操作。推断一般是等到200/300epoch之后,暂停掉训练部分然后运行推断,推断完后回去点击训练部分还可以继续训练。着急的话100epoch后就可以停下训练,推断体验一下 因为之前的训练集没有保存完整,所以我花了一些时间去重新跑了一次whisper 但是训练的时候似乎出现了一些其他的状况,并没有像您说的一样正常跑下去,稍后我会把log贴上来,希望您可以帮我看一下怎么回事

``` [INFO] {'train': {'log_interval': 200, 'eval_interval': 1000, 'seed': 1234, 'epochs': 800, 'learning_rate': 0.0002, 'betas': [0.8, 0.99], 'eps': 1e-09, 'batch_size': 24, 'fp16_run': True, 'lr_decay': 0.999875, 'segment_size': 8192, 'init_lr_ratio': 1, 'warmup_epochs': 0,...

> 您好,这是因为音频采样深度不等于16bit,cofig里默认参数为2的15次方"max_wav_value": 32768.0 您可以选择:A. 批量修改采样深度为16bit 或者是 B.按照音频的采样深度将"max_wav_value"改为2的n-1次方 感谢您的解答,不过我有个地方还是没有理解您的意思 请问B方案的n是指采样深度的比特数吗?我用计算器算了一下,以16bit为例,2^15刚好为32768 因为考虑到国内从谷歌网盘取回这么大规模的文件确实比价困难,所以我考虑先尝试一下方案B 要是不行的话我就去用海外的windows服务器直接跑格式工厂做转换吧,总之感谢您的帮助了

您好,不过好像出现了一些意料之外的状况 我将colab的运行时切换到了None状态,然后利用python执行了以下代码 ``` # 查看采样深度 import wave with wave.open('/content/drive/MyDrive/sliced_audio/$2$min0618 #15328_0.wav', 'rb') as f: print(f.getsampwidth() * 8) # 采样深度(单位:位) with wave.open('/content/drive/MyDrive/sliced_audio/$2$min0658_0.wav', 'rb') as f: print(f.getsampwidth() * 8) # 采样深度(单位:位) with wave.open('/content/drive/MyDrive/sliced_audio/$2$min0675_1.wav',...

这是我后面做了一些测试之后的补充 !file '/content/whisper-vits-japanese/audio/pm_a02_02_isl0093.wav' 这是您提供的White老师的原始数据集中的音频 /content/whisper-vits-japanese/audio/pm_a02_02_isl0093.wav: RIFF (little-endian) data, WAVE audio, Microsoft PCM, 16 bit, mono 22050 Hz !file '/content/drive/MyDrive/sliced_audio/$2$min0675_1.wav' 这个是我自己训练集中的音频内容 /content/drive/MyDrive/sliced_audio/$2$min0675_1.wav: RIFF (little-endian) data, WAVE audio, Microsoft PCM, 16 bit,...

您好,我在海外的服务器上挂了一个下午把文件取回来了 然后安装大小排序确实找到了一些不正常的wav文件(大小为1kb),大约有115个左右 然后还有一些2-30kb左右的文件,我在尝试找出所有时长为0的文件然后将他们分离出来 这是相关的信息 Input #0, wav, from 'C:\Users\用户名\Downloads\[test]\$4$min1411 #18074_0.wav': Duration: N/A, bitrate: 352 kb/s Stream #0:0: Audio: pcm_s16le ([1][0][0][0] / 0x0001), 22050 Hz, 1 channels, s16, 352 kb/s 可以看到时间为0,那么我想将他们删掉应该就可以正常训练了吧?