Feed with illegal characters that produce filesystem errors on NTFS
Before creating a bug report please make sure you are using the latest docker image / code base.
Please complete the following information
- Installation Type: Docker/Portainer
- Have you tried using the latest docker image / code base: yes
Describe the bug I have :latest Podgrab in Docker on a x64 server. I've set Podgrab to download the last 5 episodes of all podcasts. This one https://anchor.fm/s/2401fb20/podcast/rss downloads .m4a files that for some reason corrupt NTFS filesystem. For at least twice I had to chkdsk /f to fix the HDD and each time the debris in ./found.000 folder were those and only those files. I have that same podcast on EMBY on the same machine and on MusicBee on another: none of them produces any error. The HDD is a very new WD Elements 16Tb attached to server via USB, works fine with everything else: EMBY, Kavita, Calibre, Duplicati, etc. For some reason it seems that those filename trigger some irregular write on NTFS.
To Reproduce Steps to reproduce the behavior:
- Add this podcast https://anchor.fm/s/2401fb20/podcast/rss
- Set Podgrab to download the latest 5 episodes as of April 22nd 2022 to NTFS volume
- SMB shares will become sluggy to access from Windows 10
- Turn off server/unmount NTFS HDD
- Connect HDD to Windows machine
- Check filesystem -> it will find errors related to illegal characters in those 5 episodes
Expected behavior Everything should work fine with no filesystem error.
Screenshots This is in italian, but basically at Fase 2 it says filename of that episode is not valid and will be eliminated.
CHKDSK eseguito in modalità lettura/scrittura.
Controllo in corso del file system su P: Il file system è di tipo NTFS. L'etichetta del volume è WD16TB.
Fase 1: analisi della struttura del file system di base in corso... 4188928 record file elaborati. Verifica file completata. Durata fase (Verifica record di file): 1.08 minuti. 2366 record di file di grandi dimensioni elaborati. Durata fase (Recupero record di file orfani): 0.00 millisecondi. 0 record file non validi elaborati. Durata fase (Controllo record di file non validi): 0.03 millisecondi.
Fase 2: analisi del collegamento dei nomi file in corso...
Nome file Il podcast di Piergiorgio Odifreddi- Lezioni e Conferenze- (10D4C7) non valido eliminato nella directory C6B20. L'attributo del nome file NTFS nel file 0x10d4c7 non è corretto. 49 00 6c 00 20 00 70 00 6f 00 64 00 63 00 61 00 I.l. .p.o.d.c.a. 73 00 74 00 20 00 64 00 69 00 20 00 50 00 69 00 s.t. .d.i. .P.i. 65 00 72 00 67 00 69 00 6f 00 72 00 67 00 69 00 e.r.g.i.o.r.g.i. 6f 00 20 00 4f 00 64 00 69 00 66 00 72 00 65 00 o. .O.d.i.f.r.e. 64 00 64 00 69 00 2d 00 20 00 4c 00 65 00 7a 00 d.d.i.-. .L.e.z. 69 00 6f 00 6e 00 69 00 20 00 65 00 20 00 43 00 i.o.n.i. .e. .C. 6f 00 6e 00 66 00 65 00 72 00 65 00 6e 00 7a 00 o.n.f.e.r.e.n.z. 65 00 2d 00 0a 00 ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? e.-............. Il file 10D4C7 è stato reso orfano. Tutti i nomi file risultano non validi e il file verrà ripristinato in fase di recupero orfani. Correzione di errori di nome file non gravi nel file 10D4C7. 6 record reparse elaborati. Impossibile individuare l'attributo nome file della voce Il podcast di Piergiorgio Odifreddi- Lezioni e Conferenze-
dell'indice $I30 con padre 0xc6b20 nel file 0x10d4c7.
Eliminazione della voce di indice Il podcast di Piergiorgio Odifreddi- Lezioni e Conferenze- nell'indice $I30 del file C6B20. 4370288 voci di indice elaborate. Verifica indici completata. Durata fase (Verifica dell'indice): 6.71 minuti. CHKDSK: è in corso l'analisi di file non indicizzati per la riconnessione alla relativa directory originale. 1 file non indicizzati analizzati. 0 file non indicizzati ripristinati nella directory originale.
Durata fase (Riconnessione orfano): 0.00 millisecondi. CHKDSK: è in corso il ripristino dei file non indicizzati rimanenti. 1 file non indicizzati ripristinati nella cartella dei file persi e ritrovati. La cartella dei file persi e ritrovati è disponibile in \found.000
Durata fase (Ripristino orfano nella cartella dei file persi e ritrovati): 0.00 millisecondi. 6 record reparse elaborati. Durata fase (Verifica reparse point e ID oggetto): 24.06 millisecondi.
Fase 3: analisi dei descrittori di sicurezza in corso... Verifica descrittori di sicurezza completata. Durata fase (Verifica descrittori di sicurezza): 30.83 millisecondi. 90681 file di dati elaborati. Durata fase (Verifica attributi dati): 0.12 millisecondi. CHKDSK sta verificando il journal USN... Verifica del journal USN completata. Correzione degli errori nell'attributo BITMAP della Tabella file master (MFT).
Correzioni apportate al file system. Non sono necessarie ulteriori azioni.
15259597 MB di spazio totale su disco. 12973159 MB in 1056731 file. 375796 KB in 90683 indici. 0 KB in settori danneggiati. 4740543 KB in uso dal sistema. 65536 KB occupati dal file registro. 2281442 MB disponibili su disco.
4096 byte in ogni unità di allocazione.
3906457087 unità totali di allocazione su disco. 584049217 unità di allocazione disponibili su disco. Durata totale: 8.06 minuti (483883 ms).
Additional context Add any other context about the problem here.