3. 데이터 전처리 — PseudoLab Tutorial Book

https://pseudo-lab.github.io/Tutorial-Book/chapters/object-detection/Ch3-preprocessing.html

Nov 13 '22 05:11 utterances-bot

너무 재미있게 보고있습니다.

np.array(sorted(os.listdir('images')))

왜 np.ndarray로 타입변환을 하나요?

Nov 13 '22 05:11 brotherhoon-code

현재 코랩 환경에서는 버전문제로 albumentations.pytorch.ToTensor() 대신 albumentations.pytorch.ToTensorV2()를 사용해야 되는 것 같습니다.

Jun 27 '23 13:06 jocody98

안녕하세요! 너무 큰 도움이 되고있습니다. 글을 보는 와중에 궁금한 점이 생겼는데, Augmentation을 수행했는데 왜 data수가 늘어나지않고 그대로인지 궁금합니다! 맨 마지막 코드를 보면 train data 갯수 683, test data 갯수 170으로 원본과 똑같이 나와서요.

Jan 26 '24 02:01 HyeonseopLim

메일을 잘못보내신 거 같아요ㅎㅎ

2024년 1월 26일 (금) 오전 11:30, train0402 @.***>님이 작성:

안녕하세요! 너무 큰 도움이 되고있습니다. 글을 보는 와중에 궁금한 점이 생겼는데, Augmentation을 수행했는데 왜 data수가 늘어나지않고 그대로인지 궁금합니다! 맨 마지막 코드를 보면 train data 갯수 683, test data 갯수 170으로 원본과 똑같이 나와서요.

— Reply to this email directly, view it on GitHub https://github.com/Pseudo-Lab/Tutorial-Book/issues/107#issuecomment-1911313353, or unsubscribe https://github.com/notifications/unsubscribe-auth/BA33BC42NNGOWTNKAKYVFSDYQMILJAVCNFSM6AAAAAAR6U3RUKVHI2DSMVQWIX3LMV43OSLTON2WKQ3PNVWWK3TUHMYTSMJRGMYTGMZVGM . You are receiving this because you commented.Message ID: @.***>

Jan 26 '24 03:01 jocody98

아니예요! https://pseudo-lab.github.io/Tutorial-Book/chapters/object-detection/Ch3-preprocessing.html 이 사이트에서 질문했거든요.

Jan 29 '24 04:01 HyeonseopLim

아 저는 저 페이지에서 댓글만 작성한 사람입니다. 코랩 환경에서 버전문제로 ToTensor() 대신 ToTensorV2()를 사용해야 될것 같다는 댓글이요. 근데 질문하신거 보니까 저거 아마 증강한 데이터를 추가하는게 아니라 기존의 모든 데이터 각각에 transform을 적용한 거라 데이터 크기 차이가 없는 것 같네요.

2024년 1월 29일 (월) 오후 1:35, train0402 @.***>님이 작성:

아니예요!

https://pseudo-lab.github.io/Tutorial-Book/chapters/object-detection/Ch3-preprocessing.html 이 사이트에서 질문했거든요.

— Reply to this email directly, view it on GitHub https://github.com/Pseudo-Lab/Tutorial-Book/issues/107#issuecomment-1913945610, or unsubscribe https://github.com/notifications/unsubscribe-auth/BA33BCZIZLC3IDACWRMGP6TYQ4RHLAVCNFSM6AAAAAAR6U3RUKVHI2DSMVQWIX3LMV43OSLTON2WKQ3PNVWWK3TUHMYTSMJTHE2DKNRRGA . You are receiving this because you commented.Message ID: @.***>

Jan 29 '24 05:01 jocody98

네 답변 감사합니다! 며칠 전에 확인해보니까 추가하는게 아니라 원본 데이터 자체를 augmentation하는거더라구요. 근데 여기 글을 남기면 자동으로 이메일이 가는거같아요.

혹시 죄송한데 추가로 질문 하나만 더 해도 될까요? 모델 학습하는 과정에서 여기 코드 그대로 faster-R-CNN에 학습시키려고 봤는데 여기 코드에서는 augmentaion하는 Compose 함수가 공백이라 제가 almumentation 을 사용하여 넣어줬는데 device에 텐서가 안들어가네요. 리스트는 텐서에 넣을 수 없다고 나오면서요. 그래서 리스트 안에 있는 개별 원소를 모두 텐서로 만들어서 넣었는데도 에러가 떠요. 혹시 무슨 문제인지 아세요?

Jan 29 '24 05:01 HyeonseopLim

댓글을 쓰면 메일이 자동으로 보내지는 군요. 버전문제로 ToTensor()대신 albumentations.pytorch.ToTensorV2()를 사용해야하는 문제 아닌가 싶은데 아니라면 잘 모르겠네요.

2024년 1월 29일 (월) 오후 2:36, train0402 @.***>님이 작성:

네 답변 감사합니다! 며칠 전에 확인해보니까 추가하는게 아니라 원본 데이터 자체를 augmentation하는거더라구요. 근데 여기 글을 남기면 자동으로 이메일이 가는거같아요.

혹시 죄송한데 추가로 질문 하나만 더 해도 될까요? 모델 학습하는 과정에서 여기 코드 그대로 faster-R-CNN에 학습시키려고 봤는데 여기 코드에서는 augmentaion하는 Compose 함수가 공백이라 제가 almumentation 을 사용하여 넣어줬는데 device에 텐서가 안들어가네요. 리스트는 텐서에 넣을 수 없다고 나오면서요. 그래서 리스트 안에 있는 개별 원소를 모두 텐서로 만들어서 넣었는데도 에러가 떠요. 혹시 무슨 문제인지 아세요?

— Reply to this email directly, view it on GitHub https://github.com/Pseudo-Lab/Tutorial-Book/issues/107#issuecomment-1913994859, or unsubscribe https://github.com/notifications/unsubscribe-auth/BA33BC4UKC6DOLZHMM3KR6LYQ4YNBAVCNFSM6AAAAAAR6U3RUKVHI2DSMVQWIX3LMV43OSLTON2WKQ3PNVWWK3TUHMYTSMJTHE4TIOBVHE . You are receiving this because you commented.Message ID: @.***>

Jan 29 '24 05:01 jocody98

넵 답변 감사드립니다! 한 번 더 살펴볼게요.

Jan 29 '24 07:01 HyeonseopLim

해결했습니다! albumentations.pytorch.ToTensorV2() 이 함수가 image만 tensor로 바꿔주는거더라구요. annotation를 generate_labels()함수에서 tensor 변환을 해줬는데 막상 train부분에서 print 찍어보면 tensor로 안바껴져있길래 한참 헤맸어요. 아직 왜 tensor가 풀리는지는 모르겠지만 tranformed['boxex']를 torch.tensor(tranformed['boxex'], dtype=float32) 로 바꾸니까 됐네요.

Jan 29 '24 09:01 HyeonseopLim