Skip to content

Conversation

@shaynekang
Copy link
Collaborator

@shaynekang shaynekang commented Oct 14, 2016

이전까지는 주소(Address) 컬럼을 사용하지 않았는데, 이번에 새로 적용해보았습니다.

One Hot Encoding을 쓰는게 가장 적합하다고 생각하였고, 메모리 효율과 Ovefitting을 방지하기 위해, 너무 갯수가 적은 주소값은 'Other'라는 값으로 합쳤습니다. (스크립트에서는 200개 이하를 'Other'로 치환)

적용 결과 CV Score는 2.506260-0.055880 상승하였고, Public LB Score는 2.48252로 (아마도?) 상승하였습니다. 다른 PR과 합쳐서 사용한다면 더 좋은 결과가 나올 것으로 예상합니다!

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

2 participants